Image

SpikingBrain Все привыкли, что современные нейронки это прожорливые цифровые монстры….

SpikingBrain

Все привыкли, что современные нейронки это прожорливые цифровые монстры. Чтобы обучить одну, нужно спалить годовой бюджет маленькой страны на электричество. А стоит загрузить ей что-то длиннее короткой инструкции, она тут же теряется и тупит.

Китайские братушки придумали как это непотребство побороть. Идея проста: зачем заставлять всю систему работать на 100% мощности 24/7, если можно просто… не заставлять? Человеческий мозг работает по принципу "нет задачи — я сплю". Нейроны стреляют импульсами ("спайками") только по делу. SpikingBrain делает то же самое: вместо постоянного гула вычислений используются короткие "выстрелы" там, где реально нужно.

Результаты, вроде как, хорошие:

Обучение на минималках. Модель натаскали всего на ~2% от данных, которые нужны привычным нам трансформерам.

Скорость. В тестах на длинный текст (до 4 млн токенов) SpikingBrain оказался в 100 раз быстрее.

Энергоэффективность. Экономия по сравнению с обычными методами — до 70%.

Но как обычно, не без ложки дёгтя:

— Самая быстрая и экономная версия (SpikingBrain-7B) работает почти на уровне обычной модели, но всё же теряет в качестве. Хороший "хорошист", но не отличник.
— Чтобы дотянуться до топ-результатов, пришлось собрать гибрид из линейного, локального и обычного внимания, да ещё нашпиговать все это Mixture-of-Experts. Так появился монстр SpikingBrain-76B. Он умнее, но куда сложнее и прожорливее.
— И вообще, пока это экспериментальная технология: вся магия со "спайками" по-настоящему раскроется только на специальных чипах, которых у нас пока нет.

Есть шанс, что на фоне дефицита энергии и подорожания железа именно такие подходы и выживут. Не дата-центры размером с город, а модели, которые учатся экономить. И тогда ИИ наконец перестанет делать вид, что он умнее мозга, и начнёт хотя бы его копировать. А там и до AGI недалеко: сначала модельки научатся «лениться правильно», а потом и думать осмысленно.

тут статья
тут гитхаб

file 642
✅ Найденные теги: SpikingBrain, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.
ideipro logotyp
Отражение деревьев в воде озера, спокойная гладь.
ideipro logotyp
Цифровой компонент на фоне блокчейн-технологии и сетевых данных.
Пирамида факторов риска, симптомов и локаций для тропических заболеваний.
Улучшение моделей работы мозга с помощью ZAPBench
ideipro logotyp
Программирование в стиле Vibe с чрезмерно усердным ИИ: уроки, извлеченные из использования Google AI Studio как инструмента командной работы.
Image Not Found
Текст на изображении: "Программисты всё?" на черном фоне.

💻 Программисты исчезнут к концу 2026 года — их заменят…

💻 Программисты исчезнут к концу 2026 года — их заменят продакты с навыками вайбкодинга Такой прогноз дал Борис Черный, главный архитектор…

Мар 4, 2026
ideipro logotyp

🧠 Загляни внутрь ChatGPT: интерактивный сайт показывает, как модель думает…

🧠 Загляни внутрь ChatGPT: интерактивный сайт показывает, как модель думает Нашли визуализацию, которая раскладывает по полочкам всю…

Мар 4, 2026
Диаграмма базы данных для клона Slack с таблицами пользователей, сообщений и каналов.

🗄 Database Build — генератор баз данных из одного текстового…

🗄 Database Build — генератор баз данных из одного текстового запроса Вышел инструмент, который превращает обычный промпт в готовую базу…

Мар 4, 2026
ideipro logotyp

📉 Нейросетям скоро станет нечего читать: данные для обучения ИИ…

📉 Нейросетям скоро станет нечего читать: данные для обучения ИИ подходят к концу Глава лаборатории T-Bank AI Research Даниил Гаврилов…

Мар 4, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых