Архив рубрики ~Коротко из Telegram~

SpikingBrain Все привыкли, что современные нейронки это прожорливые цифровые монстры….

SpikingBrain Все привыкли, что современные нейронки это прожорливые цифровые монстры….

SpikingBrain

Все привыкли, что современные нейронки это прожорливые цифровые монстры. Чтобы обучить одну, нужно спалить годовой бюджет маленькой страны на электричество. А стоит загрузить ей что-то длиннее короткой инструкции, она тут же теряется и тупит.

Китайские братушки придумали как это непотребство побороть. Идея проста: зачем заставлять всю систему работать на 100% мощности 24/7, если можно просто… не заставлять? Человеческий мозг работает по принципу «нет задачи — я сплю». Нейроны стреляют импульсами («спайками») только по делу. SpikingBrain делает то же самое: вместо постоянного гула вычислений используются короткие «выстрелы» там, где реально нужно.

Результаты, вроде как, хорошие:

Обучение на минималках. Модель натаскали всего на ~2% от данных, которые нужны привычным нам трансформерам.

Скорость. В тестах на длинный текст (до 4 млн токенов) SpikingBrain оказался в 100 раз быстрее.

Энергоэффективность. Экономия по сравнению с обычными методами — до 70%.

Но как обычно, не без ложки дёгтя:

— Самая быстрая и экономная версия (SpikingBrain-7B) работает почти на уровне обычной модели, но всё же теряет в качестве. Хороший «хорошист», но не отличник.
— Чтобы дотянуться до топ-результатов, пришлось собрать гибрид из линейного, локального и обычного внимания, да ещё нашпиговать все это Mixture-of-Experts. Так появился монстр SpikingBrain-76B. Он умнее, но куда сложнее и прожорливее.
— И вообще, пока это экспериментальная технология: вся магия со «спайками» по-настоящему раскроется только на специальных чипах, которых у нас пока нет.

Есть шанс, что на фоне дефицита энергии и подорожания железа именно такие подходы и выживут. Не дата-центры размером с город, а модели, которые учатся экономить. И тогда ИИ наконец перестанет делать вид, что он умнее мозга, и начнёт хотя бы его копировать. А там и до AGI недалеко: сначала модельки научатся «лениться правильно», а потом и думать осмысленно.

тут статья
тут гитхаб

file 534

✅ Найденные теги: SpikingBrain, новости
Читайте также
Архив рубрики ~Лента новостей~ Компания OpenAI конфиденциально подала заявку на первичное публичное размещение акций на фондовом рынке США. Архив рубрики ~Лента новостей~ Абрикосов. Пособие по ведению бизнеса в Российской империи Архив рубрики ~Лента новостей~ Скандалы со ставками на спорт разрывают студенческий футбол на части Архив рубрики ~Лента новостей~ Anthropic тихо выкатила workflows в Claude Code — и это может полностью изменить работу с ИИ-агентами Архив рубрики ~Лента новостей~ Как не отдать рецепт крабсбургера ИИ: Guardrails-фильтр против утечек данных Архив рубрики ~Лента новостей~ Редкого попугая с индонезийского острова Буру встретили впервые за 11 лет. Ради этого орнитологам пришлось подняться на высочайшую гору острова Архив рубрики ~Лента новостей~ Paramount обвиняет Netflix в «кампании выжженной земли» против слияния с WBD. Архив рубрики ~Обо всем~ Я протестировал множество настольных программ для работы с ИИ, но Hermes с Ollama — мой новый фаворит, и вот почему. Архив рубрики ~Лента новостей~ Pinterest делает ставку на создателей контента, интегрировав Amazon Storefront. Архив рубрики ~Обо всем~ Теперь пользователи Pinterest смогут совершать покупки напрямую в магазинах Amazon. Архив рубрики ~Обо всем~ Как рефакторить код с помощью Claude Code Архив рубрики ~Лента новостей~ 1 ноутбук, несколько секунд и 32 ГБ съеденной памяти: найдена уязвимость в протоколе, на котором работает половина интернета Архив рубрики ~Лента новостей~ AMD отказала в гарантийной замене Ryzen 9 7950X3D со вздутым текстолитом Архив рубрики ~Обо всем~ В следующем месяце Microsoft Office 2019 для Mac станет доступен только для чтения. Архив рубрики ~Лента новостей~ Компания OpenAI конфиденциально подала заявку на первичное публичное размещение акций на фондовом рынке США. Архив рубрики ~Лента новостей~ Абрикосов. Пособие по ведению бизнеса в Российской империи Архив рубрики ~Лента новостей~ Скандалы со ставками на спорт разрывают студенческий футбол на части Архив рубрики ~Лента новостей~ Anthropic тихо выкатила workflows в Claude Code — и это может полностью изменить работу с ИИ-агентами Архив рубрики ~Лента новостей~ Как не отдать рецепт крабсбургера ИИ: Guardrails-фильтр против утечек данных Архив рубрики ~Лента новостей~ Редкого попугая с индонезийского острова Буру встретили впервые за 11 лет. Ради этого орнитологам пришлось подняться на высочайшую гору острова Архив рубрики ~Лента новостей~ Paramount обвиняет Netflix в «кампании выжженной земли» против слияния с WBD. Архив рубрики ~Обо всем~ Я протестировал множество настольных программ для работы с ИИ, но Hermes с Ollama — мой новый фаворит, и вот почему. Архив рубрики ~Лента новостей~ Pinterest делает ставку на создателей контента, интегрировав Amazon Storefront. Архив рубрики ~Обо всем~ Теперь пользователи Pinterest смогут совершать покупки напрямую в магазинах Amazon. Архив рубрики ~Обо всем~ Как рефакторить код с помощью Claude Code Архив рубрики ~Лента новостей~ 1 ноутбук, несколько секунд и 32 ГБ съеденной памяти: найдена уязвимость в протоколе, на котором работает половина интернета Архив рубрики ~Лента новостей~ AMD отказала в гарантийной замене Ryzen 9 7950X3D со вздутым текстолитом Архив рубрики ~Обо всем~ В следующем месяце Microsoft Office 2019 для Mac станет доступен только для чтения.

Подписка на рассылку

Получайте свежие новости и идеи на почту. Без спама — только самое интересное.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.