
Учитывая, сколько денег вливается в стартапы в области ИИ, сейчас самое время стать исследователем ИИ, у которого есть идея для тестирования. И если идея достаточно оригинальна, вам может быть проще получить необходимые ресурсы, работая независимой компанией, а не в одной из крупных лабораторий.
Такова история Inception, стартапа, разрабатывающего модели искусственного интеллекта на основе диффузии, который только что привлек $50 млн посевного финансирования под руководством Menlo Ventures при участии Mayfield, Innovation Endeavors, фонда Microsoft M12, Snowflake Ventures, Databricks Investment и венчурного подразделения Nvidia NVentures. Эндрю Нг и Андрей Карпати предоставили дополнительное финансирование от бизнес-ангелов.
Руководителем проекта является профессор Стэнфордского университета Стефано Эрмон, чьи исследования сосредоточены на моделях диффузии, которые генерируют результаты посредством итеративного уточнения, а не пословного перевода. Эти модели лежат в основе систем ИИ на основе изображений, таких как Stable Diffusion, Midjourney и Sora. Работая над этими системами ещё до того, как бум ИИ сделал их столь интересными, Эрмон использует Inception для применения тех же моделей к более широкому спектру задач.
Вместе с финансированием компания выпустила новую версию своей модели Mercury, предназначенную для разработки программного обеспечения. Mercury уже интегрирована в ряд инструментов разработки, включая ProxyAI, Buildglare и Kilo Code. Что самое важное, по словам Эрмона, диффузионный подход поможет моделям Inception сэкономить по двум важнейшим показателям: задержке (времени отклика) и стоимости вычислений.
«Эти программы магистратуры магистратуры, основанные на диффузии, гораздо быстрее и эффективнее тех, что разрабатывают все остальные сегодня», — говорит Эрмон. «Это просто совершенно другой подход, который позволяет реализовать множество инноваций».
Для понимания технических различий требуется небольшая предварительная информация. Модели диффузии структурно отличаются от моделей авторегрессии, которые доминируют в текстовых ИИ-сервисах. Модели авторегрессии, такие как GPT-5 и Gemini, работают последовательно, предсказывая каждое следующее слово или фрагмент слова на основе ранее обработанного материала. Модели диффузии, обученные для генерации изображений, используют более целостный подход, постепенно изменяя общую структуру ответа до достижения желаемого результата.
Традиционно для текстовых приложений используют модели авторегрессии, и этот подход оказался чрезвычайно успешным для последних поколений моделей ИИ. Однако всё больше исследований показывают, что модели диффузии могут работать эффективнее, когда модель обрабатывает большие объёмы текста или управляет ограничениями данных. Как отмечает Эрмон, эти качества становятся реальным преимуществом при выполнении операций с большими кодовыми базами.
Диффузионные модели также обладают большей гибкостью в использовании оборудования, что особенно важно, учитывая инфраструктурные требования ИИ. В то время как модели авторегрессии должны выполнять операции одну за другой, диффузионные модели могут обрабатывать множество операций одновременно, что позволяет значительно снизить задержку при выполнении сложных задач.
«Мы достигли производительности более 1000 токенов в секунду, что значительно превышает всё, что возможно при использовании существующих авторегрессионных технологий, — говорит Эрмон, — потому что наша система создана для параллельной обработки. Она создана для очень, очень быстрой работы».
Источник: techcrunch.com



























