Вкратце

В четверг Институт Лауде объявил о первой серии грантов Slingshots, направленных на «развитие науки и практики искусственного интеллекта».
Программа Slingshots, разработанная как акселератор для исследователей, призвана предоставлять ресурсы, недоступные в большинстве академических учреждений, будь то финансирование, вычислительные мощности, поддержка продукта и инженерия. В обмен на это получатели обязуются создать какой-либо конечный продукт, будь то стартап, база открытого кода или другой тип артефакта.
Первоначальная группа включает 15 проектов, особое внимание уделяемых сложной проблеме оценки ИИ. Некоторые из этих проектов знакомы читателям TechCrunch, включая бенчмарк командного программирования Terminal Bench и последнюю версию долгосрочного проекта ARC-AGI.
Другие предлагают новый подход к давно существующей проблеме оценки. Проект Formula Code, разработанный исследователями из Калифорнийского технологического института и Техасского университета в Остине, направлен на оценку способности агентов ИИ оптимизировать существующий код, в то время как проект BizBench, базирующийся в Колумбийском университете, предлагает комплексный бенчмарк для «интеллектуальных агентов для «белых воротничков». Другие гранты исследуют новые структуры для обучения с подкреплением или сжатия моделей.
Соучредитель SWE-Bench Джон Бода Янг также входит в эту группу, выступая в качестве лидера нового проекта CodeClash. Вдохновленный успехом SWE-Bench, CodeClash будет оценивать код с помощью динамичной системы, основанной на соревновании, которая, как надеется Янг,
«Я действительно считаю, что продолжение оценки по основным сторонним бенчмаркам способствует прогрессу», — сказал Ян в интервью TechCrunch. «Меня немного беспокоит будущее, в котором бенчмарки станут специфичными для отдельных компаний».
Источник: techcrunch.com



























