Компания Patronus AI привлекла 50 миллионов долларов на создание «цифровых миров», которые будут использоваться для стресс-тестирования агентов искусственного интеллекта.
Искусственный интеллект становится все более сложным. Он эволюционирует от ответов на вопросы к автономному выполнению многоэтапных сложных задач.
Но прежде чем этим агентам можно будет доверить бронирование поездок или проведение финансового анализа от имени пользователей, поставщики моделей и стартапы, создающие такие агенты, хотят убедиться, что они надежно работают в самых разных сценариях.
В лабораториях искусственного интеллекта часто используют бенчмарки для демонстрации возможностей своих моделей, но высокий балл, даже в ориентированном на агентов бенчмарке, на самом деле не доказывает, что ИИ может правильно выполнять различные сложные задачи из реального мира.
Patronus AI, стартап, основанный в 2023 году бывшими исследователями Meta AI Анандом Каннаппаном и Ребеккой Цянь, помогает разработчикам моделей и компаниям дорабатывать модели именно для этой цели, создавая смоделированные цифровые среды, в которых можно оценивать производительность агентов.
Этот стартап из Сан-Франциско, должно быть, решает важную проблему. По словам Гленна Соломона, управляющего директора Notable Capital, практически каждая передовая лаборатория искусственного интеллекта и многие новые стартапы теперь являются его клиентами, и спрос на смоделированные среды компании практически ненасытный.
Выручка Patronus за последний год выросла в 15 раз, что вызвало значительный интерес инвесторов. В четверг компания объявила о привлечении 50 миллионов долларов в рамках раунда финансирования серии B, возглавляемого Greenfield Partners, при участии Notable Capital, Lightspeed, Datadog и Samsung. Таким образом, общий объем привлеченных компанией средств достиг 70 миллионов долларов.
Компания Patronus использует так называемые «цифровые модели мира» для создания копий веб-сайтов и внутренних систем. В этих средах агенты проходят стресс-тестирование после обучения с помощью обучения с подкреплением, которое итеративно вознаграждает за успешное выполнение задач и наказывает за ошибки.
В лабораториях искусственного интеллекта видят большую ценность в этих цифровых симуляциях, поскольку они дают агентам возможность опробовать различные, порой непредсказуемые, сценарии. Компания сравнивает свой подход с тем, как Waymo обучала беспилотные автомобили, сначала создавая синтетические миры для тестирования транспортных средств в условиях редких опасностей, таких как суровая погода или ребенок, бегущий за мячом.
Отличие агентов ИИ в том, что они склонны к упрощению, из-за чего не могут правильно выполнить задачу. «Patronus очень хорошо выявляет подобные уловки и следит за тем, чтобы модели работали корректно», — сказал Соломон.
В настоящее время Patronus предоставляет свои смоделированные цифровые миры для разработки программного обеспечения и финансовой сферы, но, по словам Каннаппана, это только начало.
«Сегодня мы сосредоточены на проблемах, которые поддаются проверке, то есть на тех проблемах, которые можно проверить и подтвердить немедленно, но есть еще множество областей, которые проверить очень сложно или невозможно», — сказал он.
Тот факт, что эти процессы поддаются проверке, не означает, что они просты. «Мы хотим создать такую среду, в которой можно будет запускать агента, способного работать 10 часов, 10 дней или 10 недель», — сказал Каннаппан.
Что касается конкурентов, Patronus считает, что в первую очередь конкурирует с внутренними командами, уже созданными лабораториями искусственного интеллекта для оценки поведения агентов. В то время как такие компании, как Mercor и Surge, помогающие разработчикам моделей в обучении с подкреплением, Patronus работает иначе, оценивая поведение агентов без участия человека.
Источник: techcrunch.com
Похожие записи
- Пересадка кроветворных клеток привела к стойкой ремиссии при нейромиелите зрительного нерва. Это показало 15-летнее наблюдение за двумя пациентами
- Федеральные власти отказали компании Polestar в разрешении на продажу автомобилей в США, начиная с 2027 модельного года.
- Новак Джокович получил новую работу — советника в частной инвестиционной компании General Atlantic.
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
