
Medal, платформа для загрузки и обмена игровыми клипами, создала новую передовую лабораторию по исследованию искусственного интеллекта, которая использует свои обширные игровые видеоролики для обучения и создания базовых моделей и агентов искусственного интеллекта, которые могут понимать, как объекты и сущности движутся в пространстве и времени. Эта концепция известна как пространственно-временное мышление.
Стартап под названием General Intuition делает ставку на то, что набор данных Medal, состоящий из 2 миллиардов видеороликов в год от 10 миллионов активных пользователей в месяц из десятков тысяч игр, превзойдет такие альтернативы, как Twitch или YouTube, для обучения агентов.
«Когда вы играете в видеоигры, вы, по сути, переносите своё восприятие, обычно через вид от первого лица, на различные среды», — рассказал TechCrunch Пим де Витте, генеральный директор Medal and General Intuition. Он отметил, что геймеры, загружающие клипы, как правило, публикуют очень негативные или позитивные примеры, которые служат действительно полезными пограничными случаями для обучения. «Это приводит к смещению отбора в сторону именно тех данных, которые вы действительно хотите использовать для обучения».
По сообщениям The Information, именно этот ров с данными привлёк внимание компании OpenAI, которая в конце прошлого года пыталась приобрести Medal за 500 миллионов долларов. (Ни OpenAI, ни General Intuition не стали комментировать этот отчёт.)
Это также привело к тому, что General Intuition привлекла колоссальную сумму в 133,7 млн долларов США в качестве начального финансирования при участии Khosla Ventures и General Catalyst при участии Raine.

Стартап намерен использовать средства для развития своей команды исследователей и инженеров, которые займутся подготовкой универсального агента, способного взаимодействовать с окружающим миром, с целью первоначального применения в играх и поисково-спасательных беспилотниках.
Де Витте утверждает, что команда основателей уже добилась успехов: модель General Intuition способна распознавать окружение, на котором её не обучали, и правильно предсказывать действия в нём. Она способна делать это исключительно на основе визуальной информации; агенты видят только то, что видит игрок-человек, и перемещаются в пространстве, следуя командам контроллера. По словам компании, этот подход может быть естественным образом перенесён на физические системы, такие как роботизированные руки, дроны и автономные транспортные средства, которыми люди часто управляют с помощью игровых контроллеров.
Следующая веха General Intuition будет иметь два направления: создание новых моделируемых миров для обучения других агентов и автономное перемещение по совершенно незнакомым физическим средам.
Этот технический подход определяет планы компании по коммерциализации своей технологии и отличает ее от конкурентов, создающих мировые модели.
Хотя General Intuition также разрабатывает модели мира для обучения своих агентов, эти модели не являются продуктом. В отличие от других производителей моделей мира, таких как DeepMind и World Labs, которые продают свои модели мира Genie и Marble для обучения агентов и создания контента, General Intuition фокусируется на других вариантах использования, чтобы избежать проблем с авторскими правами.
«Наша цель — не создавать модели, которые будут конкурировать с разработчиками игр», — сказал де Витте.
Вместо этого игровые приложения стартапа сосредоточены на создании ботов и неигровых персонажей, которые могут превзойти традиционных «детерминированных ботов» или заранее запрограммированных персонажей, которые каждый раз выдают один и тот же результат.
«[Боты] могут масштабироваться до любого уровня сложности», — рассказал TechCrunch Мориц Байер-Ленц, основатель General Intuition и партнёр Lightspeed Ventures. «Необязательно создавать бота-бога, который побеждает всех, но если вы сможете постепенно масштабировать систему и наполнять ликвидностью в любой ситуации, чтобы их процент побед всегда был около 50%, это позволит максимально повысить их вовлечённость и удержание».
У Де Витте также есть опыт гуманитарной работы, что объясняет ориентацию стартапа на обеспечение поисково-спасательных беспилотников, которым иногда приходится ориентироваться в незнакомой обстановке и добывать информацию без GPS.
В конечном счёте, де Витте и Байер-Ленц рассматривают базовую функциональность General Intuition – пространственно-временное мышление – как важнейший элемент в гонке за искусственный интеллект общего назначения (AGI). В то время как крупные лаборатории ИИ сосредоточены на создании всё более мощных больших языковых моделей, General Intuition считает, что для настоящего AGI требуется то, чего принципиально не хватает магистрам права.
«Мы, люди, создаём текст, чтобы описывать происходящее в мире, но при этом теряем много информации», — сказал де Витте. «Мы теряем общую интуицию, связанную с пространственно-временным мышлением».
Источник: techcrunch.com


























