Система Google DeepMind улучшает дизайн чипов и решает нерешенные математические задачи, но не была представлена исследователям за пределами компании

Google DeepMind использовал модели чат-ботов для поиска решений основных задач в области математики и компьютерных наук.
Система, называемая AlphaEvolve, сочетает в себе креативность большой языковой модели (LLM) с алгоритмами, которые могут тщательно анализировать предложения модели для фильтрации и улучшения решений. Это было описано в официальном документе, опубликованном компанией 14 мая.
«Статья довольно впечатляющая», — говорит Марио Кренн, руководитель лаборатории искусственного интеллекта в Университете Макса. Институт науки о свете имени Планка в Эрлангене, Германия. “Я думаю, что AlphaEvolve — это первая успешная демонстрация новых открытий, основанных на стандартах LLM общего назначения.”
О поддержке научной журналистики
Если вам понравилась эта статья, подумайте о поддержке нашей журналистики, отмеченной наградами. оформив подписку. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.
Помимо использования системы для поиска решений открытых математических задач, DeepMind уже применяет технологию искусственного интеллекта (ИИ) для решения своих собственных практических задач, говорит Пушмит Кохли, руководитель научного отдела в фирма в Лондоне.
Компания AlphaEvolve помогла усовершенствовать конструкцию следующего поколения тензорных процессоров компании — вычислительных чипов, разработанных специально для искусственного интеллекта, — и нашла способ более эффективно используйте вычислительные мощности Google по всему миру, экономя 0,7% от общего объема ресурсов. «Это оказало существенное влияние», — говорит Кохли.
Искусственный интеллект общего назначения
DeepMind описывает AlphaEvolve как «агента», поскольку он предполагает использование взаимодействующих моделей искусственного интеллекта. Но она нацелена на другой этап научного процесса, отличный от многих других научных систем «агентурного» ИИ, которые использовались для анализа литературы и выдвижения гипотез.
AlphaEvolve основана на семействе LLM фирмы Gemini. Каждая задача начинается с того, что пользователь вводит вопрос, критерии для оценки и предлагаемое решение, для которого LLM предлагает сотни или тысячи модификаций. Затем алгоритм «оценщика» сравнивает изменения с метриками для получения хорошего решения (например, при распределении вычислительных заданий Google исследователи хотят тратить меньше ресурсов).
На основе того, какие решения считаются лучшими, LLM предлагает свежие идеи, и со временем в системе появляется множество более эффективных алгоритмов, — говорит Матей Балог, специалист по искусственному интеллекту из DeepMind, который был одним из руководителей исследования. «Мы исследуем этот разнообразный набор возможностей того, как можно решить проблему», — говорит он.
AlphaEvolve основана на фирменной системе FunSearch, которая, как было показано в 2023 году, использует аналогичный эволюционный подход, чтобы превзойти людей в решении нерешенных задач по математике. По сравнению с FunSearch, AlphaEvolve может обрабатывать гораздо большие фрагменты кода и использовать более сложные алгоритмы в широком спектре научных областей, говорит Балог.
Компания DeepMind сообщает, что AlphaEvolve разработала способ выполнения вычисления, известный как умножение матриц, который в некоторых случаях выполняется быстрее, чем самый быстрый из известных методов, разработанный немецким математиком Фолькером Штрассен в 1969 году. Такие вычисления включают умножение чисел на сетках и используются для обучения нейронных сетей. Несмотря на то, что AlphaEvolve является универсальной программой, она превосходит AlphaTensor, инструмент искусственного интеллекта, описанный фирмой в 2022 году и разработанный специально для матричной механики.
Этот подход может быть использован для решения задач оптимизации, говорит Кренн, или в любой другой области науки, где есть конкретные показатели или моделирование, позволяющие оценить, что является хорошим решением. Это может включать в себя разработку новых микроскопов, телескопов или даже материалов, добавляет он.
Узкие области применения
Другие исследователи воздерживаются от суждений о полезности этого инструмента до тех пор, пока он не будет опробован за пределами DeepMind. «Пока системы не будут протестированы более широким сообществом, я бы сохранял скептицизм и принимал представленные результаты не вызывают сомнений», — говорит Хуан Сун, исследователь искусственного интеллекта из Университета штата Огайо в Колумбусе. Фридер говорит, что он подождет, пока исследователи воссоздадут версию с открытым исходным кодом, а не будет полагаться на проприетарную систему DeepMind, которая может быть отозвана или изменена.
Хотя для запуска AlphaEvolve требуется меньше вычислительной мощности, чем для AlphaTensor, он по-прежнему слишком ресурсоемкий, чтобы быть доступным на серверах DeepMind в свободном доступе, говорит Кохли.
Но компания надеется, что анонс системы побудит исследователей предложить области науки, в которых можно применить AlphaEvolve. «Мы определенно стремимся к тому, чтобы как можно больше людей в научном сообществе получили к ней доступ», — говорит Кохли.
Эта статья воспроизводится с разрешения и была впервые опубликовано 14 мая 2025 года.



























