Архив - ИдеиPRO

20.11.2025

Архив рубрики ~Лента новостей~

Deep RL и Model-free алгоритмы: обучение оптимальной стратегии без доступа к модели среды

Кусочек траектории [s, a, r, s']Посчитаем уравнение Беллмана только на таких траекториях:Аналогично, обновляем с помощью скользящего среднего: Такой частный случай TD-learning называется Q-Learning:Инициализируем нулямиПока не сойдемся:Семплируем одну траекторию Считаем новое значение Обновляем 2. То есть мы хотим предсказывать состояние или событие на…

Deep RL и Model-free алгоритмы: обучение оптимальной стратегии без доступа к модели среды

Новый поиск Google Scholar Labs использует ИИ для поиска релевантных исследований

Рост потребления электроэнергии в центрах обработки данных может привести к отключениям электроэнергии во время зимних…

«О движении взвешенных в покоящейся жидкости частиц, требуемом молекулярно-кинетической теорией теплоты»

Мы обнаружили неожиданную структуру в поясе Койпера Солнечной системы

Bluesky объявляет об изменениях в модерации, направленных на улучшение отслеживания и повышение прозрачности

Запуск пакета технологий AMD FSR Redstone назначен на 10 декабря

Чипы для мозга, но в виде инъекций. Разработка MIT

Хоботок комара превратился в тонкую насадку для 3D-печати

Adobe купит Semrush за 1,9 миллиарда долларов

Высокопоставленного руководителя TSMC подозревают в краже данных для Intel

Потепление климата достигло даже самых глубоких частей Северного Ледовитого океана

В связи с предстоящим запретом Meta начинает уведомлять австралийских подростков о том, что их аккаунты будут закрыты.

Philips анонсировала игровой монитор Evnia 27M2N6501L

Фуллерены в электронике: патентный анализ

Вырубка лесов в Амазонии продолжается во время COP30, затрагивая экологию и климат

Новые функции Spotify позволяют слушателям узнавать о людях и историях, стоящих за их любимой музыкой

AMD и NVIDIA могут отказаться от выпуска младших видеокарт из-за роста цен на память

Агентный поиск информации: как использовать ИИ-агентов для эффективного поиска информации

Target присоединяется к растущему списку приложений OpenAI для розничной торговли

Как математики решают обратную задачу для строительства в Арктике

Развитие человеческой сексуальности в эпоху искусственного интеллекта

Модель Gemini 3 от Google поддерживает ажиотаж вокруг искусственного интеллекта — пока что.

Член совета директоров OpenAI Ларри Саммерс уходит в отставку на фоне разоблачений в деле Эпштейна

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email