
На Хэллоуин не только коты в шляпах творят магию.
Я тоже немного поколдовал — и собрал октябрьскую подборку свежих нейроновинок.
Новые модели, браузеры, инструменты для видео, звука и даже образования — всё, на что стоит обратить внимание внимания.
Изображения
1. Seedream 4.0 — это нейросеть для генерации изображений, как Midjourney или DALL·E, но с уклоном в суперреализм и детализацию. Теперь она доступна прямо в DreaminaAI — не нужно API, можно тестить в пару кликов. Главные фишки: картинки в 4К, резкие и сочные, поддержка до 6 референсов (можно задавать стиль или объекты). Стала стабильнее и быстрее
https://dreamina.capcut.com/ai-tool/generate
2. CapCut запустил AI Design — новый инструмент для дизайнеров и маркетологов. Теперь можно создавать постеры, баннеры, логотипы и открытки по текстовому описанию или из загруженного изображения. Инструмент умеет подстраивать дизайн под формат соцсетей, менять фон, адаптировать сцены и даже работать с товарами для e-commerce. Доступен в веб-версии и настольном приложении CapCut. Есть бесплатный доступ.
https://www.capcut.com/tools/desktop-video-editor
Аудио
1. Hume AI представила Octave 2 — многоязычную модель преобразования текста в речь нового поколения. Она поддерживает 11 языков (включая русский), работает на 40 % быстрее и на 50 % дешевле предыдущей версии. Теперь возможен разговор с несколькими спикерами, более точное произношение, а также редактирование фонем и преобразование голоса.
https://demo.hume.ai
2. ElevenLabs запустила Agent Workflows — инструмент для создания голосовых ботов в виде визуальных схем.
Теперь можно делить разговор на этапы, где за каждый отвечает свой мини-агент со своими инструкциями и знаниями.
Боты звучат естественно, не путаются и при необходимости передают разговор человеку.
https://elevenlabs.io/app/sign-in?redirect=/app/agents
3. Udio — это ИИ-сервис для генерации музыки с вокалом и инструменталом. Теперь добавили две функции: смешивание голосов из разных треков и Udio Playground — конструктор музыки из блоков «голос + стиль». Тестировать можно на udio.com
4. Suno выпустила бесплатную модель v4.5- all для генерации музыки. Она звучит заметно живее прошлых версий — вокал стал естественнее, а композиции богаче и сложнее. Пользователям доступно 50 кредитов в день — этого хватает примерно на 10 треков.
https://suno.com/home
5.Fish Audio представила S1 — новую модель для ультрареалистичного клонирования голоса и генерации речи. Она создаёт естественное звучание с живой интонацией и может озвучивать текст в реальном времени с задержкой менее 500 мс. Клонирование голоса занимает всего несколько секунд, а стоимость — в шесть раз ниже ElevenLabs.
https://fish.audio/ru/voice-clone
Видео
1. Luma Labs представила Ray3 — новую видеомодель, которая удерживает детали даже в самых сложных сценах.Теперь она справляется с толпами на улицах и стадионах, сохраняя четкость и реализм каждого объекта в движении. Тонкие текстуры, узоры и микродействия остаются стабильными, а сцены выглядят живыми и естественными даже при динамичной анимации.
https://lumalabs.ai/dream-machine
2. DecartAI запустила Decart XR — мультимодальную платформу, которая объединяет мышление ИИ с трёхмерным восприятием.Теперь ИИ-агенты могут видеть, перемещаться и взаимодействовать в виртуальных мирах в реальном времени.Платформа поддерживает интеграцию с LLM-моделями и открыта для разработчиков — можно создавать собственные интеллектуальные 3D-сцены и VR-среды.
https://vr.decart.ai/
3. Pika представила Predictive Video — новую функцию, которая превращает короткую идею в полноценный видеоролик.
Достаточно написать пару слов вроде «я выступаю на TED Talk» — и модель сама добавит сценарий, музыку, свет, движения и ракурсы камеры. Видео создаётся за минуту без сложных промптов.
https://pika.me
4. OpenAI выпустила подробное руководство по работе с Sora 2 — генератором реалистичных видео нового поколения. В гайде объясняется, как правильно строить промпт: описывать кадр, движение, освещение и цветовую палитру, а также формулировать действия без двусмысленностей. Есть советы по композиции, диалогам и звуку — всё, чтобы видео выглядело живым и выразительным.
https://cookbook.openai.com/examples/sora/sora2_prompting_guide#prompt-anatomy-that-works
5. Google официально представила Veo 3.1 — обновлённую модель для генерации видео. Теперь можно создавать ролики до 60 секунд в 1080p, с реалистичным звуком и поддержкой русской речи. Добавлены ключевые кадры, референсы, улучшено понимание промптов и сохранение персонажей между сценами — видео стали плавнее, детальнее и ближе к кинематографическому качеству.
https://labs.google/fx/ru/tools/flow
6. Grok Imagine получил обновление — теперь можно повышать качество видео до HD прямо в браузере. Функция работает за считанные секунды: достаточно выделить три точки и запустить масштабирование.
https://grok.com/imagine
7. MiniMax представила Hailuo 2.3 и Hailuo 2.3 Fast — новые версии своей видеомодели. Режим Fast ускоряет рендеринг, сохраняя четкость движения и детализацию, а обновлённая система освещения и камера делают сцены более реалистичными.Модель также улучшила передачу микровыражений и согласованность кадров, а пользователи Free теперь могут создавать до 4 видео в день.
https://hailuoai.video
8. OpenAI представила в Sora 2 функцию — Character Cameos. Теперь пользователи могут создавать персонажей, похожих на реальных людей, и использовать их в разных видео, сохраняя внешний вид и поведение между сценами. Функция позволяет органично вводить героев в новые сюжеты и расширяет творческие возможности Sora. Кроме того, вход в приложение теперь открыт без инвайта для пользователей из США, Канады, Японии и Кореи.
http://sora.com/
Тексты
1. OpenAI запустила AgentKit — визуальный конструктор для создания ИИ-агентов без кода. Теперь можно собирать умных помощников, соединяя действия, данные и инструменты как в блок-схеме. В составе:
— Agent Builder — интерфейс для проектирования логики агента;
— ChatKit — добавляет чат-интерфейс;
— Connector Registry — подключение API и баз данных;
— Evals и Guardrails — тестирование и защита от ошибок;
— RFT — обучает агента рассуждать и действовать осознанно.
Также в ChatGPT появились встроенные приложения — Canva, Figma, Booking, Spotify и другие. Работать с ними теперь можно прямо внутри чата, без перехода на сайты. Доступ разворачивается постепенно.
https://platform.openai.com/agent-builder
2. Claude Haiku 4.5 — новая компактная нейросеть от Anthropic, предназначенная для быстрого анализа текста, кода и данных. Она ориентирована на задачи программирования, обработки информации и поддержки рабочих процессов, где важны скорость и эффективность. Модель работает в два раза быстрее и в три раза дешевле, чем Claude Sonnet 4, сохраняя тот же уровень качества и точности.
https://claude.ai
Другое
1. Perplexity Comet — ИИ-браузер, который объединяет поиск, чат и справочную систему в одном окне. Теперь доступен каждому — без инвайтов и ожиданий. Достаточно скачать по ссылке (https://www.perplexity.ai/comet/), но для полного функционала понадобится Pro-аккаунт.
2. Dia — новый ИИ-браузер от создателей Arc. В нём встроен умный ассистент, который понимает контекст: анализирует открытые вкладки, историю и даже сайты, где вы авторизованы. Интерфейс напоминает Chrome или Safari, но с дополнительными «навыками» — можно по команде перевести текст, сделать краткое резюме страницы, отредактировать материал или открыть нужные вкладки разом. Пока доступен только на macOS, версия для Windows появится позже.
https://www.diabrowser.com
3. Google представила Learn Your Way — ИИ-платформу, которая превращает учебники в интерактивные материалы с объяснениями и визуальными резюме.Работает на базе Gemini и LearnLM, подстраиваясь под темп ученика, и уже показала +11 % к усвоению знаний.
https://learnyourway.withgoogle.com/
4. OpenAI выпустила ChatGPT Atlas — новый браузер с встроенным ИИ-ассистентом. Он умеет искать, анализировать и резюмировать информацию прямо во время серфинга, а также выполнять задачи по запросу пользователя. Atlas построен на Chromium, имеет боковую панель ChatGPT, режим агента и систему памяти с контролем данных. Пока доступен для macOS, версии для Windows и мобильных платформ появятся позже.
https://chatgpt.com/atlas
Если такой формат полезен и хочется видеть дайджесты каждый месяц — ? этот пост. И сохраняйте подборку.
AI locus | ChatGPT | MidJourney
Источник: chatgpt.com
Источник: ai-news.ru






















