Image

Октябрьский нейродайджест

dfccf2efca7b3f743694f48f4dcfd2dd

На Хэллоуин не только коты в шляпах творят магию.

Я тоже немного поколдовал — и собрал октябрьскую подборку свежих нейроновинок.

Новые модели, браузеры, инструменты для видео, звука и даже образования — всё, на что стоит обратить внимание внимания.

Изображения

1. Seedream 4.0 — это нейросеть для генерации изображений, как Midjourney или DALL·E, но с уклоном в суперреализм и детализацию. Теперь она доступна прямо в DreaminaAI — не нужно API, можно тестить в пару кликов. Главные фишки: картинки в 4К, резкие и сочные, поддержка до 6 референсов (можно задавать стиль или объекты). Стала стабильнее и быстрее

https://dreamina.capcut.com/ai-tool/generate

2. CapCut запустил AI Design — новый инструмент для дизайнеров и маркетологов. Теперь можно создавать постеры, баннеры, логотипы и открытки по текстовому описанию или из загруженного изображения. Инструмент умеет подстраивать дизайн под формат соцсетей, менять фон, адаптировать сцены и даже работать с товарами для e-commerce. Доступен в веб-версии и настольном приложении CapCut. Есть бесплатный доступ.

https://www.capcut.com/tools/desktop-video-editor

Аудио

1. Hume AI представила Octave 2 — многоязычную модель преобразования текста в речь нового поколения. Она поддерживает 11 языков (включая русский), работает на 40 % быстрее и на 50 % дешевле предыдущей версии. Теперь возможен разговор с несколькими спикерами, более точное произношение, а также редактирование фонем и преобразование голоса.

https://demo.hume.ai

2. ElevenLabs запустила Agent Workflows — инструмент для создания голосовых ботов в виде визуальных схем.

Теперь можно делить разговор на этапы, где за каждый отвечает свой мини-агент со своими инструкциями и знаниями.

Боты звучат естественно, не путаются и при необходимости передают разговор человеку.

https://elevenlabs.io/app/sign-in?redirect=/app/agents

3. Udio — это ИИ-сервис для генерации музыки с вокалом и инструменталом. Теперь добавили две функции: смешивание голосов из разных треков и Udio Playground — конструктор музыки из блоков «голос + стиль». Тестировать можно на udio.com

4. Suno выпустила бесплатную модель v4.5- all для генерации музыки. Она звучит заметно живее прошлых версий — вокал стал естественнее, а композиции богаче и сложнее. Пользователям доступно 50 кредитов в день — этого хватает примерно на 10 треков.

https://suno.com/home

5.Fish Audio представила S1 — новую модель для ультрареалистичного клонирования голоса и генерации речи. Она создаёт естественное звучание с живой интонацией и может озвучивать текст в реальном времени с задержкой менее 500 мс. Клонирование голоса занимает всего несколько секунд, а стоимость — в шесть раз ниже ElevenLabs.

https://fish.audio/ru/voice-clone

Видео

1. Luma Labs представила Ray3 — новую видеомодель, которая удерживает детали даже в самых сложных сценах.Теперь она справляется с толпами на улицах и стадионах, сохраняя четкость и реализм каждого объекта в движении. Тонкие текстуры, узоры и микродействия остаются стабильными, а сцены выглядят живыми и естественными даже при динамичной анимации.

https://lumalabs.ai/dream-machine

2. DecartAI запустила Decart XR — мультимодальную платформу, которая объединяет мышление ИИ с трёхмерным восприятием.Теперь ИИ-агенты могут видеть, перемещаться и взаимодействовать в виртуальных мирах в реальном времени.Платформа поддерживает интеграцию с LLM-моделями и открыта для разработчиков — можно создавать собственные интеллектуальные 3D-сцены и VR-среды.

https://vr.decart.ai/

3. Pika представила Predictive Video — новую функцию, которая превращает короткую идею в полноценный видеоролик.

Достаточно написать пару слов вроде «я выступаю на TED Talk» — и модель сама добавит сценарий, музыку, свет, движения и ракурсы камеры. Видео создаётся за минуту без сложных промптов.

https://pika.me

4. OpenAI выпустила подробное руководство по работе с Sora 2 — генератором реалистичных видео нового поколения. В гайде объясняется, как правильно строить промпт: описывать кадр, движение, освещение и цветовую палитру, а также формулировать действия без двусмысленностей. Есть советы по композиции, диалогам и звуку — всё, чтобы видео выглядело живым и выразительным.

https://cookbook.openai.com/examples/sora/sora2_prompting_guide#prompt-anatomy-that-works

5. Google официально представила Veo 3.1 — обновлённую модель для генерации видео. Теперь можно создавать ролики до 60 секунд в 1080p, с реалистичным звуком и поддержкой русской речи. Добавлены ключевые кадры, референсы, улучшено понимание промптов и сохранение персонажей между сценами — видео стали плавнее, детальнее и ближе к кинематографическому качеству.

https://labs.google/fx/ru/tools/flow

6. Grok Imagine получил обновление — теперь можно повышать качество видео до HD прямо в браузере. Функция работает за считанные секунды: достаточно выделить три точки и запустить масштабирование.

https://grok.com/imagine

7. MiniMax представила Hailuo 2.3 и Hailuo 2.3 Fast — новые версии своей видеомодели. Режим Fast ускоряет рендеринг, сохраняя четкость движения и детализацию, а обновлённая система освещения и камера делают сцены более реалистичными.Модель также улучшила передачу микровыражений и согласованность кадров, а пользователи Free теперь могут создавать до 4 видео в день.

https://hailuoai.video

8. OpenAI представила в Sora 2 функцию — Character Cameos. Теперь пользователи могут создавать персонажей, похожих на реальных людей, и использовать их в разных видео, сохраняя внешний вид и поведение между сценами. Функция позволяет органично вводить героев в новые сюжеты и расширяет творческие возможности Sora. Кроме того, вход в приложение теперь открыт без инвайта для пользователей из США, Канады, Японии и Кореи.

http://sora.com/

Тексты

1. OpenAI запустила AgentKit — визуальный конструктор для создания ИИ-агентов без кода. Теперь можно собирать умных помощников, соединяя действия, данные и инструменты как в блок-схеме. В составе:

— Agent Builder — интерфейс для проектирования логики агента;

— ChatKit — добавляет чат-интерфейс;

— Connector Registry — подключение API и баз данных;

— Evals и Guardrails — тестирование и защита от ошибок;

— RFT — обучает агента рассуждать и действовать осознанно.

Также в ChatGPT появились встроенные приложения — Canva, Figma, Booking, Spotify и другие. Работать с ними теперь можно прямо внутри чата, без перехода на сайты. Доступ разворачивается постепенно.

https://platform.openai.com/agent-builder

2. Claude Haiku 4.5 — новая компактная нейросеть от Anthropic, предназначенная для быстрого анализа текста, кода и данных. Она ориентирована на задачи программирования, обработки информации и поддержки рабочих процессов, где важны скорость и эффективность. Модель работает в два раза быстрее и в три раза дешевле, чем Claude Sonnet 4, сохраняя тот же уровень качества и точности.

https://claude.ai

Другое

1. Perplexity Comet — ИИ-браузер, который объединяет поиск, чат и справочную систему в одном окне. Теперь доступен каждому — без инвайтов и ожиданий. Достаточно скачать по ссылке (https://www.perplexity.ai/comet/), но для полного функционала понадобится Pro-аккаунт.

2. Dia — новый ИИ-браузер от создателей Arc. В нём встроен умный ассистент, который понимает контекст: анализирует открытые вкладки, историю и даже сайты, где вы авторизованы. Интерфейс напоминает Chrome или Safari, но с дополнительными «навыками» — можно по команде перевести текст, сделать краткое резюме страницы, отредактировать материал или открыть нужные вкладки разом. Пока доступен только на macOS, версия для Windows появится позже.

https://www.diabrowser.com

3. Google представила Learn Your Way — ИИ-платформу, которая превращает учебники в интерактивные материалы с объяснениями и визуальными резюме.Работает на базе Gemini и LearnLM, подстраиваясь под темп ученика, и уже показала +11 % к усвоению знаний.

https://learnyourway.withgoogle.com/

4. OpenAI выпустила ChatGPT Atlas — новый браузер с встроенным ИИ-ассистентом. Он умеет искать, анализировать и резюмировать информацию прямо во время серфинга, а также выполнять задачи по запросу пользователя. Atlas построен на Chromium, имеет боковую панель ChatGPT, режим агента и систему памяти с контролем данных. Пока доступен для macOS, версии для Windows и мобильных платформ появятся позже.

https://chatgpt.com/atlas

Если такой формат полезен и хочется видеть дайджесты каждый месяц — ? этот пост. И сохраняйте подборку.

AI locus | ChatGPT | MidJourney

Источник: chatgpt.com

Источник: ai-news.ru

✅ Найденные теги: новости, Октябрьский

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
Предоставление врачам необходимой информации непосредственно в момент общения с пациентом.
Руководство по Kedro: ваш готовый к внедрению инструментарий для анализа данных.
Цифровая сеть и технологическая сфера, соединенные световым потоком.
Модель атома с ядром и вращающимися электронами на темном фоне.
Флуоресцентное изображение эмбриона синих и фиолетовых оттенков на черном фоне.
Компания GE HealthCare запускает новую ультразвуковую систему для диагностики сердечно-сосудистых заболеваний.
ideipro logotyp
Лидеры здравоохранения обсуждают «пузырь» искусственного интеллекта, часть 2 | MobiHealthNews
Image Not Found
ideipro logotyp

Компания Illumina на конференции JPM 2026: Успешный 4-й квартал, рост клинических исследований и запуск BioInsight.

Автор: Эллисон Проффитт 13 января 2026 г. | Джейкоб Тейсен во вторник вернулся на сцену конференции JP Morgan Healthcare Conference с посланием о восходящем тренде: компания Illumina снова демонстрирует рост, и клиническое секвенирование является движущей силой этого…

Мар 5, 2026
Предоставление врачам необходимой информации непосредственно в момент общения с пациентом.

Предоставление врачам необходимой информации непосредственно в момент общения с пациентом.

Преобразуя взаимодействие врача и пациента в полезную для клинического применения и оплачиваемую документацию, корпоративная платформа искусственного интеллекта Abridge снижает нагрузку на врачей в плане ведения документации и предотвращает профессиональное выгорание. Искусственный интеллект Изображение предоставлено компанией Abridge. Для…

Мар 5, 2026
Руководство по Kedro: ваш готовый к внедрению инструментарий для анализа данных.

Руководство по Kedro: ваш готовый к внедрению инструментарий для анализа данных.

В этой статье представлены и подробно рассмотрены основные функции Kedro, а также познакомят вас с его ключевыми концепциями для лучшего понимания перед тем, как углубиться в изучение этого фреймворка для решения реальных задач в области анализа данных.…

Мар 5, 2026
Цифровая сеть и технологическая сфера, соединенные световым потоком.

Разница между начинающими и опытными специалистами по анализу данных заключается не в коде.

Почему моя одержимость сложными алгоритмами на самом деле тормозила мою карьеру. Делиться Изображение предоставлено автором (создано с помощью Nano Banana Pro) Если вы потратите пять минут на LinkedIn или что-то подобное, вы заметите острую дискуссию в индустрии…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых