Архив рубрики ~Коротко из Telegram~

Яндекс наконец научил нейросеть нормально писать по-русски на картинках Яндекс…

Яндекс наконец научил нейросеть нормально писать по-русски на картинках Яндекс…

Яндекс наконец научил нейросеть нормально писать по-русски на картинках

Яндекс обновил Alice AI ART с большим фокусом на генерацию кириллического текста — и это одна из самых болезненных проблем для diffusion-моделей.

До сих пор нейросети воспринимали буквы скорее как текстуру, а не как стабильные символы. С кириллицей всё было ещё хуже: мало качественных данных, много шумных примеров и почти полное доминирование английского в датасетах.

Теперь ситуация заметно улучшилась.

Ключевые моменты:

— точность генерации кириллицы выросла примерно в 3 раза
— фразы длиной 7–9 слов теперь корректно генерируются в большинстве случаев
— общее качество изображений выросло примерно на треть
— локальная айдентика показывает около 85% успешных генераций

Что изменили технически:

— собрали собственный датасет:
30 млн пар «изображение-текст» для претрейна
— ~100 тыс. для файнтюна

— добавили разметку глифов
— сменили архитектуру:
— с UNet → на Diffusion Transformer

— заменили текстовый энкодер на LLM
— начали обучать модель сразу на русскоязычных промптах

Советы по промптингу от команды:

— заключать текст в кавычки
— сложные слова писать КАПСОМ
— длинные надписи разбивать на части
— явно указывать расположение текста

Похоже, генерация нормального текста внутри картинок постепенно перестаёт быть «магией через 50 перегенераций» — по крайней мере для кириллицы.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Лента новостей~ Как измеряют LLM: параметры, бенчмарки и тесты на коленке Архив рубрики ~Лента новостей~ Seedance 4К, Kling и Veo: 1000 промптов для видео в одном сайте promptstudio.tools Архив рубрики ~Лента новостей~ Внедрили AI-агента в BI-систему — чистая магия в обработке и визуализации терабайтов данных Архив рубрики ~Лента новостей~ Нормально ли то, что наше тело и мозг резко увеличились 2 миллиона лет назад? Архив рубрики ~Лента новостей~ Обратная связь по обратной связи: выветривание горных пород и климат Архив рубрики ~Лента новостей~ Глава индийской платежной системы считает, что искусственный интеллект будет играть важную роль в развитии цифровых платежей в следующую эпоху. Архив рубрики ~Лента новостей~ Верная ли дорога? Архив рубрики ~Лента новостей~ Акции SpaceX пережили довольно плохую ночь Архив рубрики ~Лента новостей~ WSJ: Anthropic отправила ведущих технических специалистов на переговоры с американскими чиновниками, чтобы добиться отмены ограничений для Fable 5 и Mythos 5 Архив рубрики ~Лента новостей~ Математика букв: Wordle и теория информации Архив рубрики ~Лента новостей~ Вот почему ваши умные часы вызывают у вас беспокойство и что с этим можно сделать. Архив рубрики ~Обо всем~ Прорыв в области искусственного интеллекта может заменить редкоземельные магниты в электромобилях. Новости робототехники 🤖 Unitree показали человекоподобного робота за $4900. Новый Unitree R1… Архив рубрики ~Лента новостей~ Метод повышения разрешения (upmasling) улучшает качество изображения, получаемого с помощью ИИ, при этом требуется до 16 раз меньше памяти графического процессора. Архив рубрики ~Лента новостей~ Как измеряют LLM: параметры, бенчмарки и тесты на коленке Архив рубрики ~Лента новостей~ Seedance 4К, Kling и Veo: 1000 промптов для видео в одном сайте promptstudio.tools Архив рубрики ~Лента новостей~ Внедрили AI-агента в BI-систему — чистая магия в обработке и визуализации терабайтов данных Архив рубрики ~Лента новостей~ Нормально ли то, что наше тело и мозг резко увеличились 2 миллиона лет назад? Архив рубрики ~Лента новостей~ Обратная связь по обратной связи: выветривание горных пород и климат Архив рубрики ~Лента новостей~ Глава индийской платежной системы считает, что искусственный интеллект будет играть важную роль в развитии цифровых платежей в следующую эпоху. Архив рубрики ~Лента новостей~ Верная ли дорога? Архив рубрики ~Лента новостей~ Акции SpaceX пережили довольно плохую ночь Архив рубрики ~Лента новостей~ WSJ: Anthropic отправила ведущих технических специалистов на переговоры с американскими чиновниками, чтобы добиться отмены ограничений для Fable 5 и Mythos 5 Архив рубрики ~Лента новостей~ Математика букв: Wordle и теория информации Архив рубрики ~Лента новостей~ Вот почему ваши умные часы вызывают у вас беспокойство и что с этим можно сделать. Архив рубрики ~Обо всем~ Прорыв в области искусственного интеллекта может заменить редкоземельные магниты в электромобилях. Новости робототехники 🤖 Unitree показали человекоподобного робота за $4900. Новый Unitree R1… Архив рубрики ~Лента новостей~ Метод повышения разрешения (upmasling) улучшает качество изображения, получаемого с помощью ИИ, при этом требуется до 16 раз меньше памяти графического процессора.

Оставить комментарий