
Компания Cohere, специализирующаяся на корпоративном искусственном интеллекте, представила новое семейство многоязычных моделей в рамках проходящего в Индии саммита по искусственному интеллекту. Модели, получившие название Tiny Aya, являются открытыми — это означает, что их базовый код общедоступен для использования и модификации любым желающим — поддерживают более 70 языков и могут работать на обычных устройствах, таких как ноутбуки, без необходимости подключения к интернету.
Модель, разработанная исследовательским подразделением компании Cohere Labs, поддерживает языки Южной Азии, такие как бенгальский, хинди, пенджабский, урду, гуджарати, тамильский, телугу и маратхи.
Базовая модель содержит 3,35 миллиарда параметров — показатель её размера и сложности. Компания Cohere также выпустила TinyAya-Global, версию, оптимизированную для лучшего выполнения команд пользователя, для приложений, требующих широкой языковой поддержки. Семейство дополняют региональные варианты: TinyAya-Earth для африканских языков; TinyAya-Fire для языков Южной Азии; и TinyAya-Water для Азиатско-Тихоокеанского региона, Западной Азии и Европы.

«Такой подход позволяет каждой модели развивать более прочную лингвистическую основу и учитывать культурные нюансы, создавая системы, которые кажутся более естественными и надежными для сообществ, которым они призваны служить. В то же время все модели Tiny Aya сохраняют широкое многоязычное покрытие, что делает их гибкими отправными точками для дальнейшей адаптации и исследований», — говорится в заявлении компании.
Компания Cohere отметила, что эти модели, обученные на одном кластере из 64 графических процессоров H100 (высокопроизводительный чип от Nvidia) с использованием относительно скромных вычислительных ресурсов, идеально подходят для исследователей и разработчиков, создающих приложения для аудитории, говорящей на родных языках. Модели способны работать непосредственно на устройствах, поэтому разработчики могут использовать их для автономного перевода. Компания отметила, что разработала базовое программное обеспечение с учетом использования на устройствах, требуя меньше вычислительной мощности, чем большинство сопоставимых моделей.

В странах с разнообразным языковым составом, таких как Индия, подобная возможность работы в автономном режиме может открыть широкий спектр приложений и вариантов использования без необходимости постоянного доступа к интернету.
Модели доступны на HuggingFace, популярной платформе для обмена и тестирования моделей ИИ, а также на платформе Cohere. Разработчики могут загрузить их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания также выпускает обучающие и оценочные наборы данных на HuggingFace и планирует опубликовать технический отчет с подробным описанием своей методологии обучения.
Генеральный директор стартапа Эйдан Гомес заявил в прошлом году, что компания планирует выйти на биржу «вскоре». По данным CNBC, компания завершила 2025 год на позитивной ноте, получив 240 миллионов долларов годовой выручки и продемонстрировав 50-процентный рост по сравнению с предыдущим кварталом.
Источник: techcrunch.com























