
Соучредитель и генеральный директор компании ElevenLabs, занимающейся разработкой аудиорешений на основе искусственного интеллекта, Мати Станишевски полагает, что со временем модели искусственного интеллекта станут общедоступными, и это показательный комментарий для компании, которая сегодня сосредоточена на их создании.
Выступая во вторник на конференции TechCrunch Disrupt 2025, основатель ElevenLabs рассказал о своих краткосрочных и долгосрочных планах развития сферы аудиотехнологий на базе искусственного интеллекта.
Станишевски заявил, что исследователям его компании удалось решить некоторые проблемы архитектуры модели, и эта работа будет продолжена в аудиопространстве в течение следующего года или двух.
«В долгосрочной перспективе, в течение следующих нескольких лет, это станет обычным делом», — сказал Станишевски. «Даже если различия и будут — что, я думаю, будет правдой для некоторых голосов, некоторых языков — сами по себе они будут меньше».
На вопрос, почему ElevenLabs сосредоточилась на создании моделей, если он считал, что со временем они станут массовым товаром, Станишевски ответил, что в краткосрочной перспективе они по-прежнему являются «самым большим преимуществом и самым большим шагом вперед, который вы можете сделать сегодня».
Например, если голоса или взаимодействия ИИ звучат не очень хорошо, это все равно проблема, которую необходимо решить.
«Единственный способ решить эту проблему — это… построить модели самостоятельно, а затем, со временем, найдутся и другие игроки, которые тоже это решат», — сказал Станишевски.
Он также отметил, что те, кто ищет надежные, масштабируемые варианты использования, скорее всего, по-прежнему будут использовать разные модели для разных вариантов использования.
Однако, по словам Станишевски, в ближайшие год-два все большее число моделей перейдет к мультимодальным или смешанным подходам.
«Таким образом, вы будете создавать аудио и видео одновременно или аудио и LLM одновременно в разговорной обстановке», — сказал он, указав на Veo 3 от Google в качестве примера того, чего можно достичь при объединении моделей.
Основатель компании заявил, что ElevenLabs планирует начать сотрудничество с другими компаниями и работать с технологиями с открытым исходным кодом, чтобы понять, сможет ли компания объединить свой опыт в области аудиотехнологий с опытом других моделей.
По его словам, цель ElevenLabs — сосредоточиться как на создании моделей, так и на их применении для создания долгосрочной ценности.
«Точно так же, как программное обеспечение и оборудование стали магией для Apple, мы считаем, что продукт и искусственный интеллект станут магией для создания наилучших вариантов использования», — добавил он.
Источник: techcrunch.com























