Tavus выпустили Sparrow-0 — диалоговую аудио-видео модель для живого общения
Это realtime-модель, заточенная под естественные разговоры в видео, где важно не «отвечать», а чувствовать диалог.
Что умеет Sparrow-0:
— Понимает, кто сейчас ведёт разговор, и не перебивает
— Работает с потоковым аудио без задержек, учитывая контекст
— Адаптируется под конкретного собеседника: темп речи, паузы, манеру
— Корректно обрабатывает «э-э», «м-м», обрывы фраз и перебивания
— Реагирует мгновенно, если намерение ясно, и ждёт, если есть неопределённость
По тестам:
— 100% точность и полнота
— 0 перебиваний
— Среднее время отклика — 55 мс
По сути, это шаг от «говорящих ИИ» к моделям, которые реально умеют вести диалог, а не просто ждать конца фразы.























