ATLAS: Практические законы масштабирования для многоязычных моделей

Мы представляем новые законы масштабирования для многоязычных языковых моделей. ATLAS предоставляет рекомендации по смешиванию данных и обучению наиболее эффективных моделей…