Nvidia заявляет, что может уменьшить объем памяти LLM в 20 раз без изменения весовых коэффициентов модели.

Бен Диксон Источник изображения: VentureBeat с ChatGPT Исследователи Nvidia представили новую методику, которая значительно сокращает объем…