Image

Tensormesh привлекает $4,5 млн для повышения эффективности работы серверов ИИ

изображение гуманоидной руки, тянущейся к человеческой руке
Авторы изображений: Витхун Кхамсонг / Getty Images

В условиях, когда развитие инфраструктуры искусственного интеллекта достигает ошеломляющих масштабов, необходимость выжать максимум из имеющихся графических процессоров становится всё более острой. А для исследователей, обладающих опытом в определённой области, сейчас самое подходящее время для привлечения финансирования.

Это одна из движущих сил проекта Tensormesh, который на этой неделе был запущен из тайны, получив начальное финансирование в размере 4,5 млн долларов. Инвестиции возглавил Laude Ventures, а дополнительное финансирование было предоставлено пионером в области баз данных Майклом Франклином.

Tensormesh использует эти средства для создания коммерческой версии утилиты LMCache с открытым исходным кодом, запущенной и поддерживаемой соучредителем Tensormesh Ихуа Чэном. При правильном использовании LMCache может снизить затраты на вывод до 10 раз — эта способность сделала его основным инструментом для внедрения решений с открытым исходным кодом и привлекла внимание таких крупных игроков, как Google и Nvidia. Теперь Tensormesh планирует превратить эту академическую репутацию в жизнеспособный бизнес.

Основой продукта является кэш «ключ-значение» (или кэш KV) — система памяти, используемая для более эффективной обработки сложных входных данных путём сжатия их до значений ключей. В традиционных архитектурах кэш KV очищается после каждого запроса, но соучредитель и генеральный директор Tensormesh Цзюньчэнь Цзян утверждает, что это серьёзный источник неэффективности.

«Это как если бы очень умный аналитик считывал все данные, но после каждого вопроса забывал, чему научился», — говорит Цзян.

Вместо того, чтобы удалять этот кэш, системы Tensormesh сохраняют его, позволяя повторно использовать при выполнении моделью аналогичного процесса в отдельном запросе. Поскольку память графического процессора очень ценна, это может означать распределение данных по нескольким различным уровням хранения, но наградой за это становится значительно более высокая производительность вывода при той же нагрузке на сервер.

Это изменение особенно важно для интерфейсов чата, поскольку моделям необходимо постоянно обращаться к растущему журналу чата по мере развития разговора. Агентские системы сталкиваются с аналогичной проблемой: журнал действий и целей постоянно растёт.

Теоретически, компании, занимающиеся разработкой ИИ, могут реализовать эти изменения самостоятельно, но техническая сложность делает эту задачу непростой. Учитывая проделанную командой Tensormesh работу по исследованию процесса и сложность самих деталей, компания рассчитывает на большой спрос на готовый продукт.

«Хранить кэш KV во вторичной системе хранения и эффективно использовать его повторно, не замедляя работу всей системы, — очень сложная задача», — говорит Цзян. «Мы видели, как люди нанимали 20 инженеров и тратили три-четыре месяца на создание такой системы. Или же они могут использовать наш продукт и сделать это очень эффективно».

Источник: techcrunch.com

✅ Найденные теги: Tensormesh, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых