Линейное внимание без тормозов: Qwen ускорили GDN в 2–3 раза…

Линейное внимание без тормозов: Qwen ускорили GDN в 2–3 раза Alibaba (команда Qwen) выложила open-source ядра линейного внимания — библиотеку…