Chandra — новая OCR-модель, которая превращает PDF и изображения в текст
Команда Datalab представила Chandra — мощную модель распознавания текста, которая превращает PDF, сканы и картинки в удобные документы.
Что умеет:
— Конвертирует файлы в HTML, Markdown или JSON;
— Корректно извлекает таблицы, формулы и диаграммы;
— Поддерживает более 40 языков;
— В тестах обходит DeepSeek, Mistral и другие OCR-модели;
— Работает прямо в браузере или ставится локально;
— Полностью бесплатна.
Попробовать онлайн можно здесь, а установить локально — на GitHub.
























