Image

Обнаружение штампов и подписей на документах с помощью ADE

780a8c1c725d6c223735cdaad69ebe45 Ава Ся Ава Ся, Поделиться:

Вкратце:

Подписи, печати и штампы являются важнейшими признаками подлинности документов. Однако обнаружение этих элементов остается сложной задачей, поскольку они сильно различаются по форме, расположению и качеству. Традиционные системы оптического распознавания символов (OCR) и системы на основе шаблонов часто не справляются с их надежным обнаружением, рассматривая эти визуальные элементы как шум или полностью пропуская их.

Agentic Document Extraction (ADE), основанная на семействе моделей DPT (Document Pre-Trained Transformer) от LandingAI, вводит тип фрагмента аттестации , который явно идентифицирует и структурирует эти элементы как часть структуры документа. Рассматривая каждую аттестацию как единый структурированный объект, ADE сохраняет ее структуру и пространственный контекст, обеспечивая точную, готовую к аудиту экстракцию в больших масштабах.

Этот подход, основанный на визуальном анализе и учитывающий структуру документа, гарантирует, что каждая подпись, штамп и печать будут обнаружены и отображены согласованно, что сокращает объем ручной проверки и обеспечивает сквозную надежность рабочих процессов проверки документов.

Введение

Подписи, печати и штампы являются основой доверия к документам. От контрактов и нотариально заверенных форм до сертификатов и согласий пациентов — они подтверждают подлинность, одобрение и подотчетность. Для регулируемых отраслей отсутствие подтверждения — это не просто проблема форматирования. Это может сделать документ недействительным или полностью остановить процесс.

Несмотря на свою важность, эти визуальные элементы представляют собой постоянную проблему для автоматизированных систем. В реальных документах, таких как финансовые отчеты, страховые полисы или юридические соглашения, блоки подписей и официальные печати появляются рядом с текстом, таблицами и изображениями. Традиционные конвейеры оптического распознавания текста часто полностью пропускают их, рассматривая чернильные штрихи как шум или нечитаемую графику. Системы, основанные на шаблонах, с другой стороны, дают сбой, когда макеты смещаются или печати появляются в неожиданных местах. Результатом является неполное извлечение, ручная коррекция и пробелы в рабочих процессах обеспечения соответствия требованиям.

Система Agentic Document Extraction (ADE) была разработана именно для решения подобных сложных задач. В отличие от конвейеров, ориентированных на текст, ADE — это система, в первую очередь, визуальный ИИ. Она воспринимает документы как визуальные объекты, а не просто наборы текста. Ее агентная система планирует и принимает решения о том, как последовательно извлекать данные в различных форматах и структурах.

Для решения конкретной задачи аттестации ADE вводит тип блока аттестации , который идентифицирует и структурирует подписи, штампы и печати как часть макета документа. Он обнаруживает каждую аттестацию, пространственно привязывает ее к странице и представляет в виде структурированных данных в выходных данных. Это гарантирует, что каждая подпись или печать будет зафиксирована с учетом контекста и точности.

В этой статье мы рассмотрим, как система обнаружения и структурирования ADE выявляет и обрабатывает подтверждения в самых разных реальных документах, от медицинских отчетов и финансовых форм до юридических соглашений.

Типы блоков и блок аттестации

ADE организует документы в семантические блоки , каждый из которых представляет собой целостную единицу, такую как текст, таблицы или рисунки. Каждый блок содержит метаданные, определяющие его тип, содержимое и положение на странице. Эта структура, учитывающая макет, сохраняет то, как информация отображается и взаимодействует визуально внутри документа.

Среди этих типов блоков, блок «Заверение» специально разработан для подписей, штампов и печатей, рассматривая их как структурированные компоненты в макете. Блок «Заверение» визуально изолирует эти элементы и связывает их с окружающим контекстом, обеспечивая их обнаружение и точное отображение в извлеченных данных.

Вот пример того, как система ADE отмечает рукописную подпись как подтверждающий фрагмент в историческом рецепте. Даже несмотря на то, что чернила выцвели, а почерк трудночитаем, система ADE всё равно чётко идентифицирует блок подписи как подписанный и закрепляет его на странице.

feab87a96dcefaee042ebba0ab8d6294

Каждое подтверждение также представлено в виде структурированного объекта данных, включающего его тип, текстовое содержимое и ограничивающую рамку.

4c5f3f3f1fbfda13d0ae62f2161b2488

Теперь, когда мы рассмотрели, как ADE собирает подтверждения на уровне фрагментов, давайте посмотрим на другие примеры из различных реальных документов.

Здравоохранение

Пример: Отчет по лабораторной работе

Этот пример демонстрирует, как система ADE обнаруживает подтверждения в медицинских лабораторных отчетах — типе документов, где точность имеет решающее значение. Лабораторные отчеты часто содержат несколько подписей от техников, патологоанатомов и медицинских директоров, каждая из которых подтверждает достоверность теста и диагноз. Традиционные системы оптического распознавания символов (OCR) с трудом распознают эти рукописные или отсканированные подписи, особенно когда они перекрывают печатный текст или расположены в разных местах.

В данном случае ADE точно идентифицирует три отдельных фрагмента подтверждения, каждый из которых соответствует разному медицинскому специалисту. Система выделяет каждую подпись, фиксирует ее местоположение в отчете и сохраняет окружающий текст, такой как должности и квалификационные данные. Это позволяет автоматически проверять подлинность отчета и поддерживать четкий аудиторский след без ручного вмешательства.

5853c1f7e04c2a0ac56d26efbc2d8712

Каждое подтверждение также представлено в структурированном JSON-выводе, включая его ограничивающий прямоугольник, подтип и текстовое содержимое.

22b13c3503a7fe20093491055b7e7e3f

Помимо парсинга, ADE также поддерживает извлечение определенных полей с использованием пользовательских схем. В приведенном ниже примере в схеме определены такие поля, как lab_technician, doctor_signature_1 и doctor_signature_2. ADE автоматически сопоставляет каждое поле с соответствующей областью аттестации на странице и извлекает необходимые данные. Это обеспечивает проверку на уровне полей и поддерживает автоматизацию последующих этапов медицинских рабочих процессов.

e4138374b94e8008d92d6758df7c34f0

Пример: Рукописные рецепты от врача

Этот пример демонстрирует, как система ADE выявляет подтверждения в рукописных рецептах — одном из наиболее изменчивых и неструктурированных типов документов в здравоохранении. Рецепты часто сочетают в себе печатные бланки, рукописные заметки и подписи врача, которые различаются по расположению, размеру и четкости.

В этом рецепте система ADE распознает как рукописную подпись врача, так и официальную печать клиники в качестве подтверждающих элементов и связывает их с прилагаемыми печатными данными, такими как имя, квалификация и контактная информация.

bc7196e30910a5f3c89365d20c0db6af

Финансы и банковское дело

Пример: Формы KYC и регистрации новых сотрудников.

Документы KYC играют решающую роль в финансовой верификации. К ним относятся выданные государственными органами формы, удостоверения личности и торговые сертификаты, которые часто содержат несколько подтверждений подлинности. Эти подписи и официальные печати имеют решающее значение для соблюдения требований, однако их формат и расположение значительно различаются в разных документах и на разных языках.

В этом примере ADE обрабатывает сертификат кода импортера-экспортера (IEC), регистрационный документ, используемый в Индии для международной торговли. Сертификат содержит текст на английском и хинди, официальную печать синими чернилами и несколько рукописных подписей. ADE точно определяет каждый из этих элементов подтверждения, идентифицируя печать, считывая окружающий двуязычный текст и извлекая имя и должность подписавшего из печатных полей.

657617c1f4ced6db25573bdd187002ed

Пример: Формы для денежных переводов и транзакций

Финансовые документы часто содержат сочетание рукописных данных, печатных таблиц и многочисленных официальных печатей для подтверждения или утверждения. Эти печати имеют решающее значение для подлинности транзакций.

В этом примере ADE обрабатывает платежную форму, выданную пунктом обмена валюты. Документ содержит красные диагональные штампы с надписью «ПОЛУЧЕНЫ НАЛИЧНЫЕ», а также рукописные записи и табличные данные. ADE распознает штамп как отдельный элемент подтверждения, определяя его цвет, положение и читаемый текст, даже если он перекрывает поля формы.

f5d20db4ad482ce411c51606d100b9d2

Пример: Аффидавиты и заявления

Юридические аффидавиты часто представляют собой отсканированные копии исторических или нотариально заверенных документов, четкость которых варьируется в зависимости от возраста и состояния. Несмотря на выцветший текст, помятую бумагу и неровные сканы, ADE точно идентифицирует каждое заверение, сохраняя как содержание, так и пространственное расположение каждой подписи и печати.

В этом примере заверенное заявление включает несколько подписей — от заявителя, нотариуса и органа, удостоверяющего документы. ADE фиксирует каждое заверение как отдельный фрагмент, считывая разборчивые данные, такие как имя, должность и юрисдикция нотариуса, сохраняя при этом визуальную целостность страницы. Даже при наличии почерка, отличающегося точностью, и использовании чернил с низким контрастом, каждая подпись извлекается с точными границами и контекстными описаниями.

8c3bc4d42ab036552de19477943af167

Пример: контракты и официальные заявления.

В юридических и государственных указах часто фигурирует множество подписей, каждая из которых представляет отдельный орган или ведомство. В таких документах подписи часто располагаются вертикально или наложенными друг на друга, сопровождаемые печатными именами и должностями.

В этом примере заявления система ADE идентифицирует несколько отдельных фрагментов подтверждения, каждый из которых соответствует отдельному члену совета. Она определяет расположение, цвет и стиль каждой рукописной подписи, связывая ее с соответствующей печатной должностью, например, «Председатель округа» или «Заместитель председателя». Структурируя эти подтверждения вместе, ADE предоставляет четкую, машиночитаемую запись о том, кто подписал, где и в каком порядке.

9e6b245fcadb0db01a8533d78c642acf

Заключение

От лабораторных анализов и рецептов до торговых сертификатов и заявлений под присягой — заверения являются основой подлинности документов. Однако они относятся к числу наиболее сложных элементов для обнаружения и точного оформления.

С помощью блока подтверждения ADE извлекает подписи, печати и штампы в виде структурированных данных в структуре документа. Каждое подтверждение извлекается с сохранением его положения и контекста, что гарантирует сохранность всей важной информации.

Это делает проверку документов быстрее, более последовательной и полностью поддающейся аудиту во всех отраслях, превращая этап ручной проверки в надежный автоматизированный процесс.

Готовы начать?

Протестируйте ADE в режиме реального времени, используя свои документы в Visual Playground.

Содержание

Источник: landing.ai

✅ Найденные теги: ADE, документы, новости, Обнаружение, Подписи, Штампы

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Новое светоактивируемое покрытие способно убивать стойкие микробы
Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.
Анонс программы «Чудо техники» на 15 марта 2026
ИИ-микрофон Echomic превращает речь в текст
Методология облучения 1-гексаноловых растворов: этапы исследования и анализ.
Agentic RAG против Classic RAG: от конвейера к контуру управления
Uber, Wayve и Nissan планируют запустить сервис роботакси в Токио в этом году.
ideipro logotyp
Врачи играют все более важную роль в оценке инструментов искусственного интеллекта для здравоохранения | MobiHealthNews
Image Not Found
Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.

Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.

Жан-Поль Торбьорнсен — лидер THORChain, блокчейна, который, как предполагалось, не должен иметь лидеров, и который сейчас переживает череду дорогостоящих скандалов. 18 февраля 2026 г. Каган Маклеод «Сейчас мы вне воздушного пространства. Мы можем делать все, что захотим»,…

Мар 13, 2026
Анонс программы «Чудо техники» на 15 марта 2026

Анонс программы «Чудо техники» на 15 марта 2026

В новом выпуске программы «Чудо техники» с Сергеем Малозёмовым»: Гены подскажут: кому грозит болезнь Альцгеймера и как её распознать на ранних стадиях? Правда ли питаться готовой едой выгоднее, чем домашней? Как работает кухня доставки?  В рубрике «Чудо-товары»…

Мар 13, 2026
ИИ-микрофон Echomic превращает речь в текст

ИИ-микрофон Echomic превращает речь в текст

Смарт-микрофон Echomic с искусственным интеллектом — это удобный инструмент для записи голоса, преобразования его в текст и управления мультимедийными задачами.  Новинка спроектирована как компактный микрофон, которая крепится на одежду, чтобы захватывать голос чисто и без лишнего шума.…

Мар 13, 2026
Методология облучения 1-гексаноловых растворов: этапы исследования и анализ.

Разработан подход к выявлению облученных пищевых продуктов

Этапы исследования © Molecules Учёные НИИ ядерной физики, физического и химического факультетов МГУ изучили влияние ионизирующего излучения на образование летучих органических соединений, содержащихся в продуктах питания. Исследование имеет важное значение для разработки уникальных биохимических маркеров радиационной обработки…

Мар 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых