Ава Ся, 7 ноября 2025 г. Поделиться:
Вкратце:
Подписи, печати и штампы являются важнейшими признаками подлинности документов. Однако обнаружение этих элементов остается сложной задачей, поскольку они сильно различаются по форме, расположению и качеству. Традиционные системы оптического распознавания символов (OCR) и системы на основе шаблонов часто не справляются с их надежным обнаружением, рассматривая эти визуальные элементы как шум или полностью пропуская их.
Agentic Document Extraction (ADE), основанная на семействе моделей DPT (Document Pre-Trained Transformer) от LandingAI, вводит тип фрагмента аттестации , который явно идентифицирует и структурирует эти элементы как часть структуры документа. Рассматривая каждую аттестацию как единый структурированный объект, ADE сохраняет ее структуру и пространственный контекст, обеспечивая точную, готовую к аудиту экстракцию в больших масштабах.
Этот подход, основанный на визуальном анализе и учитывающий структуру документа, гарантирует, что каждая подпись, штамп и печать будут обнаружены и отображены согласованно, что сокращает объем ручной проверки и обеспечивает сквозную надежность рабочих процессов проверки документов.
Введение
Подписи, печати и штампы являются основой доверия к документам. От контрактов и нотариально заверенных форм до сертификатов и согласий пациентов — они подтверждают подлинность, одобрение и подотчетность. Для регулируемых отраслей отсутствие подтверждения — это не просто проблема форматирования. Это может сделать документ недействительным или полностью остановить процесс.
Несмотря на свою важность, эти визуальные элементы представляют собой постоянную проблему для автоматизированных систем. В реальных документах, таких как финансовые отчеты, страховые полисы или юридические соглашения, блоки подписей и официальные печати появляются рядом с текстом, таблицами и изображениями. Традиционные конвейеры оптического распознавания текста часто полностью пропускают их, рассматривая чернильные штрихи как шум или нечитаемую графику. Системы, основанные на шаблонах, с другой стороны, дают сбой, когда макеты смещаются или печати появляются в неожиданных местах. Результатом является неполное извлечение, ручная коррекция и пробелы в рабочих процессах обеспечения соответствия требованиям.
Система Agentic Document Extraction (ADE) была разработана именно для решения подобных сложных задач. В отличие от конвейеров, ориентированных на текст, ADE — это система, в первую очередь, визуальный ИИ. Она воспринимает документы как визуальные объекты, а не просто наборы текста. Ее агентная система планирует и принимает решения о том, как последовательно извлекать данные в различных форматах и структурах.
Для решения конкретной задачи аттестации ADE вводит тип блока аттестации , который идентифицирует и структурирует подписи, штампы и печати как часть макета документа. Он обнаруживает каждую аттестацию, пространственно привязывает ее к странице и представляет в виде структурированных данных в выходных данных. Это гарантирует, что каждая подпись или печать будет зафиксирована с учетом контекста и точности.
В этой статье мы рассмотрим, как система обнаружения и структурирования ADE выявляет и обрабатывает подтверждения в самых разных реальных документах, от медицинских отчетов и финансовых форм до юридических соглашений.
Типы блоков и блок аттестации
ADE организует документы в семантические блоки , каждый из которых представляет собой целостную единицу, такую как текст, таблицы или рисунки. Каждый блок содержит метаданные, определяющие его тип, содержимое и положение на странице. Эта структура, учитывающая макет, сохраняет то, как информация отображается и взаимодействует визуально внутри документа.
Среди этих типов блоков, блок «Заверение» специально разработан для подписей, штампов и печатей, рассматривая их как структурированные компоненты в макете. Блок «Заверение» визуально изолирует эти элементы и связывает их с окружающим контекстом, обеспечивая их обнаружение и точное отображение в извлеченных данных.
Вот пример того, как система ADE отмечает рукописную подпись как подтверждающий фрагмент в историческом рецепте. Даже несмотря на то, что чернила выцвели, а почерк трудночитаем, система ADE всё равно чётко идентифицирует блок подписи как подписанный и закрепляет его на странице.

Каждое подтверждение также представлено в виде структурированного объекта данных, включающего его тип, текстовое содержимое и ограничивающую рамку.

Теперь, когда мы рассмотрели, как ADE собирает подтверждения на уровне фрагментов, давайте посмотрим на другие примеры из различных реальных документов.
Здравоохранение
Пример: Отчет по лабораторной работе
Этот пример демонстрирует, как система ADE обнаруживает подтверждения в медицинских лабораторных отчетах — типе документов, где точность имеет решающее значение. Лабораторные отчеты часто содержат несколько подписей от техников, патологоанатомов и медицинских директоров, каждая из которых подтверждает достоверность теста и диагноз. Традиционные системы оптического распознавания символов (OCR) с трудом распознают эти рукописные или отсканированные подписи, особенно когда они перекрывают печатный текст или расположены в разных местах.
В данном случае ADE точно идентифицирует три отдельных фрагмента подтверждения, каждый из которых соответствует разному медицинскому специалисту. Система выделяет каждую подпись, фиксирует ее местоположение в отчете и сохраняет окружающий текст, такой как должности и квалификационные данные. Это позволяет автоматически проверять подлинность отчета и поддерживать четкий аудиторский след без ручного вмешательства.

Каждое подтверждение также представлено в структурированном JSON-выводе, включая его ограничивающий прямоугольник, подтип и текстовое содержимое.

Помимо парсинга, ADE также поддерживает извлечение определенных полей с использованием пользовательских схем. В приведенном ниже примере в схеме определены такие поля, как lab_technician, doctor_signature_1 и doctor_signature_2. ADE автоматически сопоставляет каждое поле с соответствующей областью аттестации на странице и извлекает необходимые данные. Это обеспечивает проверку на уровне полей и поддерживает автоматизацию последующих этапов медицинских рабочих процессов.

Пример: Рукописные рецепты от врача
Этот пример демонстрирует, как система ADE выявляет подтверждения в рукописных рецептах — одном из наиболее изменчивых и неструктурированных типов документов в здравоохранении. Рецепты часто сочетают в себе печатные бланки, рукописные заметки и подписи врача, которые различаются по расположению, размеру и четкости.
В этом рецепте система ADE распознает как рукописную подпись врача, так и официальную печать клиники в качестве подтверждающих элементов и связывает их с прилагаемыми печатными данными, такими как имя, квалификация и контактная информация.

Финансы и банковское дело
Пример: Формы KYC и регистрации новых сотрудников.
Документы KYC играют решающую роль в финансовой верификации. К ним относятся выданные государственными органами формы, удостоверения личности и торговые сертификаты, которые часто содержат несколько подтверждений подлинности. Эти подписи и официальные печати имеют решающее значение для соблюдения требований, однако их формат и расположение значительно различаются в разных документах и на разных языках.
В этом примере ADE обрабатывает сертификат кода импортера-экспортера (IEC), регистрационный документ, используемый в Индии для международной торговли. Сертификат содержит текст на английском и хинди, официальную печать синими чернилами и несколько рукописных подписей. ADE точно определяет каждый из этих элементов подтверждения, идентифицируя печать, считывая окружающий двуязычный текст и извлекая имя и должность подписавшего из печатных полей.

Пример: Формы для денежных переводов и транзакций
Финансовые документы часто содержат сочетание рукописных данных, печатных таблиц и многочисленных официальных печатей для подтверждения или утверждения. Эти печати имеют решающее значение для подлинности транзакций.
В этом примере ADE обрабатывает платежную форму, выданную пунктом обмена валюты. Документ содержит красные диагональные штампы с надписью «ПОЛУЧЕНЫ НАЛИЧНЫЕ», а также рукописные записи и табличные данные. ADE распознает штамп как отдельный элемент подтверждения, определяя его цвет, положение и читаемый текст, даже если он перекрывает поля формы.

Правовые вопросы и соблюдение нормативных требований
Пример: Аффидавиты и заявления
Юридические аффидавиты часто представляют собой отсканированные копии исторических или нотариально заверенных документов, четкость которых варьируется в зависимости от возраста и состояния. Несмотря на выцветший текст, помятую бумагу и неровные сканы, ADE точно идентифицирует каждое заверение, сохраняя как содержание, так и пространственное расположение каждой подписи и печати.
В этом примере заверенное заявление включает несколько подписей — от заявителя, нотариуса и органа, удостоверяющего документы. ADE фиксирует каждое заверение как отдельный фрагмент, считывая разборчивые данные, такие как имя, должность и юрисдикция нотариуса, сохраняя при этом визуальную целостность страницы. Даже при наличии почерка, отличающегося точностью, и использовании чернил с низким контрастом, каждая подпись извлекается с точными границами и контекстными описаниями.

Пример: контракты и официальные заявления.
В юридических и государственных указах часто фигурирует множество подписей, каждая из которых представляет отдельный орган или ведомство. В таких документах подписи часто располагаются вертикально или наложенными друг на друга, сопровождаемые печатными именами и должностями.
В этом примере заявления система ADE идентифицирует несколько отдельных фрагментов подтверждения, каждый из которых соответствует отдельному члену совета. Она определяет расположение, цвет и стиль каждой рукописной подписи, связывая ее с соответствующей печатной должностью, например, «Председатель округа» или «Заместитель председателя». Структурируя эти подтверждения вместе, ADE предоставляет четкую, машиночитаемую запись о том, кто подписал, где и в каком порядке.

Заключение
От лабораторных анализов и рецептов до торговых сертификатов и заявлений под присягой — заверения являются основой подлинности документов. Однако они относятся к числу наиболее сложных элементов для обнаружения и точного оформления.
С помощью блока подтверждения ADE извлекает подписи, печати и штампы в виде структурированных данных в структуре документа. Каждое подтверждение извлекается с сохранением его положения и контекста, что гарантирует сохранность всей важной информации.
Это делает проверку документов быстрее, более последовательной и полностью поддающейся аудиту во всех отраслях, превращая этап ручной проверки в надежный автоматизированный процесс.
Готовы начать?
Протестируйте ADE в режиме реального времени, используя свои документы в Visual Playground.
Содержание
Источник: landing.ai





















