Image

Обнаружение штампов и подписей на документах с помощью ADE

780a8c1c725d6c223735cdaad69ebe45 Ава Ся Ава Ся, Поделиться:

Вкратце:

Подписи, печати и штампы являются важнейшими признаками подлинности документов. Однако обнаружение этих элементов остается сложной задачей, поскольку они сильно различаются по форме, расположению и качеству. Традиционные системы оптического распознавания символов (OCR) и системы на основе шаблонов часто не справляются с их надежным обнаружением, рассматривая эти визуальные элементы как шум или полностью пропуская их.

Agentic Document Extraction (ADE), основанная на семействе моделей DPT (Document Pre-Trained Transformer) от LandingAI, вводит тип фрагмента аттестации , который явно идентифицирует и структурирует эти элементы как часть структуры документа. Рассматривая каждую аттестацию как единый структурированный объект, ADE сохраняет ее структуру и пространственный контекст, обеспечивая точную, готовую к аудиту экстракцию в больших масштабах.

Этот подход, основанный на визуальном анализе и учитывающий структуру документа, гарантирует, что каждая подпись, штамп и печать будут обнаружены и отображены согласованно, что сокращает объем ручной проверки и обеспечивает сквозную надежность рабочих процессов проверки документов.

Введение

Подписи, печати и штампы являются основой доверия к документам. От контрактов и нотариально заверенных форм до сертификатов и согласий пациентов — они подтверждают подлинность, одобрение и подотчетность. Для регулируемых отраслей отсутствие подтверждения — это не просто проблема форматирования. Это может сделать документ недействительным или полностью остановить процесс.

Несмотря на свою важность, эти визуальные элементы представляют собой постоянную проблему для автоматизированных систем. В реальных документах, таких как финансовые отчеты, страховые полисы или юридические соглашения, блоки подписей и официальные печати появляются рядом с текстом, таблицами и изображениями. Традиционные конвейеры оптического распознавания текста часто полностью пропускают их, рассматривая чернильные штрихи как шум или нечитаемую графику. Системы, основанные на шаблонах, с другой стороны, дают сбой, когда макеты смещаются или печати появляются в неожиданных местах. Результатом является неполное извлечение, ручная коррекция и пробелы в рабочих процессах обеспечения соответствия требованиям.

Система Agentic Document Extraction (ADE) была разработана именно для решения подобных сложных задач. В отличие от конвейеров, ориентированных на текст, ADE — это система, в первую очередь, визуальный ИИ. Она воспринимает документы как визуальные объекты, а не просто наборы текста. Ее агентная система планирует и принимает решения о том, как последовательно извлекать данные в различных форматах и структурах.

Для решения конкретной задачи аттестации ADE вводит тип блока аттестации , который идентифицирует и структурирует подписи, штампы и печати как часть макета документа. Он обнаруживает каждую аттестацию, пространственно привязывает ее к странице и представляет в виде структурированных данных в выходных данных. Это гарантирует, что каждая подпись или печать будет зафиксирована с учетом контекста и точности.

В этой статье мы рассмотрим, как система обнаружения и структурирования ADE выявляет и обрабатывает подтверждения в самых разных реальных документах, от медицинских отчетов и финансовых форм до юридических соглашений.

Типы блоков и блок аттестации

ADE организует документы в семантические блоки , каждый из которых представляет собой целостную единицу, такую как текст, таблицы или рисунки. Каждый блок содержит метаданные, определяющие его тип, содержимое и положение на странице. Эта структура, учитывающая макет, сохраняет то, как информация отображается и взаимодействует визуально внутри документа.

Среди этих типов блоков, блок «Заверение» специально разработан для подписей, штампов и печатей, рассматривая их как структурированные компоненты в макете. Блок «Заверение» визуально изолирует эти элементы и связывает их с окружающим контекстом, обеспечивая их обнаружение и точное отображение в извлеченных данных.

Вот пример того, как система ADE отмечает рукописную подпись как подтверждающий фрагмент в историческом рецепте. Даже несмотря на то, что чернила выцвели, а почерк трудночитаем, система ADE всё равно чётко идентифицирует блок подписи как подписанный и закрепляет его на странице.

feab87a96dcefaee042ebba0ab8d6294

Каждое подтверждение также представлено в виде структурированного объекта данных, включающего его тип, текстовое содержимое и ограничивающую рамку.

4c5f3f3f1fbfda13d0ae62f2161b2488

Теперь, когда мы рассмотрели, как ADE собирает подтверждения на уровне фрагментов, давайте посмотрим на другие примеры из различных реальных документов.

Здравоохранение

Пример: Отчет по лабораторной работе

Этот пример демонстрирует, как система ADE обнаруживает подтверждения в медицинских лабораторных отчетах — типе документов, где точность имеет решающее значение. Лабораторные отчеты часто содержат несколько подписей от техников, патологоанатомов и медицинских директоров, каждая из которых подтверждает достоверность теста и диагноз. Традиционные системы оптического распознавания символов (OCR) с трудом распознают эти рукописные или отсканированные подписи, особенно когда они перекрывают печатный текст или расположены в разных местах.

В данном случае ADE точно идентифицирует три отдельных фрагмента подтверждения, каждый из которых соответствует разному медицинскому специалисту. Система выделяет каждую подпись, фиксирует ее местоположение в отчете и сохраняет окружающий текст, такой как должности и квалификационные данные. Это позволяет автоматически проверять подлинность отчета и поддерживать четкий аудиторский след без ручного вмешательства.

5853c1f7e04c2a0ac56d26efbc2d8712

Каждое подтверждение также представлено в структурированном JSON-выводе, включая его ограничивающий прямоугольник, подтип и текстовое содержимое.

22b13c3503a7fe20093491055b7e7e3f

Помимо парсинга, ADE также поддерживает извлечение определенных полей с использованием пользовательских схем. В приведенном ниже примере в схеме определены такие поля, как lab_technician, doctor_signature_1 и doctor_signature_2. ADE автоматически сопоставляет каждое поле с соответствующей областью аттестации на странице и извлекает необходимые данные. Это обеспечивает проверку на уровне полей и поддерживает автоматизацию последующих этапов медицинских рабочих процессов.

e4138374b94e8008d92d6758df7c34f0

Пример: Рукописные рецепты от врача

Этот пример демонстрирует, как система ADE выявляет подтверждения в рукописных рецептах — одном из наиболее изменчивых и неструктурированных типов документов в здравоохранении. Рецепты часто сочетают в себе печатные бланки, рукописные заметки и подписи врача, которые различаются по расположению, размеру и четкости.

В этом рецепте система ADE распознает как рукописную подпись врача, так и официальную печать клиники в качестве подтверждающих элементов и связывает их с прилагаемыми печатными данными, такими как имя, квалификация и контактная информация.

bc7196e30910a5f3c89365d20c0db6af

Финансы и банковское дело

Пример: Формы KYC и регистрации новых сотрудников.

Документы KYC играют решающую роль в финансовой верификации. К ним относятся выданные государственными органами формы, удостоверения личности и торговые сертификаты, которые часто содержат несколько подтверждений подлинности. Эти подписи и официальные печати имеют решающее значение для соблюдения требований, однако их формат и расположение значительно различаются в разных документах и на разных языках.

В этом примере ADE обрабатывает сертификат кода импортера-экспортера (IEC), регистрационный документ, используемый в Индии для международной торговли. Сертификат содержит текст на английском и хинди, официальную печать синими чернилами и несколько рукописных подписей. ADE точно определяет каждый из этих элементов подтверждения, идентифицируя печать, считывая окружающий двуязычный текст и извлекая имя и должность подписавшего из печатных полей.

657617c1f4ced6db25573bdd187002ed

Пример: Формы для денежных переводов и транзакций

Финансовые документы часто содержат сочетание рукописных данных, печатных таблиц и многочисленных официальных печатей для подтверждения или утверждения. Эти печати имеют решающее значение для подлинности транзакций.

В этом примере ADE обрабатывает платежную форму, выданную пунктом обмена валюты. Документ содержит красные диагональные штампы с надписью «ПОЛУЧЕНЫ НАЛИЧНЫЕ», а также рукописные записи и табличные данные. ADE распознает штамп как отдельный элемент подтверждения, определяя его цвет, положение и читаемый текст, даже если он перекрывает поля формы.

f5d20db4ad482ce411c51606d100b9d2

Пример: Аффидавиты и заявления

Юридические аффидавиты часто представляют собой отсканированные копии исторических или нотариально заверенных документов, четкость которых варьируется в зависимости от возраста и состояния. Несмотря на выцветший текст, помятую бумагу и неровные сканы, ADE точно идентифицирует каждое заверение, сохраняя как содержание, так и пространственное расположение каждой подписи и печати.

В этом примере заверенное заявление включает несколько подписей — от заявителя, нотариуса и органа, удостоверяющего документы. ADE фиксирует каждое заверение как отдельный фрагмент, считывая разборчивые данные, такие как имя, должность и юрисдикция нотариуса, сохраняя при этом визуальную целостность страницы. Даже при наличии почерка, отличающегося точностью, и использовании чернил с низким контрастом, каждая подпись извлекается с точными границами и контекстными описаниями.

8c3bc4d42ab036552de19477943af167

Пример: контракты и официальные заявления.

В юридических и государственных указах часто фигурирует множество подписей, каждая из которых представляет отдельный орган или ведомство. В таких документах подписи часто располагаются вертикально или наложенными друг на друга, сопровождаемые печатными именами и должностями.

В этом примере заявления система ADE идентифицирует несколько отдельных фрагментов подтверждения, каждый из которых соответствует отдельному члену совета. Она определяет расположение, цвет и стиль каждой рукописной подписи, связывая ее с соответствующей печатной должностью, например, «Председатель округа» или «Заместитель председателя». Структурируя эти подтверждения вместе, ADE предоставляет четкую, машиночитаемую запись о том, кто подписал, где и в каком порядке.

9e6b245fcadb0db01a8533d78c642acf

Заключение

От лабораторных анализов и рецептов до торговых сертификатов и заявлений под присягой — заверения являются основой подлинности документов. Однако они относятся к числу наиболее сложных элементов для обнаружения и точного оформления.

С помощью блока подтверждения ADE извлекает подписи, печати и штампы в виде структурированных данных в структуре документа. Каждое подтверждение извлекается с сохранением его положения и контекста, что гарантирует сохранность всей важной информации.

Это делает проверку документов быстрее, более последовательной и полностью поддающейся аудиту во всех отраслях, превращая этап ручной проверки в надежный автоматизированный процесс.

Готовы начать?

Протестируйте ADE в режиме реального времени, используя свои документы в Visual Playground.

Содержание

Источник: landing.ai

✅ Найденные теги: ADE, документы, новости, Обнаружение, Подписи, Штампы

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Современная лаборатория с учеными в белых халатах и высокотехнологичным оборудованием.
Цветные полосы на экране, символизирующие обработку данных или анализ ДНК.
Спикер с микрофоном на AI Impact Summit, цветы на столе, яркий фон.
Астероид пролетает рядом с планетой среди космических просторов.
Новое светоактивируемое покрытие способно убивать стойкие микробы
Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.
ИИ-микрофон Echomic превращает речь в текст
Методология облучения 1-гексаноловых растворов: этапы исследования и анализ.
Agentic RAG против Classic RAG: от конвейера к контуру управления
Image Not Found
Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.

Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.

Жан-Поль Торбьорнсен — лидер THORChain, блокчейна, который, как предполагалось, не должен иметь лидеров, и который сейчас переживает череду…

Мар 13, 2026
ИИ-микрофон Echomic превращает речь в текст

ИИ-микрофон Echomic превращает речь в текст

Смарт-микрофон Echomic с искусственным интеллектом — это удобный инструмент для записи голоса, преобразования его в текст и управления…

Мар 13, 2026
Методология облучения 1-гексаноловых растворов: этапы исследования и анализ.

Разработан подход к выявлению облученных пищевых продуктов

Этапы исследования© MoleculesУчёные НИИ ядерной физики, физического и химического факультетов МГУ изучили влияние ионизирующего излучения…

Мар 13, 2026
Agentic RAG против Classic RAG: от конвейера к контуру управления

Agentic RAG против Classic RAG: от конвейера к контуру управления

Практическое руководство по выбору между однопроходными конвейерами и адаптивными циклами извлечения данных в зависимости от сложности,…

Мар 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых