Image

Обнаружение штампов и подписей на документах с помощью ADE

780a8c1c725d6c223735cdaad69ebe45 Ава Ся Ава Ся, Поделиться:

Вкратце:

Подписи, печати и штампы являются важнейшими признаками подлинности документов. Однако обнаружение этих элементов остается сложной задачей, поскольку они сильно различаются по форме, расположению и качеству. Традиционные системы оптического распознавания символов (OCR) и системы на основе шаблонов часто не справляются с их надежным обнаружением, рассматривая эти визуальные элементы как шум или полностью пропуская их.

Agentic Document Extraction (ADE), основанная на семействе моделей DPT (Document Pre-Trained Transformer) от LandingAI, вводит тип фрагмента аттестации , который явно идентифицирует и структурирует эти элементы как часть структуры документа. Рассматривая каждую аттестацию как единый структурированный объект, ADE сохраняет ее структуру и пространственный контекст, обеспечивая точную, готовую к аудиту экстракцию в больших масштабах.

Этот подход, основанный на визуальном анализе и учитывающий структуру документа, гарантирует, что каждая подпись, штамп и печать будут обнаружены и отображены согласованно, что сокращает объем ручной проверки и обеспечивает сквозную надежность рабочих процессов проверки документов.

Введение

Подписи, печати и штампы являются основой доверия к документам. От контрактов и нотариально заверенных форм до сертификатов и согласий пациентов — они подтверждают подлинность, одобрение и подотчетность. Для регулируемых отраслей отсутствие подтверждения — это не просто проблема форматирования. Это может сделать документ недействительным или полностью остановить процесс.

Несмотря на свою важность, эти визуальные элементы представляют собой постоянную проблему для автоматизированных систем. В реальных документах, таких как финансовые отчеты, страховые полисы или юридические соглашения, блоки подписей и официальные печати появляются рядом с текстом, таблицами и изображениями. Традиционные конвейеры оптического распознавания текста часто полностью пропускают их, рассматривая чернильные штрихи как шум или нечитаемую графику. Системы, основанные на шаблонах, с другой стороны, дают сбой, когда макеты смещаются или печати появляются в неожиданных местах. Результатом является неполное извлечение, ручная коррекция и пробелы в рабочих процессах обеспечения соответствия требованиям.

Система Agentic Document Extraction (ADE) была разработана именно для решения подобных сложных задач. В отличие от конвейеров, ориентированных на текст, ADE — это система, в первую очередь, визуальный ИИ. Она воспринимает документы как визуальные объекты, а не просто наборы текста. Ее агентная система планирует и принимает решения о том, как последовательно извлекать данные в различных форматах и структурах.

Для решения конкретной задачи аттестации ADE вводит тип блока аттестации , который идентифицирует и структурирует подписи, штампы и печати как часть макета документа. Он обнаруживает каждую аттестацию, пространственно привязывает ее к странице и представляет в виде структурированных данных в выходных данных. Это гарантирует, что каждая подпись или печать будет зафиксирована с учетом контекста и точности.

В этой статье мы рассмотрим, как система обнаружения и структурирования ADE выявляет и обрабатывает подтверждения в самых разных реальных документах, от медицинских отчетов и финансовых форм до юридических соглашений.

Типы блоков и блок аттестации

ADE организует документы в семантические блоки , каждый из которых представляет собой целостную единицу, такую как текст, таблицы или рисунки. Каждый блок содержит метаданные, определяющие его тип, содержимое и положение на странице. Эта структура, учитывающая макет, сохраняет то, как информация отображается и взаимодействует визуально внутри документа.

Среди этих типов блоков, блок «Заверение» специально разработан для подписей, штампов и печатей, рассматривая их как структурированные компоненты в макете. Блок «Заверение» визуально изолирует эти элементы и связывает их с окружающим контекстом, обеспечивая их обнаружение и точное отображение в извлеченных данных.

Вот пример того, как система ADE отмечает рукописную подпись как подтверждающий фрагмент в историческом рецепте. Даже несмотря на то, что чернила выцвели, а почерк трудночитаем, система ADE всё равно чётко идентифицирует блок подписи как подписанный и закрепляет его на странице.

feab87a96dcefaee042ebba0ab8d6294

Каждое подтверждение также представлено в виде структурированного объекта данных, включающего его тип, текстовое содержимое и ограничивающую рамку.

4c5f3f3f1fbfda13d0ae62f2161b2488

Теперь, когда мы рассмотрели, как ADE собирает подтверждения на уровне фрагментов, давайте посмотрим на другие примеры из различных реальных документов.

Здравоохранение

Пример: Отчет по лабораторной работе

Этот пример демонстрирует, как система ADE обнаруживает подтверждения в медицинских лабораторных отчетах — типе документов, где точность имеет решающее значение. Лабораторные отчеты часто содержат несколько подписей от техников, патологоанатомов и медицинских директоров, каждая из которых подтверждает достоверность теста и диагноз. Традиционные системы оптического распознавания символов (OCR) с трудом распознают эти рукописные или отсканированные подписи, особенно когда они перекрывают печатный текст или расположены в разных местах.

В данном случае ADE точно идентифицирует три отдельных фрагмента подтверждения, каждый из которых соответствует разному медицинскому специалисту. Система выделяет каждую подпись, фиксирует ее местоположение в отчете и сохраняет окружающий текст, такой как должности и квалификационные данные. Это позволяет автоматически проверять подлинность отчета и поддерживать четкий аудиторский след без ручного вмешательства.

5853c1f7e04c2a0ac56d26efbc2d8712

Каждое подтверждение также представлено в структурированном JSON-выводе, включая его ограничивающий прямоугольник, подтип и текстовое содержимое.

22b13c3503a7fe20093491055b7e7e3f

Помимо парсинга, ADE также поддерживает извлечение определенных полей с использованием пользовательских схем. В приведенном ниже примере в схеме определены такие поля, как lab_technician, doctor_signature_1 и doctor_signature_2. ADE автоматически сопоставляет каждое поле с соответствующей областью аттестации на странице и извлекает необходимые данные. Это обеспечивает проверку на уровне полей и поддерживает автоматизацию последующих этапов медицинских рабочих процессов.

e4138374b94e8008d92d6758df7c34f0

Пример: Рукописные рецепты от врача

Этот пример демонстрирует, как система ADE выявляет подтверждения в рукописных рецептах — одном из наиболее изменчивых и неструктурированных типов документов в здравоохранении. Рецепты часто сочетают в себе печатные бланки, рукописные заметки и подписи врача, которые различаются по расположению, размеру и четкости.

В этом рецепте система ADE распознает как рукописную подпись врача, так и официальную печать клиники в качестве подтверждающих элементов и связывает их с прилагаемыми печатными данными, такими как имя, квалификация и контактная информация.

bc7196e30910a5f3c89365d20c0db6af

Финансы и банковское дело

Пример: Формы KYC и регистрации новых сотрудников.

Документы KYC играют решающую роль в финансовой верификации. К ним относятся выданные государственными органами формы, удостоверения личности и торговые сертификаты, которые часто содержат несколько подтверждений подлинности. Эти подписи и официальные печати имеют решающее значение для соблюдения требований, однако их формат и расположение значительно различаются в разных документах и на разных языках.

В этом примере ADE обрабатывает сертификат кода импортера-экспортера (IEC), регистрационный документ, используемый в Индии для международной торговли. Сертификат содержит текст на английском и хинди, официальную печать синими чернилами и несколько рукописных подписей. ADE точно определяет каждый из этих элементов подтверждения, идентифицируя печать, считывая окружающий двуязычный текст и извлекая имя и должность подписавшего из печатных полей.

657617c1f4ced6db25573bdd187002ed

Пример: Формы для денежных переводов и транзакций

Финансовые документы часто содержат сочетание рукописных данных, печатных таблиц и многочисленных официальных печатей для подтверждения или утверждения. Эти печати имеют решающее значение для подлинности транзакций.

В этом примере ADE обрабатывает платежную форму, выданную пунктом обмена валюты. Документ содержит красные диагональные штампы с надписью «ПОЛУЧЕНЫ НАЛИЧНЫЕ», а также рукописные записи и табличные данные. ADE распознает штамп как отдельный элемент подтверждения, определяя его цвет, положение и читаемый текст, даже если он перекрывает поля формы.

f5d20db4ad482ce411c51606d100b9d2

Пример: Аффидавиты и заявления

Юридические аффидавиты часто представляют собой отсканированные копии исторических или нотариально заверенных документов, четкость которых варьируется в зависимости от возраста и состояния. Несмотря на выцветший текст, помятую бумагу и неровные сканы, ADE точно идентифицирует каждое заверение, сохраняя как содержание, так и пространственное расположение каждой подписи и печати.

В этом примере заверенное заявление включает несколько подписей — от заявителя, нотариуса и органа, удостоверяющего документы. ADE фиксирует каждое заверение как отдельный фрагмент, считывая разборчивые данные, такие как имя, должность и юрисдикция нотариуса, сохраняя при этом визуальную целостность страницы. Даже при наличии почерка, отличающегося точностью, и использовании чернил с низким контрастом, каждая подпись извлекается с точными границами и контекстными описаниями.

8c3bc4d42ab036552de19477943af167

Пример: контракты и официальные заявления.

В юридических и государственных указах часто фигурирует множество подписей, каждая из которых представляет отдельный орган или ведомство. В таких документах подписи часто располагаются вертикально или наложенными друг на друга, сопровождаемые печатными именами и должностями.

В этом примере заявления система ADE идентифицирует несколько отдельных фрагментов подтверждения, каждый из которых соответствует отдельному члену совета. Она определяет расположение, цвет и стиль каждой рукописной подписи, связывая ее с соответствующей печатной должностью, например, «Председатель округа» или «Заместитель председателя». Структурируя эти подтверждения вместе, ADE предоставляет четкую, машиночитаемую запись о том, кто подписал, где и в каком порядке.

9e6b245fcadb0db01a8533d78c642acf

Заключение

От лабораторных анализов и рецептов до торговых сертификатов и заявлений под присягой — заверения являются основой подлинности документов. Однако они относятся к числу наиболее сложных элементов для обнаружения и точного оформления.

С помощью блока подтверждения ADE извлекает подписи, печати и штампы в виде структурированных данных в структуре документа. Каждое подтверждение извлекается с сохранением его положения и контекста, что гарантирует сохранность всей важной информации.

Это делает проверку документов быстрее, более последовательной и полностью поддающейся аудиту во всех отраслях, превращая этап ручной проверки в надежный автоматизированный процесс.

Готовы начать?

Протестируйте ADE в режиме реального времени, используя свои документы в Visual Playground.

Содержание

Источник: landing.ai

✅ Найденные теги: ADE, документы, новости, Обнаружение, Подписи, Штампы

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

STAT+: FDA присвоило статус «прорывного» чат-боту на основе генеративного искусственного интеллекта для хирургических пациентов.
Разработка кодекса поведения для клинических консультаций с использованием искусственного интеллекта.
Почему люди говорят громко по телефону в общественном транспорте
Прежде чем появятся квантовые вычисления, этот стартап хочет привлечь предприятия, которые уже используют эту технологию.
ideipro logotyp
«Загрузка»: роль ИИ в войне с Ираном и эскалация судебной тяжбы.
ideipro logotyp
Обучение с помощью управляемых нейронных сетей позволяет «необучаемым» нейронным сетям реализовать свой потенциал.
Красочное квантовое будущее
Image Not Found
STAT+: FDA присвоило статус «прорывного» чат-боту на основе генеративного искусственного интеллекта для хирургических пациентов.

STAT+: FDA присвоило статус «прорывного» чат-боту на основе генеративного искусственного интеллекта для хирургических пациентов.

Если это решение будет одобрено, оно может дать представление о том, как агентство будет регулировать аналогичные клинические инструменты. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей Adobe Управление по санитарному надзору…

Мар 13, 2026
Разработка кодекса поведения для клинических консультаций с использованием искусственного интеллекта.

Разработка кодекса поведения для клинических консультаций с использованием искусственного интеллекта.

Может ли клинический искусственный интеллект использовать опыт разработки безопасных автономных транспортных средств для создания безопасных автономных консультаций в медицине? Доступ через ваше учебное заведение. Купить или оформить подписку. Это предварительный просмотр контента по подписке, доступ к которому…

Мар 13, 2026
Почему люди говорят громко по телефону в общественном транспорте

Почему люди говорят громко по телефону в общественном транспорте

Ваш телефон по-прежнему работает, даже если поднести его к уху! Автор фото: Нейт Андерсон Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков Узнать больше Свернуть в…

Мар 13, 2026
Прежде чем появятся квантовые вычисления, этот стартап хочет привлечь предприятия, которые уже используют эту технологию.

Прежде чем появятся квантовые вычисления, этот стартап хочет привлечь предприятия, которые уже используют эту технологию.

Источник изображения: Matthias Balk/picture alliance via Getty Images / Getty Images Спустя восемнадцать месяцев после продажи своего стартапа производителю микросхем AMD за 665 миллионов долларов финский предприниматель Петер Сарлин покинул пост генерального директора подразделения, ныне известного как…

Мар 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых