Синтетические документы

Этот датасет представляет собой масштабную коллекцию синтетически сгенерированных изображений документов, визуально воспроизводящих структуру реальных паспортов, водительских удостоверений и других идентификационных карточек. Все элементы — фотографии, номера, штампы, печати, QR-коды, подписи и текстовые блоки — создаются генеративными моделями, что обеспечивает реалистичную сложность документа при полном исключении использования реальных сведений.

Набор включает разнообразные типы документов: внутренние и заграничные паспорта, водительские удостоверения разных форматов, тестовые ID-карты, пропуска и служебные карточки. Изображения представлены в различных стилях и уровнях износа: с царапинами, потертостями, следами ламинации, водяными знаками, бликами, микрошрифтами, фоновыми узорами и вариациями полиграфии. Дополнительно моделируются артефакты съёмки — тени от пальцев, искажения оптики, неравномерный свет, шум матрицы, дефокус, отражения и посторонние предметы в кадре.

Такой датасет подходит для обучения моделей распознавания и классификации документов, улучшения систем OCR, разработки антифрод-алгоритмов, тестирования детекторов подделок и построения устойчивых CV-систем для финтеха, госуслуг, проверок личности и онлайн-верификации.