| DC Field | Value | Language |
| dc.contributor.author | Курлюк, Е. А. | - |
| dc.contributor.author | Давыдов, М. В. | - |
| dc.contributor.author | Ларченко, Н. А. | - |
| dc.contributor.author | Бойдич, А. В. | - |
| dc.coverage.spatial | Минск | en_US |
| dc.date.accessioned | 2026-05-06T12:01:37Z | - |
| dc.date.available | 2026-05-06T12:01:37Z | - |
| dc.date.issued | 2026 | - |
| dc.identifier.citation | Исследование влияния ориентации документа на точность извлечения данных мультимодальной моделью PaddleOCR-VL = Study of the impact of document orientation on data extraction accuracy using the PaddleOCR-VL multimodal model / Е. А. Курлюк, М. В. Давыдов, Н. А. Ларченко, А. В. Бойдич // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 158–165. | en_US |
| dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/63588 | - |
| dc.description.abstract | В работе исследуется влияние ориентации изображения на качество извлечения табличной структуры мультимодальной моделью PaddleOCR-VL. Эксперименты проведены на подмножестве набора данных SynthTabNet с четырьмя фиксированными углами поворота. Показано, что изменение ориентации приводит к существенному снижению качества распознавания, особенно при повороте на 180°. Предложен этап предварительного определения угла поворота на основе классификатора ResNet34. Добавление данного этапа приводит к выравниванию распределений метрик TEDS и TEDS-struct и снижению разброса результатов. Полученные результаты демонстрируют эффективность включения отдельного модуля определения ориентации в конвейер обработки документов. | en_US |
| dc.language.iso | ru | en_US |
| dc.publisher | БГУИР | en_US |
| dc.subject | материалы конференций | en_US |
| dc.subject | Big Data | en_US |
| dc.subject | информационные системы | en_US |
| dc.subject | оптическое распознавание текста | en_US |
| dc.subject | мультимодальные модели | en_US |
| dc.subject | компьютерное зрение | en_US |
| dc.subject | обработка изображений | en_US |
| dc.subject | анализ документов | en_US |
| dc.subject | мультимодальные подходы | en_US |
| dc.subject | параметры ориентации | en_US |
| dc.title | Исследование влияния ориентации документа на точность извлечения данных мультимодальной моделью PaddleOCR-VL | en_US |
| dc.title.alternative | Study of the impact of document orientation on data extraction accuracy using the PaddleOCR-VL multimodal mode | en_US |
| dc.type | Article | en_US |
| local.description.annotation | This paper investigates the impact of image orientation on table structure extraction quality using the PaddleOCR-VL multimodal model. Experiments are conducted on a subset of the SynthTabNet dataset with four fixed rotation angles. The results show that changes in orientation lead to a significant degradation in recognition quality, particularly for 180° rotations. A preprocessing stage based on a ResNet34 rotation classifier is introduced to determine the image orientation prior to inference. Incorporating this stage results in more consistent TEDS and TEDS-struct score distributions and reduces performance variability. The findings demonstrate the effectiveness of integrating a dedicated orientation detection module into the document processing pipeline. | en_US |
| Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)
|