Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/63574
Title: Семантическое слияние данных на основе графов знаний: интеграция структурированных и неструктурированных данных для раскрытия контекстного интеллекта
Other Titles: Semantic data fusion based on knowledge graphs: integration of structured and unstructured data to unleash contextual intelligence
Authors: Алуев, Е. А.
Булычева, М. А.
Keywords: материалы конференций;Big Data;информационные системы;графы знаний;интеграция данных;неструктурированные данные;сопоставление сущностей;семантический анализ;корпоративная аналитика
Issue Date: 2026
Publisher: БГУИР
Citation: Алуев, Е. А. Семантическое слияние данных на основе графов знаний: интеграция структурированных и неструктурированных данных для раскрытия контекстного интеллекта = Semantic data fusion based on knowledge graphs: integration of structured and unstructured data to unleash contextual intelligence / Е. А. Алуев, М. А. Булычева // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 70–80.
Abstract: Компании сектора профессиональных услуг работают с разнородными данными, где структурированные системы сосуществуют с большими массивами неструктурированных документов. Их раздельная обработка ограничивает получение контекстно-зависимых и межисточниковых инсайтов, необходимых для таких задач, как выявление конфликтов, поиск экспертизы и оценка рисков. В работе предлагается архитектура слияния данных на основе графа знаний, объединяющая структурированные и неструктурированные корпоративные данные в единое семантическое представление с сохранением происхождения данных. Для извлечения сущностей и отношений из документов используются методы обработки естественного языка, а разрешение сущностей между источниками выполняется с помощью гибридной стратегии, сочетающей лексическое, семантическое и реляционное сопоставление. Полученный размеченный граф свойств поддерживает логический вывод и построение признаков для машинного обучения. Результаты показывают, что такой подход повышает качество сопоставления сущностей, улучшает эффективность последующей аналитики и обеспечивает более высокую интерпретируемость. Семантическая интеграция на основе графов знаний тем самым выступает масштабируемой и эффективной основой для корпоративной аналитики в гетерогенных средах данных.
Alternative abstract: Professional services companies work with heterogeneous data, where structured systems coexist with large volumes of unstructured documents. Processing them separately limits the acquisition of context-sensitive and cross-source insights needed for tasks such as conflict detection, expertise search, and risk assessment. This paper proposes a knowledge graph-based data fusion architecture that combines structured and unstructured enterprise data into a single semantic representation while preserving data lineage. Natural language processing methods are used to extract entities and relationships from documents, and entity resolution across sources is accomplished using a hybrid strategy combining lexical, semantic, and relational matching. The resulting annotated feature graph supports logical inference and feature generation for machine learning. Results demonstrate that this approach improves the quality of entity matching, enhances the efficiency of subsequent analytics, and ensures greater interpretability. Knowledge graph-based semantic integration thus provides a scalable and efficient foundation for enterprise analytics in heterogeneous data environments.
URI: https://libeldoc.bsuir.by/handle/123456789/63574
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)

Files in This Item:
File Description SizeFormat 
Aluev_Semanticheskoe.pdf5.52 MBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.