Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/12030
Full metadata record
DC FieldValueLanguage
dc.contributor.authorMukhamedshin, D. R.-
dc.contributor.authorKurmanbakiev, M. I.-
dc.contributor.authorGataullin, R. R.-
dc.date.accessioned2017-02-23T08:49:41Z
dc.date.accessioned2017-07-18T09:38:00Z-
dc.date.available2017-02-23T08:49:41Z
dc.date.available2017-07-18T09:38:00Z-
dc.date.issued2017-
dc.identifier.citationMukhamedshin, D. R. Automatic Multilingual Web Documents Metadata Extract / D. R. Mukhamedshin, M. I. Kurmanbakiev, R. R. Gataullin // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2017) : материалы международной научно-технической конференции (Минск, 16 - 18 февраля 2017 года) / редкол. : В. В. Голенков (отв. ред.) [и др.]. – Минск : БГУИР, 2017. – С. 393 – 396.ru_RU
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/12030-
dc.description.abstractThis article describes the experience of robot devel- opment that crawls multilingual web documents, their language identification and extracting the metadata based on the metadata model of corpus manager of the electronic corpus of Tatar language “Tugan Tel”.ru_RU
dc.language.isoenru_RU
dc.publisherБГУИРru_RU
dc.subjectматериалы конференцийru_RU
dc.subjectmetadataru_RU
dc.subjectdata miningru_RU
dc.subjectweb content miningru_RU
dc.subjectinformation retrievalru_RU
dc.titleAutomatic Multilingual Web Documents Metadata Extractionru_RU
dc.title.alternativeАвтоматическое извлечение метаданных многоязычных веб-документовru_RU
dc.typeArticleru_RU
local.description.annotationВ данной статье рассказывается об опыте разработки робота для обхода многоязычных веб-документов, определении их языка и извлечении метаданных на основе модели метаданных в корпус-менеджере электронного корпуса татарского языка Туган Телл. В разделе II описывается структура и модель представления метаданных, применяемая в корпус-менеджере. Раздел III раскрывает информацию о необходимых для работы робота технических метаданных. В разделе IV рассказано о дополнительных метаданных, которые могут быть извлечены из веб-документов. V раздел включает в себя описание процесса сбора URI для обхода роботом, метод распознавания языка веб-документа, описание процесса обхода веб-документов и извлечения Метаданных.-
Appears in Collections:OSTIS-2017

Files in This Item:
File Description SizeFormat 
Mukhamedshin_Automatic.PDF281.73 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.