Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/33444
Full metadata record
DC FieldValueLanguage
dc.contributor.authorБредихин, Ю. А.-
dc.contributor.authorКалугина, М. А.-
dc.date.accessioned2018-11-12T11:36:17Z-
dc.date.available2018-11-12T11:36:17Z-
dc.date.issued2017-
dc.identifier.citationБредихин, Ю. А. Автоматическая идентификация языка документа для последующего Cross-Language анализа / Ю. А. Бредихин, М. А. Калугина // Студенческий: электрон. научн. журн. - 2017. - № 19 (19). – Режим доступа : https://sibac.info/journal/student/19/89477 (дата обращения: 07.02.2018).ru_RU
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/33444-
dc.description.abstractОпределение языка является важной стадией работы с текстовыми документами, так как от нее зависит эффективность приложений по обработке естественных языков (NLP): информационный поиск (IR), вопросно-ответные системы (QA), автоматическое реферирование (Summarization). В зависимости от применяемых правил построения поисковых образов и стратегий их сравнения различают несколько основных методов. Статья посвящена описанию программной реализации модифицированной версии алгоритма N-грамм, основанному на статистиках документов с известным заранее языком и кодировкой.ru_RU
dc.language.isoruru_RU
dc.publisherАНС «СибАК»ru_RU
dc.subjectпубликации ученыхru_RU
dc.subjectобработка естественных языков (NLP),ru_RU
dc.subjectинформационный поиск (IR)ru_RU
dc.subjectвопросно-ответные системы (QA)ru_RU
dc.subjectавтоматическое реферирование (Summarization)ru_RU
dc.subjectавтоматическое определение языкаru_RU
dc.subjectалгоритм N-граммru_RU
dc.titleАвтоматическая идентификация языка документа для последующего Cross-Language анализаru_RU
dc.typeСтатьяru_RU
Appears in Collections:Публикации в зарубежных изданиях

Files in This Item:
File Description SizeFormat 
Bredikhin_Avtomaticheskaya.PDF725.64 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.