https://libeldoc.bsuir.by/handle/123456789/33444
Title: | Автоматическая идентификация языка документа для последующего Cross-Language анализа |
Authors: | Бредихин, Ю. А. Калугина, М. А. |
Keywords: | публикации ученых;обработка естественных языков (NLP),;информационный поиск (IR);вопросно-ответные системы (QA);автоматическое реферирование (Summarization);автоматическое определение языка;алгоритм N-грамм |
Issue Date: | 2017 |
Publisher: | АНС «СибАК» |
Citation: | Бредихин, Ю. А. Автоматическая идентификация языка документа для последующего Cross-Language анализа / Ю. А. Бредихин, М. А. Калугина // Студенческий: электрон. научн. журн. - 2017. - № 19 (19). – Режим доступа : https://sibac.info/journal/student/19/89477 (дата обращения: 07.02.2018). |
Abstract: | Определение языка является важной стадией работы с текстовыми документами, так как от нее зависит эффективность приложений по обработке естественных языков (NLP): информационный поиск (IR), вопросно-ответные системы (QA), автоматическое реферирование (Summarization). В зависимости от применяемых правил построения поисковых образов и стратегий их сравнения различают несколько основных методов. Статья посвящена описанию программной реализации модифицированной версии алгоритма N-грамм, основанному на статистиках документов с известным заранее языком и кодировкой. |
URI: | https://libeldoc.bsuir.by/handle/123456789/33444 |
Appears in Collections: | Публикации в зарубежных изданиях |
File | Description | Size | Format | |
---|---|---|---|---|
Bredikhin_Avtomaticheskaya.PDF | 725.64 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.