https://libeldoc.bsuir.by/handle/123456789/33444| Title: | Автоматическая идентификация языка документа для последующего Cross-Language анализа |
| Authors: | Бредихин, Ю. А. Калугина, М. А. |
| Keywords: | публикации ученых;обработка естественных языков;информационный поиск;вопросно-ответные системы;автоматическое реферирование;автоматическое определение языка;алгоритм N-грамм |
| Issue Date: | 2017 |
| Publisher: | АНС «СибАК» |
| Citation: | Бредихин, Ю. А. Автоматическая идентификация языка документа для последующего Cross-Language анализа / Ю. А. Бредихин, М. А. Калугина // Студенческий: электронный научный журнал. – 2017. – № 19 (19). – Режим доступа : https://sibac.info/journal/student/19/89477 (дата обращения: 07.02.2018). |
| Abstract: | Определение языка является важной стадией работы с текстовыми документами, так как от нее зависит эффективность приложений по обработке естественных языков (NLP): информационный поиск (IR), вопросно-ответные системы (QA), автоматическое реферирование (Summarization). В зависимости от применяемых правил построения поисковых образов и стратегий их сравнения различают несколько основных методов. Статья посвящена описанию программной реализации модифицированной версии алгоритма N-грамм, основанному на статистиках документов с известным заранее языком и кодировкой. |
| URI: | https://libeldoc.bsuir.by/handle/123456789/33444 |
| Appears in Collections: | Публикации в зарубежных изданиях |
| File | Description | Size | Format | |
|---|---|---|---|---|
| Bredikhin_Avtomaticheskaya.PDF | 725.64 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.