https://libeldoc.bsuir.by/handle/123456789/59629
Title: | Подход к аппаратной поддержке данных текста с использованием ПЛИС |
Other Titles: | Approach to hardware-assisted text analysis using FPGA |
Authors: | Вишняков, В. А. Юй, Ч. |
Keywords: | материалы конференций;ПЛИС;метод случайного леса;анализ текста;TF-IDF;аппаратное ускорение |
Issue Date: | 2025 |
Publisher: | БГУИР |
Citation: | Вишняков, В. А. Подход к аппаратной поддержке данных текста с использованием ПЛИС = Approach to hardware-assisted text analysis using FPGA / В. А. Вишняков, Ч. Юй // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XI Международной научно-практической конференции, Республика Беларусь, Минск, 23–24 апреля 2025 года / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2025. – С. 178–181. |
Abstract: | Цель данного исследования – разработка аппаратно-ориентированного метода ускорения классификации текста на основе метода случайного леса в условиях ограниченных вычислительных ресурсов. Оптимизирована модель, реализована облегченная архитектура, с использованием арифметики с фиксированной запятой и вычислительного модуля на ПЛИС. Создана сквозная конвейерная обработка от исходного текстового ввода до извлечения признаков методом TF-IDF и классификации с использованием случайного леса. Предложенный подход продемонстрировал числовую согласованность с эталонной реализацией на языке Python. Хотя обработка TF-IDF выполняется на центральном процессоре, её взаимодействие с модулем ПЛИС осуществляется через шину AXI-Lite, что закладывает основу для полной аппаратной интеграции в дальнейших исследованиях. |
Alternative abstract: | The purpose of this study is to develop a hardware-oriented method for accelerating text classification based on a random forest in conditions of limited computing resources. The model has been optimized, a lightweight architecture has been implemented, using fixed-point arithmetic and FPGA computing modules. Endto- end pipelining has been created from the source text input to feature extraction using the TF-IDF method and classification using a random forest. The proposed approach demonstrated numerical consistency with the reference implementation in Python. Although TF-IDF processing is performed on the central processor, its interaction with the FPGA module is carried out via the AXI-Lite bus, which lays the foundation for full hardware integration in further research. |
URI: | https://libeldoc.bsuir.by/handle/123456789/59629 |
Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей (2025) |
File | Description | Size | Format | |
---|---|---|---|---|
Vishnyakov_Podhod.pdf | 378.09 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.