Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/59629
Title: Подход к аппаратной поддержке данных текста с использованием ПЛИС
Other Titles: Approach to hardware-assisted text analysis using FPGA
Authors: Вишняков, В. А.
Юй, Ч.
Keywords: материалы конференций;ПЛИС;метод случайного леса;анализ текста;TF-IDF;аппаратное ускорение
Issue Date: 2025
Publisher: БГУИР
Citation: Вишняков, В. А. Подход к аппаратной поддержке данных текста с использованием ПЛИС = Approach to hardware-assisted text analysis using FPGA / В. А. Вишняков, Ч. Юй // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XI Международной научно-практической конференции, Республика Беларусь, Минск, 23–24 апреля 2025 года / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2025. – С. 178–181.
Abstract: Цель данного исследования – разработка аппаратно-ориентированного метода ускорения классификации текста на основе метода случайного леса в условиях ограниченных вычислительных ресурсов. Оптимизирована модель, реализована облегченная архитектура, с использованием арифметики с фиксированной запятой и вычислительного модуля на ПЛИС. Создана сквозная конвейерная обработка от исходного текстового ввода до извлечения признаков методом TF-IDF и классификации с использованием случайного леса. Предложенный подход продемонстрировал числовую согласованность с эталонной реализацией на языке Python. Хотя обработка TF-IDF выполняется на центральном процессоре, её взаимодействие с модулем ПЛИС осуществляется через шину AXI-Lite, что закладывает основу для полной аппаратной интеграции в дальнейших исследованиях.
Alternative abstract: The purpose of this study is to develop a hardware-oriented method for accelerating text classification based on a random forest in conditions of limited computing resources. The model has been optimized, a lightweight architecture has been implemented, using fixed-point arithmetic and FPGA computing modules. Endto- end pipelining has been created from the source text input to feature extraction using the TF-IDF method and classification using a random forest. The proposed approach demonstrated numerical consistency with the reference implementation in Python. Although TF-IDF processing is performed on the central processor, its interaction with the FPGA module is carried out via the AXI-Lite bus, which lays the foundation for full hardware integration in further research.
URI: https://libeldoc.bsuir.by/handle/123456789/59629
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей (2025)

Files in This Item:
File Description SizeFormat 
Vishnyakov_Podhod.pdf378.09 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.