Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/51667
Title: Обзор программной платформы Apache Hadoop для обработки и хранения больших данных
Other Titles: Review of the software platform for processing and storing Big Data on the example of Apache Hadoop
Authors: Пискун, Г. А.
Алексеев, В. Ф.
Воронко, Т. М.
Keywords: материалы конференций;большие данные;платформа Apache Hadoop
Issue Date: 2023
Publisher: БГУИР
Citation: Пискун, Г. А. Обзор программной платформы Apache Hadoop для обработки и хранения больших данных / Г. А. Пискун, В. Ф. Алексеев, Т. М. Воронко // BIG DATA и анализ высокого уровня = BIG DATA and Advanced Analytics : сборник научных статей IX Международной научно-практической конференции, Минск, 17–18 мая 2023 г. : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2023. – С. 465-471.
Abstract: Выполнен обзор программной платформы для хранения и обработки больших данных на примере Apache Hadoop, которая представляет собой свободно распространяемый набор утилит, библиотек и фреймворк для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов. Рассмотрена концептуальная архитектура платформы через описание основных модулей, входящих в нее: Hadoop Common, Hadoop Distributed File System, Hadoop YARN и Hadoop MapReduce. Проанализирована область применения данной технологии. Установлено, что такие платформы для обработки и хранения больших данных как Apache Hadoop, являются одними из самых важных инструментов для работы с данными в современном мире, обеспечивая безопасность инфраструктуры и оптимизируя бизнес-процессы.
Alternative abstract: A review of the software platform for storing and processing big data is made using the example of Apache Hadoop, as one of the most common and effective today. This is a freely distributed set of utilities, libraries and framework for developing and executing distributed programs running on clusters of hundreds and thousands of nodes. The conceptual architecture of the platform is considered through the description of the main modules included in it: Hadoop Common, Hadoop Distributed File System, Hadoop YARN, Hadoop MapReduce, and the scope of this technology is analyzed. As a result of the analysis, it was found that such platforms for processing and storing big data, such as Apache Hadoop, are one of the most important tools for working with data in the modern world, ensuring infrastructure security and optimizing business processes.
URI: https://libeldoc.bsuir.by/handle/123456789/51667
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей (2023)

Files in This Item:
File Description SizeFormat 
Piskun_Obzor.pdf1.02 MBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.