https://libeldoc.bsuir.by/handle/123456789/51667
Title: | Обзор программной платформы Apache Hadoop для обработки и хранения больших данных |
Other Titles: | Review of the software platform for processing and storing Big Data on the example of Apache Hadoop |
Authors: | Пискун, Г. А. Алексеев, В. Ф. Воронко, Т. М. |
Keywords: | материалы конференций;большие данные;платформа Apache Hadoop |
Issue Date: | 2023 |
Publisher: | БГУИР |
Citation: | Пискун, Г. А. Обзор программной платформы Apache Hadoop для обработки и хранения больших данных / Г. А. Пискун, В. Ф. Алексеев, Т. М. Воронко // BIG DATA и анализ высокого уровня = BIG DATA and Advanced Analytics : сборник научных статей IX Международной научно-практической конференции, Минск, 17–18 мая 2023 г. : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2023. – С. 465-471. |
Abstract: | Выполнен обзор программной платформы для хранения и обработки больших данных на примере Apache Hadoop, которая представляет собой свободно распространяемый набор утилит, библиотек и фреймворк для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов. Рассмотрена концептуальная архитектура платформы через описание основных модулей, входящих в нее: Hadoop Common, Hadoop Distributed File System, Hadoop YARN и Hadoop MapReduce. Проанализирована область применения данной технологии. Установлено, что такие платформы для обработки и хранения больших данных как Apache Hadoop, являются одними из самых важных инструментов для работы с данными в современном мире, обеспечивая безопасность инфраструктуры и оптимизируя бизнес-процессы. |
Alternative abstract: | A review of the software platform for storing and processing big data is made using the example of Apache Hadoop, as one of the most common and effective today. This is a freely distributed set of utilities, libraries and framework for developing and executing distributed programs running on clusters of hundreds and thousands of nodes. The conceptual architecture of the platform is considered through the description of the main modules included in it: Hadoop Common, Hadoop Distributed File System, Hadoop YARN, Hadoop MapReduce, and the scope of this technology is analyzed. As a result of the analysis, it was found that such platforms for processing and storing big data, such as Apache Hadoop, are one of the most important tools for working with data in the modern world, ensuring infrastructure security and optimizing business processes. |
URI: | https://libeldoc.bsuir.by/handle/123456789/51667 |
Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей (2023) |
File | Description | Size | Format | |
---|---|---|---|---|
Piskun_Obzor.pdf | 1.02 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.