Skip navigation
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://libeldoc.bsuir.by/handle/123456789/39428
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorКалоша, А. Л.-
dc.contributor.authorМедунецкий, М. А.-
dc.contributor.authorХоронеко, М. П.-
dc.contributor.authorАлександров, А. А.-
dc.contributor.authorГридасов, А. И.-
dc.contributor.authorНестеренков, С. Н.-
dc.date.accessioned2020-07-08T08:57:27Z-
dc.date.available2020-07-08T08:57:27Z-
dc.date.issued2020-
dc.identifier.citationКалоша, А. Л. Система анализа качества текстовых коллекций / А. Л. Калоша [и др.] // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: сборник материалов VI Международной научно-практической конференции, Минск, 20-21 мая 2020 года: в 3 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2020. – С. 369 – 375.ru_RU
dc.identifier.isbn978-985-90533-9-9-
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/39428-
dc.description.abstractЦель данной работы заключается в создании системы для прогнозирования популярности публикаций. В данной системе используется нейронная сеть, которая обучена на наборе метрик, описывающих качество и популярность публикаций. В качестве набора метрик используется количество лайков, просмотров и репостов. Обучение нейронной сети производилось на 100 000 текстов. В результате обучения нейронная сеть способна предсказать количество просмотров с точностью в 75%. Верным считается ответ, находящийся в диапазоне +/-200 000 просмотров от ответа. Максимальное количество просмотров при обучении составляло 48 миллионов. Коэффициент корреляции для массивов ответов и предсказанных значений составляет 0,33. Это означает, что между входными и выходными данными есть линейная зависимость. Увеличив размер обучающей выборки, или подобрав более точно гиперпараметры нейронной сети, можно увеличить точность системы.ru_RU
dc.language.isoruru_RU
dc.publisherБеспринтru_RU
dc.subjectматериалы конференцийru_RU
dc.subjectBig Dataru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectнейронные сетиru_RU
dc.subjectmachine learning-
dc.subjectneural networks-
dc.titleСистема анализа качества текстовых коллекцийru_RU
dc.title.alternativeText collection quality assurance system-
dc.typeArticleru_RU
local.description.annotationThe purpose of this work is to create a system for forecasting the popularity of publications. This system uses a neural network, which is trained on a set of metrics describing the quality and popularity of publications. The number of likes, views and repostings is used as a set of metrics. The neural network was trained for 100,000 texts. As a result of training the neural network is able to predict the number of views with the accuracy of 75%. The answer in the range of +/-200 000 views of the answer is considered correct. The maximum number of views during training was 48 million. The correlation coefficient for answer arrays and predicted values is 0.33. This means that there is a linear relationship between input and output data. By increasing the size of the learning sample, or by more accurately selecting the hyperparameters of the neural network, you can increase accuracy of the system.-
Располагается в коллекциях:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2020)

Файлы этого ресурса:
Файл Описание РазмерФормат 
Kalosha_Sistema.pdf1.14 MBAdobe PDFОткрыть
Показать базовое описание ресурса Просмотр статистики Google Scholar

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.