Система анализа качества текстовых коллекций

Калоша, А. Л.; Медунецкий, М. А.; Хоронеко, М. П.; Александров, А. А.; Гридасов, А. И.; Нестеренков, С. Н.

Full metadata record

DC Field	Value	Language
dc.contributor.author	Калоша, А. Л.	-
dc.contributor.author	Медунецкий, М. А.	-
dc.contributor.author	Хоронеко, М. П.	-
dc.contributor.author	Александров, А. А.	-
dc.contributor.author	Гридасов, А. И.	-
dc.contributor.author	Нестеренков, С. Н.	-
dc.date.accessioned	2020-07-08T08:57:27Z	-
dc.date.available	2020-07-08T08:57:27Z	-
dc.date.issued	2020	-
dc.identifier.citation	Калоша, А. Л. Система анализа качества текстовых коллекций / А. Л. Калоша [и др.] // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: сборник материалов VI Международной научно-практической конференции, Минск, 20-21 мая 2020 года: в 3 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2020. – С. 369 – 375.	ru_RU
dc.identifier.isbn	978-985-90533-9-9	-
dc.identifier.uri	https://libeldoc.bsuir.by/handle/123456789/39428	-
dc.description.abstract	Цель данной работы заключается в создании системы для прогнозирования популярности публикаций. В данной системе используется нейронная сеть, которая обучена на наборе метрик, описывающих качество и популярность публикаций. В качестве набора метрик используется количество лайков, просмотров и репостов. Обучение нейронной сети производилось на 100 000 текстов. В результате обучения нейронная сеть способна предсказать количество просмотров с точностью в 75%. Верным считается ответ, находящийся в диапазоне +/-200 000 просмотров от ответа. Максимальное количество просмотров при обучении составляло 48 миллионов. Коэффициент корреляции для массивов ответов и предсказанных значений составляет 0,33. Это означает, что между входными и выходными данными есть линейная зависимость. Увеличив размер обучающей выборки, или подобрав более точно гиперпараметры нейронной сети, можно увеличить точность системы.	ru_RU
dc.language.iso	ru	ru_RU
dc.publisher	Беспринт	ru_RU
dc.subject	материалы конференций	ru_RU
dc.subject	Big Data	ru_RU
dc.subject	машинное обучение	ru_RU
dc.subject	нейронные сети	ru_RU
dc.subject	machine learning	-
dc.subject	neural networks	-
dc.title	Система анализа качества текстовых коллекций	ru_RU
dc.title.alternative	Text collection quality assurance system	-
dc.type	Article	ru_RU
local.description.annotation	The purpose of this work is to create a system for forecasting the popularity of publications. This system uses a neural network, which is trained on a set of metrics describing the quality and popularity of publications. The number of likes, views and repostings is used as a set of metrics. The neural network was trained for 100,000 texts. As a result of training the neural network is able to predict the number of views with the accuracy of 75%. The answer in the range of +/-200 000 views of the answer is considered correct. The maximum number of views during training was 48 million. The correlation coefficient for answer arrays and predicted values is 0.33. This means that there is a linear relationship between input and output data. By increasing the size of the learning sample, or by more accurately selecting the hyperparameters of the neural network, you can increase accuracy of the system.	-
Appears in Collections:	BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2020)