Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/51605
Title: Снижение влияния утечки данных на точность моделей в машинном обучении
Other Titles: Reducing the impact of data leakage on model accuracy in machine learning
Authors: Корячко, В. П.
Орешков, В. И.
Keywords: материалы конференций;интеллектуальный анализ данных;машинное обучение;аналитические модели;обучающие данные;тестовые данные;утечка данных;нейронные сети
Issue Date: 2023
Publisher: БГУИР
Citation: Корячко, В. П. Снижение влияния утечки данных на точность моделей в машинном обучении / В. П. Корячко, В. И. Орешков // BIG DATA и анализ высокого уровня = BIG DATA and Advanced Analytics : сборник научных статей IX Международной научно-практической конференции, Минск, 17–18 мая 2023 г. : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2023. – С. 192-198.
Abstract: Рассмотрена проблема утечки данных в задачах машинного обучения и выявлены связанные с ней факторы, негативно влияющие на точность аналитических моделей на этапе их практического применения. Предложены методы обнаружения утечек данных и их предотвращения. Проведены экспериментальные исследования возможности устранения потерь точности моделей, основанных на машинном обучении, связанных с утечкой данных, на примере нейронной сети в задаче предсказания урожайности зерновых по данным агрохимического обследования почв.
Alternative abstract: The problem of data leakage in machine learning problems is considered and the factors associated with it that negatively affect the accuracy of analytical models at the stage of their practical application are identified. Methods for detecting data leaks and preventing them are proposed. Experimental studies have been carried out on the possibility of eliminating the loss of accuracy of models based on machine learning associated with data leakage, using the example of a neural network in the problem of predicting grain yields based on agrochemical soil survey data.
URI: https://libeldoc.bsuir.by/handle/123456789/51605
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей (2023)

Files in This Item:
File Description SizeFormat 
Koryachko_Snijenie.pdf1.12 MBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.