Влияние качества данных на эффективность моделей машинного обучения на предприятиях хлебопекарной отрасли в условиях больших данных

Авторы

  • Диана Эдуардовна Габитова Уфимский государственный нефтяной технический университет

Ключевые слова:

качество данных, машинное обучение, большие данные, аграрный сектор, цифровизация сельского хозяйства, интеллектуальный анализ данных

Аннотация

В статье исследуется влияние качества данных на эффективность моделей машинного обучения на предприятиях хлебопекарной отрасли в условиях больших данных. Актуальность темы обусловлена растущей ролью аналитики данных в оптимизации хлебопекарного производства и необходимостью обеспечения надежности используемых предиктивных моделей. Цель работы - выявить ключевые параметры качества данных, определяющие точность и практическую применимость моделей машинного обучения в хлебопекарной индустрии. В исследовании использован комплекс методов, включающий статистический анализ массивов производственных данных хлебозаводов, экспертные интервью (n=20) и сравнительное тестирование моделей на разных по качеству обучающих выборках. Установлено, что: 1) полнота, точность и согласованность данных являются ключевыми факторами, влияющими на обобщающую способность моделей; 2) использование предобработки данных (очистка, трансформация) позволяет повысить точность предсказаний выхода хлебобулочных изделий в среднем на 10-15%; 3) модели, обученные на качественных данных, демонстрируют втрое более высокую стабильность на тестовой выборке; 4) качество прогнозирования ключевых показателей процесса хлебопечения у адаптивных моделей может превосходить существующие нормативы на 8-12%. Результаты подтверждают критическую значимость управления качеством данных для реализации потенциала машинного обучения в хлебопекарной индустрии. Предложена методика аудита качества технологических данных хлебозаводов, ориентированная на специфику задач моделирования и оптимизации. Дальнейшие исследования связаны с разработкой инфраструктурных и управленческих решений по обеспечению качества данных в условиях цифровизации хлебопекарного производства.

Библиографические ссылки

Ван П., Тоудешки А., Тан Х., Эхсани Р. Методология определения зрелости свежих томатов с использованием компьютерного зрения, компьютеров и электроники в сельском хозяйстве // растительные методы. 2018. Т.146. С. 43-50.

Ибрагимов Р., Сурагина Е. Право машин. Как привлечь робота к ответственности // Корпоративный юрист. 2017. № 11.

Келепова М.Е., Молодчик А.В., Нагорная М.С. Правовое и институциональное регулирование искусственного интеллекта на международном и национальном уровнях // Управление в современных системах. 2022. № 3(35). С. 68-78.

Лаптев В.А. Ответственность «будущего»: правовое существо и вопрос оценки доказательств // Гражданское право. 2017. № 3. С. 32-35.

Сударсан Б., Джи В., Бисвас А., Адамчук В. Компьютерное зрение на основе микроскопа для характеристики текстуры почвы и органического вещества почвы // Инженерия биосистем. 2016. Т. 152. С. 41-50.

Сухарева О.А., Мешлок А.А. Актуальность и перспективы развития производства органический продукции сельского хозяйства в современных условиях // Эпомен. 2021. № 65. С. 48-56.

Талавия Т., Шах Д., Патель Н., Ягник Х., Шах М. Внедрение искусственного интеллекта в сельское хозяйство для оптимизации орошения и применения пестицидов и гербицидов // Искусственный интеллект в сельском хозяйстве. 2020. Т. 4. С. 58-73.

Федоренко В.Ф., Черноиванов В.И., Гольтяпин В.Я., Федоренко И.В. Мировые тенденции интеллектуализации сельского хозяйства: науч. аналит. обз. М.: ФГБНУ «Росинформагротех», 2018. 232 с.

Чиркин С.О., Картечина Н.В., Рубанов В.А. Применение искусственного интеллекта в сельском хозяйстве // Наука и образование. 2022. Т. 5. № 2. С. 241.

Wolfert S., Ge L., Verdouw C., Bogaardt M.J. Big data in smart farming – a review // Agricultural systems. 2017. № 153. рр. 69-80.

Kamilaris A., Kartakoullis A., Prenafeta-Boldú F.X. A review on the practice of big data analysis in agriculture // Computers and electronics in agriculture. 2017. № 143. рр. 23-37.

Liakos K.G., Busato P., Moshou D., Pearson S., Bochtis D. Machine learning in agriculture – а review // Sensors. 2018. № 18(8). рр. 26-74.

Khaki S., Wang L. Crop yield prediction using deep neural networks // Frontiers in plant science. 2019. № 10. Р. 621.

Zhu N., Liu X., Liu Z., Hu K., Wang Y., Tan J., Guo Y. Deep learning for smart agriculture: Concepts, tools, applications, and opportunities // International journal of agricultural and biological engineering, 2018. № 11(4). рр. 32-44.

Truong S.K., Tran D.Q., Nguyen T.T., Phan C. Obstacles in Big Data for Agricultural Industry 4.0. In рroceedings of the Ninth International Symposium on Information and Communication Technology. 2018. pp. 391-398.

El Bilali H., Allahyari M.S. Transition towards sustainability in agriculture and food systems: Role of information and communication technologies // Information Processing in Agriculture. 2018. № 5(4). рр. 456-464.

Дополнительные файлы

Опубликован

2024-06-30

Как цитировать

Габитова, Д. Э. (2024). Влияние качества данных на эффективность моделей машинного обучения на предприятиях хлебопекарной отрасли в условиях больших данных. Хлебопечение России, 68(3), 155–165. извлечено от https://hbreview.ru/index.php/hb/article/view/80

Выпуск

Раздел

ПРИКЛАДНЫЕ ИССЛЕДОВАНИЯ

Похожие статьи

<< < 1 2 3 4 5 > >> 

Вы также можете начать расширеннвй поиск похожих статей для этой статьи.