The impact of data quality on the effectiveness of machine learning models in the bakery industry in the context of big data


  • Diana E. Gabitova Ufa State Petroleum Technical University


data quality, machine learning, big data, agricultural sector, digitalization of agriculture, data mining


The article examines the impact of data quality on the effectiveness of machine learning models in the bakery industry in the context of big data. The relevance of the topic is due to the growing role of data analytics in optimizing bakery production and the need to ensure the reliability of the predictive models used. The aim of the work is to identify key data quality parameters that determine the accuracy and practical applicability of machine learning models in the baking industry. A set of methods was used in the study, including statistical analysis of arrays of bakery production data, expert interviews (n=20) and comparative testing of models on training samples of different quality. It is established that: 1) completeness, accuracy and consistency of data are key factors affecting the generalizing ability of models; 2) the use of data preprocessing (purification, transformation) allows to increase the accuracy of predictions of the output of bakery products by an average of 10-15%; 3) models trained on high-quality data demonstrate three times higher stability in the test sample; 4) the quality of forecasting key indicators of the baking process in adaptive models can exceed existing standards by 8-12%. The results confirm the critical importance of data quality management for realizing the potential of machine learning in the bakery industry. A methodology for auditing the quality of technological data of bakeries is proposed, focused on the specifics of modeling and optimization tasks. Further research is related to the development of infrastructure and management solutions to ensure data quality in the context of digitalization of bakery production.


Ван П., Тоудешки А., Тан Х., Эхсани Р. Методология определения зрелости свежих томатов с использованием компьютерного зрения, компьютеров и электроники в сельском хозяйстве // растительные методы. 2018. Т.146. С. 43-50.

Ибрагимов Р., Сурагина Е. Право машин. Как привлечь робота к ответственности // Корпоративный юрист. 2017. № 11.

Келепова М.Е., Молодчик А.В., Нагорная М.С. Правовое и институциональное регулирование искусственного интеллекта на международном и национальном уровнях // Управление в современных системах. 2022. № 3(35). С. 68-78.

Лаптев В.А. Ответственность «будущего»: правовое существо и вопрос оценки доказательств // Гражданское право. 2017. № 3. С. 32-35.

Сударсан Б., Джи В., Бисвас А., Адамчук В. Компьютерное зрение на основе микроскопа для характеристики текстуры почвы и органического вещества почвы // Инженерия биосистем. 2016. Т. 152. С. 41-50.

Сухарева О.А., Мешлок А.А. Актуальность и перспективы развития производства органический продукции сельского хозяйства в современных условиях // Эпомен. 2021. № 65. С. 48-56.

Талавия Т., Шах Д., Патель Н., Ягник Х., Шах М. Внедрение искусственного интеллекта в сельское хозяйство для оптимизации орошения и применения пестицидов и гербицидов // Искусственный интеллект в сельском хозяйстве. 2020. Т. 4. С. 58-73.

Федоренко В.Ф., Черноиванов В.И., Гольтяпин В.Я., Федоренко И.В. Мировые тенденции интеллектуализации сельского хозяйства: науч. аналит. обз. М.: ФГБНУ «Росинформагротех», 2018. 232 с.

Чиркин С.О., Картечина Н.В., Рубанов В.А. Применение искусственного интеллекта в сельском хозяйстве // Наука и образование. 2022. Т. 5. № 2. С. 241.

Wolfert S., Ge L., Verdouw C., Bogaardt M.J. Big data in smart farming – a review // Agricultural systems. 2017. № 153. рр. 69-80.

Kamilaris A., Kartakoullis A., Prenafeta-Boldú F.X. A review on the practice of big data analysis in agriculture // Computers and electronics in agriculture. 2017. № 143. рр. 23-37.

Liakos K.G., Busato P., Moshou D., Pearson S., Bochtis D. Machine learning in agriculture – а review // Sensors. 2018. № 18(8). рр. 26-74.

Khaki S., Wang L. Crop yield prediction using deep neural networks // Frontiers in plant science. 2019. № 10. Р. 621.

Zhu N., Liu X., Liu Z., Hu K., Wang Y., Tan J., Guo Y. Deep learning for smart agriculture: Concepts, tools, applications, and opportunities // International journal of agricultural and biological engineering, 2018. № 11(4). рр. 32-44.

Truong S.K., Tran D.Q., Nguyen T.T., Phan C. Obstacles in Big Data for Agricultural Industry 4.0. In рroceedings of the Ninth International Symposium on Information and Communication Technology. 2018. pp. 391-398.

El Bilali H., Allahyari M.S. Transition towards sustainability in agriculture and food systems: Role of information and communication technologies // Information Processing in Agriculture. 2018. № 5(4). рр. 456-464.



How to Cite

Gabitova, D. E. (2024). The impact of data quality on the effectiveness of machine learning models in the bakery industry in the context of big data. Bakery of Russia, 68(3), 155–165. Retrieved from




Similar Articles

1 2 3 4 5 6 > >> 

You may also start an advanced similarity search for this article.