Diseño de un Modelo Predictivo basado en Algoritmos de Machine Learning para la estimación del Peso de Racimos de Banano, caso de Estudio Hacienda Bananera en Ecuador

Muñoz Torres, Pedro Santiago

DSpace Startseite
→
Facultad de Posgrado
→
Maestría en Tecnologías de la Información
→
Dokumentanzeige

Diseño de un Modelo Predictivo basado en Algoritmos de Machine Learning para la estimación del Peso de Racimos de Banano, caso de Estudio Hacienda Bananera en Ecuador

Muñoz Torres, Pedro Santiago

URI: http://repositorio.unemi.edu.ec/xmlui/handle/123456789/6951

Datum: 2022

Zusammenfassung:

La agricultura no sólo proporciona alimentos y materias prima es una actividad con mucho potencial y a su vez la columna vertebral del sistema económico del país por tal razón se debe dirigir esfuerzos para ir mejorando esta indispensable práctica La agricultura en Ecuador no se ha visto beneficiada fuertemente por los diferentes avances tecnológicos en materia de Ciencia de Datos y Machine Learning estas técnicas ayudan a entender los patrones y las dinámicas que sigue sus datos de esta forma el objetivo principal de esta investigación es utilizar técnicas de Machine Learning para predecir pesos de racimos para posteriormente realizar un análisis que le permita a un Productor tomar las mejores decisiones para sus plantaciones En primera instancia de este trabajo investigativo consistió en recopilar todos los datos necesarios para entrenamiento y validación de los modelos de predicción en la cual las variables de los parámetros de producción tales como peso riego fumigación fertilización deschive_f2, deschive_f3, # manos del racimo, edad del racimo La Base de Datos con la que se trabajó, es mediante el Sistema de BI de producción que tiene implementado la Hacienda Bananera San Humberto cabe resaltar que se tiene datos entre el año 2021 y 2022 por lo tanto las conclusiones que se obtuvieron en el presente trabajo están respaldadas por datos validados y absolutos Ahora bien con los datos organizados y preprocesados se entrenan y se validan los modelos para esto se utilizó el programa RStudio y sus diferentes paquetes y librerías En este caso se utilizó el algoritmo Random Forest el cual recibe los parámetros internos para adecuar el modelo a los requerimientos del problema además recibe los datos de entrada y la salida esperada Después se realizó el modelo con el algoritmo Xgboost que resultó ser más eficiente en su ejecución aunque no hubo un amplio margen o diferencia entre estos dos algoritmos se eligió este último como el mejor algoritmo de predicción por sus indicadores de métricas de evaluación Se usó una variable objetivo Dependiente: peso de racimos para el primer caso el resultado de la evaluación del modelo como el Error Absoluto Medio (MAE) para Random Forest fue de 13.2 y en el modelo Xgboost fue de 13.1 en la segunda métrica de evaluación del modelo de predicción fue el Error Porcentual Absoluto Medio (MAPE) para Random Forest fue del 21.39 y para el Modelo Xgboost fue 21.17 por lo consiguiente se tiene una mínima diferencia entre los dos modelos de predicción Mediante el análisis del Modelo se obtuvo las variables más influyentes para la predicción y son las siguientes fumigación fertilización deschive_f2 y queda claro que en estas variables se debe poner más atención en la Hacienda Bananera para poder ir mejorando su productividad Posteriormente se espera realizar muchas más combinaciones con diferentes variables en torno a la producción Bananera y para una mejor eficiencia en la predicción de peso de racimos de banano se necesitaría que estas se encuentren monitoreadas por sensores dependiendo su naturaleza y así llegar a conclusiones que sean provechosos para el desarrollo de Haciendas Bananeras

Zur Langanzeige