Résumé:
La agricultura no sólo proporciona alimentos y materias prima es una actividad con
mucho potencial y a su vez la columna vertebral del sistema económico del país por
tal razón se debe dirigir esfuerzos para ir mejorando esta indispensable práctica La
agricultura en Ecuador no se ha visto beneficiada fuertemente por los diferentes
avances tecnológicos en materia de Ciencia de Datos y Machine Learning estas
técnicas ayudan a entender los patrones y las dinámicas que sigue sus datos de esta
forma el objetivo principal de esta investigación es utilizar técnicas de Machine
Learning para predecir pesos de racimos para posteriormente realizar un análisis que
le permita a un Productor tomar las mejores decisiones para sus plantaciones
En primera instancia de este trabajo investigativo consistió en recopilar todos los datos
necesarios para entrenamiento y validación de los modelos de predicción en la cual
las variables de los parámetros de producción tales como peso riego fumigación
fertilización deschive_f2, deschive_f3, # manos del racimo, edad del racimo La Base
de Datos con la que se trabajó, es mediante el Sistema de BI de producción que tiene
implementado la Hacienda Bananera San Humberto cabe resaltar que se tiene datos
entre el año 2021 y 2022 por lo tanto las conclusiones que se obtuvieron en el
presente trabajo están respaldadas por datos validados y absolutos
Ahora bien con los datos organizados y preprocesados se entrenan y se validan los
modelos para esto se utilizó el programa RStudio y sus diferentes paquetes y librerías
En este caso se utilizó el algoritmo Random Forest el cual recibe los parámetros
internos para adecuar el modelo a los requerimientos del problema además recibe
los datos de entrada y la salida esperada Después se realizó el modelo con el
algoritmo Xgboost que resultó ser más eficiente en su ejecución aunque no hubo un
amplio margen o diferencia entre estos dos algoritmos se eligió este último como el
mejor algoritmo de predicción por sus indicadores de métricas de evaluación Se usó
una variable objetivo Dependiente: peso de racimos para el primer caso el resultado
de la evaluación del modelo como el Error Absoluto Medio (MAE) para Random Forest
fue de 13.2 y en el modelo Xgboost fue de 13.1 en la segunda métrica de evaluación
del modelo de predicción fue el Error Porcentual Absoluto Medio (MAPE) para
Random Forest fue del 21.39 y para el Modelo Xgboost fue 21.17 por lo consiguiente
se tiene una mínima diferencia entre los dos modelos de predicción
Mediante el análisis del Modelo se obtuvo las variables más influyentes para la predicción y son las siguientes fumigación fertilización deschive_f2 y queda claro que en estas variables se debe poner más atención en la Hacienda Bananera para poder ir mejorando su productividad
Posteriormente se espera realizar muchas más combinaciones con diferentes variables en torno a la producción Bananera y para una mejor eficiencia en la predicción de peso de racimos de banano se necesitaría que estas se encuentren monitoreadas por sensores dependiendo su naturaleza y así llegar a conclusiones que sean provechosos para el desarrollo de Haciendas Bananeras