El Big data es el último mojón en una larga historia de conceptos, relacionados con la estadística moderna y la matemática aplicada", dijo Guillermo Leale, consultor en Data Science de SIMA y la UTN Rosario. Los hitos de esa historia, dijo, comienzan con el Algoritmo, siguen en 1955 con Inteligencia Artificial (pensar como el humano), en 1974 con Data Science (ciencia con datos procesados), en 1997 con Minería de datos (patrones ocultos) y en 2011, finalmente, con Big data, que él denomina "las tres V". "En realidad, Big data no es su traducción literal, hacía mucho que usábamos muchos datos", dijo Leale. "Las tres V son: Volumen (muchísimos datos que a veces necesitan múltiples centros de cómputos), Variedad (cada tipo de dato tiene su procesamiento y complejidad) y Velocidad.
Leale dijo que el Big data tiene dos usos más destacables: "la fuerza y la inteligencia". Administrar grandes volúmenes de datos, como Google Fotos, Spotify, Netflix, Google Maps: tienen millones de datos de millones de usuarios; pueden agrupar fotos de una persona, identificar lo que nos puede gustar, etc.
Así, "los algoritmos pueden aplicarse a mejorar las imágenes de los sensores remotos y a detectar las imágenes falsas: a predecir, es decir, hacer previsiones sobre el futuro con un error medible, lo que no sustituye sino que ayuda a la toma de decisiones del profesional", explicó. "SIMA y NASA Harvest están trabajando con imágenes satelitales, y desarrollamos un algoritmo que mejora 20% la predicción de rendimientos", dijo. Hacia adelante, buscan ampliar el alcance de los cultivos y regiones, y explotar al máximo el volumen de datos.
Yanina Bellini Saibene, del INTA Anguil, en La Pampa, dijo que "el INTA ha procesado información de sensores remotos desde los 80, no solo para investigación sino también para productores y extensión".
La investigadora explicó que la ciencia de datos se usa en dos direcciones: para el desarrollo de máquinas, componentes precisos, sensores y otras tecnologías, o para la explotación de datos disponibles y/o generados por esos equipos.
Bellini dijo que hay "dos formas tradicionales en que aprende la máquina: de modo supervisado o no supervisado". Esto se usa para un modelo de detección temprana de granizo: el radar registra 7 variables, tomaron 5 cada 5 minutos: tuvieron 65 millones de datos diarios que no se podían procesar ni almacenar. Pasaba a no resultar útil. Así que a la variable le superpiusieron la etiqueta: cayó granizo o no cayó, binario, yendo al campo y consultando a aseguradoras. El resultado fue un modelo con 84% de exactitud.
"Se pueden mapear zonas de mayor riesgo, trabajar con aseguradoras, hacerlo para heladas...", dijo Bellini, y aclaró que en estos desarrollos "participan licenciados en Informática, agrónomos, es multidisciplinario; si no, no se puede".
También mencionó otro ejemplo de aprendizaje supervisado, los drones, trabajando con software R y QGIS. "Los drones son los nuevos contratistas rurales", dijo.
Inbal Becker-Reshef, directora del programa NASA Harvest, trabaja en Ciencias del Suelo y Teledetección. La investigadora dijo que "el uso de datos satelitales para el monitoreo agrícola se remonta a principios de la década del 70, y el potencial de la teledetección sigue siendo enorme".
Hoy, "nuevas constelaciones de satélites revolucionan el uso para la agricultura, lo que permite el monitoreo global a nivel de campo casi a diario", dijo. El registro mundial, a lo largo del tiempo, "dará indicadores de vegetación consistentes y será efectivo para capturar el impacto de eventos climáticos extremos", aseguró.
Para ella, "el desafío es crear métodos robustos para la supervisión de diversos paisajes. La información oportuna y precisa es fundamental para aumentar la transparencia de los mercados", añadió.
NASA Harvest es un innovador programa de Ciencias Aplicadas de la NASA sobre Seguridad Alimentaria y Agricultura basado en décadas de monitoreo agrícola, que se lanzó en diciembre de 2017. Fue realizado a través de un consorcio multisectorial coordinado y dirigido por la Universidad de Maryland.
Becker-Reshef contó que, como parte del plan de acción del G20 sobre agricultura y volatilidad de los precios de los alimentos, en 2011 se lanzó el Monitoreo de la Agricultura Global (GEOGLAM), junto con el Sistema de Información del Mercado Agrícola (AMIS). "Harvest es la contribución de la NASA al G20-GEOGLAM", dijo.
Entre otros miembros del consorcio, "el Ministerio de Agricultura y la Bolsa de Cereales de Buenos Aires colaboran todos los meses en el reporte", comentó. "El objetivo es conducir al desarrollo de una gama de monitores de cultivos, a escalas nacionales, regionales y globales.
La experta dijo que la interacción de NASA Harvest con el Ministerio de Agroindustria y el INTA empezó con AMIS-GEOGLAM. Luego, con esa colaboración pudo formarse el Monitoreo Agrícola en las Américas (AMA), y ya se hicieron varias capacitaciones con el Ministerio, y mapeos de cultivos a escala nacional.
Con la Bolsa de Cereales, la interacción comenzó en 2015, con diversas acciones conjuntas. La más reciente es el monitoreo regional de la condición de cultivos en la Argentina, para producir tableros de control de condiciones de cultivos escala regional para soja y trigo.