El puente entre los datos y la ciencia: ¿qué hay de bueno con eso?

De Eos.

El uso de conjuntos de datos de teledetección satelital puede ser una tarea desalentadora. Giovanni, una herramienta basada en la web, facilita el acceso, la visualización y la exploración de muchos de los conjuntos de datos de ciencias de la Tierra de la NASA.

giovanni-africa-aerosol-800x600
Este mapa satelital promediado en el tiempo del espesor óptico del aerosol de marzo frente a la costa de África occidental desde 2003 hasta 2016 incorpora varias de las nuevas capacidades de la infraestructura de visualización de datos Giovanni de la NASA. Crédito: Giovanni

Por zhong liu y James Acker 24 agosto 2017

Desde que comenzó la era de los satélites, los investigadores y otros han utilizado datos recopilados de satélites de observación de la Tierra, pero el uso de conjuntos de datos basados ​​en satélites sigue siendo un desafío. Poner los datos en un formato común, manejar grandes volúmenes de datos, elegir el software de análisis correcto e interpretar los resultados requiere una inversión significativa en recursos informáticos, mano de obra y capacitación.

Se ha diseñado un nuevo sistema de infraestructura para ayudar a una amplia gama de usuarios de todo el mundo con el acceso y la evaluación de datos, así como con la exploración y el descubrimiento científicos. Este sistema, la Infraestructura de Análisis y Visualización en Línea Interactiva Geoespacial (Juan), fue desarrollado por el Centro de Servicios de Información y Datos (DISC) Goddard Earth Sciences (GES) de la NASA.

El objetivo primordial de Giovanni es proporcionar a los científicos y al público una forma simplificada de acceder, evaluar y explorar los conjuntos de datos satelitales de la NASA. Aquí describimos las últimas capacidades de Giovanni con ejemplos y discutimos los posibles planes futuros para este innovador sistema.

Desafíos del uso de datos satelitales

La necesidad de observaciones a gran escala aumenta a medida que las observaciones globales se vuelven más importantes para comprender los procesos de cambio global. En los vastos océanos y continentes remotos de la Tierra, los programas terrestres tradicionales a gran escala para observar la atmósfera, el océano y la superficie terrestre pueden ser útiles. difíciles y costosos de implementar y mantener y, por lo tanto, no son prácticos para proporcionar datos de observación adecuados a largo plazo para la investigación y las aplicaciones. Sin embargo, la necesidad de observaciones a gran escala aumenta a medida que las observaciones globales se vuelven sustancialmente más importantes para comprender los procesos de cambio global, como los cambios de temperatura y precipitación.

Los instrumentos satelitales pueden superar las limitaciones de la observación de la superficie al realizar observaciones sinópticas repetidas de la superficie terrestre, el océano y la atmósfera de la Tierra. Por ejemplo, la NASA Sistema de Observación de la Tierra (EOS) es una campaña de observación global que consiste en una serie coordinada de satélites en órbita polar destinados a observaciones globales a largo plazo, lo que permite una mejor comprensión de los sistemas geofísicos de la Tierra.

Sin embargo, a muchos investigadores les resulta difícil acceder y utilizar los datos de la NASA. Los formatos de datos heterogéneos, las estructuras de datos complejas, el almacenamiento de datos de gran volumen, los requisitos de programación especiales, las diversas opciones de software analítico y otros factores a menudo requieren una inversión significativa en tiempo y recursos, especialmente para los principiantes.

Al facilitar el acceso y la evaluación de los datos, así como al promover el acceso abierto para crear un campo de juego nivelado para los científicos sin fondos, los datos de la NASA se pueden usar más fácilmente para el descubrimiento científico y los beneficios sociales. Giovanni fue desarrollado para avanzar en este objetivo. Con la ayuda de Giovanni, investigadores de todo el mundo han publicado más de 1300 artículos revisados ​​por pares en una amplia gama de disciplinas de las ciencias de la Tierra y otras áreas.

Una breve historia de Giovanni

Giovanni se inició y desarrolló para un acceso y una evaluación más rápidos y sencillos de los conjuntos de datos en GES DISC [Liu et al., 2007; Acker and Leptoukh, 2007; Berrick et al., 2009]. La primera implementación de Giovanni fue un sistema de visualización y análisis en línea para lluvias tropicales conjuntos de datos de la misión de medición de precipitaciones tropicales de la NASA (TRMM).

A medida que el proyecto ganó popularidad, los científicos solicitaron que se incluyeran más conjuntos de datos satelitales en Giovanni. Para abordar esta demanda, creamos múltiples portales de datos basados ​​en disciplinas o misiones. El Giovanni actual ha evolucionado aún más, presentando una nueva interfaz web unificada para respaldar la investigación interdisciplinaria del sistema terrestre, lo que permite el uso sinérgico de conjuntos de datos de diferentes misiones satelitales.

Una amplia selección de conjuntos de datos

Giovanni proporciona acceso a numerosos conjuntos de datos satelitales, concentrados principalmente en las áreas de composición atmosféricadinámica atmosférica, precipitación global, hidrología e irradiancia solar.

Más de 1.600 variables están actualmente disponibles en Giovanni. La interfaz web tiene capacidades de búsqueda por palabras clave y facetas para localizar variables de interés (Figura 1). Por ejemplo, una búsqueda de «precipitación» arroja más de 100 variables relacionadas. Un usuario que realiza una búsqueda por facetas puede filtrar por variables basadas en misiones satelitales (TRMM, Medición de Precipitación Global (galones por minuto)), instrumentos, resolución espacial o temporal, u otras categorías.

giovanni-web-interface-variables
Fig. 1. Más de 1600 variables están disponibles para su visualización y análisis en la interfaz web de Giovanni, que se muestra aquí. Los usuarios tienen acceso a métodos analíticos y visualización de uso común, varias capacidades de búsqueda y formatos de archivo que admiten la exploración de datos GIS. Los datos de entrada y salida se pueden descargar para su posterior análisis. Crédito: Giovanni

La vida útil operativa de los satélites en órbita terrestre baja suele ser bastante limitada (del orden de 5 años), mucho menos de los 30 años recomendados por la Organización Meteorológica Mundial para desarrollar conjuntos de datos climatológicos. Sin embargo, es posible que algunos usuarios aún deseen realizar estudios preliminares con estos conjuntos de datos satelitales para obtener información sobre la distribución espacial y la variación entre estaciones. Giovanni brinda la capacidad de derivar mapas climatológicos y series de tiempo basados ​​en períodos de tiempo definidos por el usuario (ver Figura 2).

giovanni-multisatellite-precipitation-analysis-climatology
Fig. 2. La climatología de la precipitación del análisis de precipitación multisatélite (TMPA) del TRMM (1998–2016, milímetros por día) para el verano boreal (junio, julio y agosto). Crédito: Giovanni
Características analíticas

Giovanni incluye muchas capacidades analíticas y de trazado de uso común para capturar características espaciales y temporales de conjuntos de datos. Las opciones de mapeo incluyen promedio de tiempo (Figura 3), animación, acumulación de precipitación (Figura 4), superposición de dos conjuntos de datos con promedio de tiempo y climatología definida por el usuario (Figura 2). Para las series de tiempo, las opciones incluyen áreas promedio, diferencias, estacionales y Diagramas de Hovmöller (Figura 5).

giovanni-modis-superficie-temperaturas
Fig. 3. Julio de 2016, el mes más caluroso jamás registrado en el mundo. Se muestran las temperaturas superficiales diurnas del espectrorradiómetro de imágenes de resolución moderada (MODIS) (en kelvin). Crédito: Giovanni
giovanni-lluvia-acumulada-imerg-louisianna
Fig. 4. Lluvia acumulada (milímetros) de GPM Integrated Multisatellite Retrievals (IMERG) Final Run (versión 4), que muestra una inundación sin precedentes en Luisiana en agosto de 2016. Crédito: Giovanni
giovanni-hovmoller-enso-precipitación
Fig. 5. Diagrama de Hovmöller de precipitación mensual TMPA (milímetros por día) en la región tropical (5°S–5°N) que muestra El Niño–Sur Eventos de oscilación entre 1998 y 2016. Crédito: Giovanni

Secciones transversales, aplicables a conjuntos de datos 3-D de la sonda infrarroja atmosférica de la NASA (AIRE) instrumento y análisis retrospectivo de la era moderna para investigación y aplicaciones (MERRA) programa de análisis de datos, incluye latitud-presión, longitud-presión, tiempo-presión (Figura 6) y perfil vertical.

Para la comparación de datos, Giovanni tiene un código de procesamiento incorporado para conjuntos de datos que requieren conversión y recuadrado de unidades de medida. Las funciones de comparación comúnmente utilizadas incluyen diferencias de mapas y series de tiempo, así como mapas de correlación y XY diagramas de dispersión (promedio de área o promedio de tiempo). También se pueden trazar medias zonales y distribuciones de histogramas.

giovanni-quasi-biennial-oscilliation-merra
Fig. 6. Oscilación cuasi bienal (QBO) vista desde el Análisis retrospectivo de la era moderna para la investigación y las aplicaciones, versión 2 (MERRA-2), entre 1980 y 2017. Crédito: Giovanni
Funciones de visualización

Las funciones de visualización incluyen ajuste de área de mapa interactivo, animación, diagramas de dispersión interactivos, ajuste de rango de datos, elección de paleta de colores, contorno y escala (lineal o logarítmica). La función de ajuste de área sobre la marcha (Figura 7) permite al usuario examinar un mapa de resultados de forma interactiva y en detalle sin volver a trazar los datos.

giovanni-elnino-clorofila-concentracion-centroamerica
Fig. 7. El Niño redujo la productividad del fitoplancton de las aguas costeras del Pacífico frente a América Central durante el invierno de 2015-2016, indicado por concentraciones más bajas de clorofila (miligramos por metro cúbico). Crédito: Giovanni

Giovanni también proporciona animaciones, que son útiles para seguir la evolución de un evento o cambios estacionales. Los diagramas de dispersión interactivos permiten la identificación y geolocalización de un punto de interés en un diagrama de dispersión. Los ajustes de cualquiera de estos gráficos brindan opciones personalizadas a los usuarios.

Los formatos facilitan muchas aplicaciones
giovanni-mensual-precipitacion-norte-de-california
Fig. 8. Serie temporal de precipitación mensual TMPA promediada por área (milímetros por mes) para California, que muestra sequías sin precedentes (2012-2015), seguidas de 2016-2017, el invierno más lluvioso jamás registrado en el norte de California. Crédito: Giovanni

Para respaldar el aumento de las actividades del sistema de información socioeconómica y geográfica (SIG) en ciencias de la Tierra, hemos agregado archivos de forma (un formato de datos vectoriales geoespaciales) para países, estados de los Estados Unidos y las principales cuencas hidrográficas de todo el mundo. Las funciones disponibles para estos archivos de forma son mapas de promedio de tiempo (Figura 4) y acumulados, series de tiempo de promedio de área (Figura 8) e histogramas. Recientemente se han añadido máscaras tierra-mar.

Todos los archivos de datos involucrados en el procesamiento de Giovanni se enumeran y están disponibles para su descarga en la página de linaje generada simultáneamente con la visualización. Los formatos de imagen de salida disponibles son PNG, GEOTIFF y Keyhole Markup Language (KMZ), y se pueden usar para diferentes aplicaciones y paquetes de software. Por ejemplo, los archivos KMZ se importan convenientemente a Google Earth (Figura 9), donde se encuentra disponible una rica colección de superposiciones.

giovanni-nasa-aura-óxido-de-nitrógeno-incendios-wildfires-alberta
Fig. 9. El satélite Aura de la NASA observa el dióxido de nitrógeno (NO2, como concentración por centímetro cuadrado) de los incendios forestales de Fort McMurray en Alberta, Canadá, en mayo de 2016 (importado de Google Earth como KMZ). Crédito: Giovanni

Todos los datos de entrada y salida están disponibles en formatos de formulario de datos comunes de red (NetCDF), que pueden ser manejados por muchos paquetes de software estándar. Además, los usuarios pueden marcar las URL generadas por el procesamiento de Giovanni para referencia, documentación o para compartir con otros colegas.

Planes futuros

Con las funciones y aplicaciones más recientes, Giovanni simplifica el acceso, la evaluación y la exploración de los conjuntos de datos satelitales de la NASA. Con las funciones y aplicaciones más recientes, Giovanni simplifica el acceso, la evaluación y la exploración de los conjuntos de datos satelitales de la NASA. A pesar de estos logros, aún necesitamos mejorar Giovanni para satisfacer la creciente demanda de más capacidades analíticas y de trazado, más conjuntos de datos y tecnologías de la información avanzadas para que la exploración de datos sea simple y productiva.

Los planes futuros incluyen la visualización y el análisis de conjuntos de datos orbitales de satélites (Figura 10), más conjuntos de datos de otros centros de datos, métodos analíticos adicionales y visualización, y análisis de mediciones multisatélite y multisensor.

giovanni-gmi-precipitación-tormenta-tropical-nanmadol
Fig. 10. Una muestra de conjuntos de datos orbitales satelitales del Microwave Imager (GMI) de GPM que muestra la precipitación superficial de la tormenta tropical Nanmadol el 3 de julio de 2017. Crédito: NASA Panoply

Los conjuntos de datos en Giovanni actualmente consisten en variables mapeadas en escalas uniformes de cuadrícula de espacio-tiempo, por lo que los conjuntos de datos orbitales satelitales o no cuadriculados permanecen en gran parte sin explotar, a pesar de que comúnmente brindan una resolución espacial más alta. Agregar conjuntos de datos orbitales a Giovanni podría ayudar a la investigación que requiere una mayor resolución y cobertura de datos.

Los conjuntos de datos de otros centros de datos y misiones satelitales mejorarán aún más a Giovanni para una mejor comprensión de la Tierra como un sistema integrado. Todavía existen barreras en el desarrollo de Giovanni para estudios interdisciplinarios e intercomparación entre conjuntos de datos. Por ejemplo, las terminologías en los conjuntos de datos pueden variar significativamente entre las comunidades de ciencias de la Tierra, lo que requiere esfuerzos coordinados para llegar a un consenso y desarrollar estándares para productos de datos uniformes.

También se espera que el Sistema de registro de usuarios (URS) de toda la NASA mejore la experiencia del usuario de Giovanni. Por ejemplo, con URS, los usuarios pueden establecer preferencias de uso frecuente en sus perfiles, registrar y recuperar su historial personal de exploración de conjuntos de datos y establecer sus propias recopilaciones de datos.

Los desarrolladores de productos de datos pueden cargar sus datos de prueba y compararlos con observaciones y otros conjuntos de datos bien establecidos en Giovanni para identificar problemas en sus productos, una capacidad útil para mejorar la calidad de los datos. Los desarrolladores de Giovanni también podrán comprender mejor a sus usuarios a través de perfiles y otras estadísticas recopiladas de URS, para que puedan desarrollar servicios más fáciles de usar.

La creación de una herramienta comunitaria con un alcance tan grande es un desafío, y la realización completa de esta herramienta requiere la participación activa de la comunidad de usuarios. En resumen, una amplia variedad de funciones nuevas está disponible ahora en Giovanni, pero sigue siendo un trabajo en progreso. La creación de una herramienta comunitaria con un alcance tan grande es un desafío, y la realización completa de esta herramienta requiere la participación activa de la comunidad de usuarios. Alentamos a los usuarios a que brinden sus opiniones a medida que Giovanni continúa evolucionando.

Lee la historia completa aquí.

Deja un comentario