Contexto

El Portal de Datos Abiertos de la NASA ofrece un catálogo de 42.946 conjuntos de datos y 555 repositorios de código, así como enlaces a sitios de innovación abierta, archivos científicos de la NASA y códigos y datos de numerosas agencias federales de Estados Unidos. Muchas de las colecciones de conjuntos de datos se describen en archivos de JavaScript Object Notation (JSON).

Dada la gran cantidad de datos de la NASA, los usuarios pueden tener dificultades para saber por dónde empezar o qué conjuntos de datos pueden satisfacer sus necesidades. Este problema se ve agravado por los diferentes conjuntos de datos que tienen diferentes mecanismos de organización interna / lista, lo que confunde aún más al usuario. La NASA está en proceso de crear un catálogo de metadatos interno que actuaría de muchas maneras como lo hace data.nasa.gov públicamente. Ambos catálogos son principalmente catálogos de metadatos, no de datos. En el caso de data.nasa.gov, sus metadatos siguen el estándar de datos abiertos del proyecto y están disponibles como un único JSON en data.nasa.gov/data.json. ¿Qué tipos de visualizaciones de datos o interfaces de usuario se pueden idear que ahorren tiempo y frustración a los usuarios al vincularlos con los conjuntos de datos correctos de una manera más rápida y precisa?

Una ontología define la terminología, organiza las clases de cosas en una taxonomía, describe los tipos de relaciones entre las cosas y especifica los atributos de las mismas. Las relaciones entre estas cosas pueden representarse como una red formada por formas y líneas que las conectan. Cada forma representa un nodo (o cosa) y las líneas representan las relaciones entre los nodos conectados (o cosas). Existen programas informáticos gratuitos de código abierto para desarrollar ontologías y visualizaciones de redes.

Objetivos

Su reto consiste en (1) crear una ontología para integrar las descripciones de conjuntos de datos dispares y disponibles públicamente de la NASA, y (2) desarrollar una visualización de red interactiva para representar las relaciones entre esos conjuntos de datos. Los objetivos de este reto incluyen la especificación de una taxonomía de clases de conjuntos de datos, la integración de la terminología, la definición de las relaciones (también conocidas como propiedades de los objetos) y la identificación de los atributos (también conocidos como propiedades de los datos) de los conjuntos de datos en los catálogos de datos abiertos. A continuación, se puede aplicar la ontología para definir una red en la que los conjuntos de datos son nodos y las relaciones nocionales entre ellos son los enlaces entre nodos. La red debe visualizarse como un diagrama interactivo o un modelo 3D incrustado en una página web.

Las actividades específicas asociadas a este reto incluyen:

  1. Exploración de conjuntos de datos abiertos en la NASA y otras agencias gubernamentales estadounidenses, así como conjuntos de datos libres y abiertos de otras agencias espaciales internacionales.
  2. Identificar conjuntos de datos complementarios, por ejemplo, conjuntos de datos de ciencias de la Tierra, densidades de población, demografía, contaminación, etc.
  3. Obtener la descripción JSON de esos conjuntos de datos. La visualización de la fuente de una página web puede revelar enlaces a datos JSON.
  4. Crear una ontología o una estructura JSON maestra para integrar descripciones de conjuntos de datos dispares.
  5. Visualizar la ontología o los datos JSON integrados como una red interactiva. Los ejemplos de relaciones podrían ser ubicaciones, fuentes, palabras clave, etc.

Una visualización de red ideal será interactiva; por ejemplo, los nodos estarán vinculados a la página web que describe el conjunto de datos. Su red interactiva deberá estar integrada en una página web.

Consideraciones potenciales

Puedes (pero no estás obligado) a considerar lo siguiente cuando desarrolles tu ontología y visualización: