Estándares y guías para la digitalización

Guía para la apertura de datos

Pasos para la apertura de datos

La Plataforma Nacional de Datos Abiertos (PNDA) permite encontrar, explorar y reutilizar datos gubernamentales de manera simple y segura para diversos fines: desde realizar investigaciones hasta analizar oportunidades de negocio. Es la página oficial para que todas las entidades, públicas y privadas, publiquen su información.

Para llevar adelante el proceso de publicación de datos abiertos en la PNDA, sigue estos 6 pasos:

1. Seleccionar el conjunto de datos a abrir

Conoce la demanda de información

Todo parte de conocer cuál es la demanda de información que requieren los diferentes públicos—ciudadanía, sociedad civil, instituciones académicas, medios de comunicación, etc.—de tu institución. Hazte las siguientes preguntas para empezar:

  • ¿Qué información solicitan regularmente y exige un procesamiento de datos?
  • ¿Qué datos existen en tu entidad que puedan ser de interés para la ciudadanía?
  • ¿Qué información se brinda habitualmente a la prensa?
  • ¿Qué datos se intercambian con otras entidades públicas que puedan ser de interés general?

Comienza por los datos más sencillos de publicar

Una vez que tienes clara la demanda por datos, lo más simple es comenzar por los datos ya publicados o que sean fáciles transformar. Reconoce cuáles son los más sencillos de publicar de la siguiente manera:

  • Son aquellos que se pueden sacar fácilmente de un sistema informático, sin mucho esfuerzo y que por su naturaleza no generan controversias con la opinión pública.
  • Que sean de fácil mantenimiento y que no pierdan actualidad.
  • Datos que ya están publicados en el sitio web de la entidad.

Por ejemplo:

  • Ministerio de Salud: registro diario de casos positivos de COVID-19 confirmados con cualquier tipo de prueba.
  • Instituto Peruano del Deporte: registro de las federaciones deportivas nacionales, de ligas deportivas, clubes deportivos y deportistas calificados de alto nivel.

Dialoga con la ciudadanía

Luego de completar los pasos anteriores, se pueden generar diálogos con la ciudadanía que permitan conocer cuál es su interés por los datos del organismo. Recuerda que la conversación se enfoca en los requerimientos de los participantes y, desde el sector público, se buscan soluciones a estos problemas.

Usa diversos canales de comunicación (presenciales y virtuales) y recoge la información con la técnica de investigación que prefieras. Finalmente, documenta las solicitudes de datos que has recibido para luego evaluar su viabilidad de publicación.

Otros criterios para seleccionar datos

Si pensamos en el ámbito de los gobiernos locales, existen municipalidades con una importante oferta de datos abiertos relativa a:

  • Atractivos turísticos y gastronomía
  • Licencias de funcionamiento y de construcción
  • Ejecución de proyectos de obras públicas
  • Certificados de inspección técnica de seguridad en edificaciones

Por otro lado, el Barómetro Mundial de Datos Abiertos (2020) señala que el impulso a la apertura de datos sigue siendo crucial para generar valor económico y social, y contribuir a la transparencia en los gobiernos. Se tratan de datos relativos a:

  • Presupuesto
  • Gastos
  • Contratación
  • Registros de empresas
  • Legislación
  • Procesos electorales

2. Convertir el formato del archivo a un formato abierto

Para elegir el formato indicado para la estructuración de datos asegúrate de que sea abierto, legible directamente por computadoras, permita un uso sin restricciones y se encuentre entre los más usados por los consumidores de datos. No se usan formatos cerrados o no editables como el formato PDF.

Estos son algunos de los formatos de publicación que puedes usar:

  • CSV (Valores Separados por Coma): es el formato más utilizado en datos abiertos. Es un tipo de documento de texto plano para representar datos tabulados en columnas separadas por comas (o punto y coma) y filas separadas por saltos de línea.
  • XML (Lenguaje Etiquetado Extensible): es el estándar utilizado para el intercambio de información estructurada entre diferentes plataformas.
  • JSON (Notación de objetos Javascript): es un formato simple y ligero para el intercambio de datos, de fácil lectura e interpretación por las personas y sencillo para ser analizado y generado por las máquinas.

3. Incluir los metadatos

Una manera precisa de definir a los metadatos es que son “datos acerca de los datos” y brindan información sobre los datos producidos. Son características que describen a un conjunto de datos y sirven para organizar, clasificar, relacionar y explicar el contexto de los datos. Son tan importantes porque permiten a los usuarios entender los datos así como realizar la interoperabilidad con otras fuentes de información o portales de datos abiertos.

Hay dos pasos para incluirlos:

1. Contexto de metadatos

Al crear conjuntos de datos existen diferentes formas de publicar metadatos, esta es la estructura de los formatos más comunes y de carácter obligatorio:

1) Título 2) Título URL descripción 3) Descripción 4) Entidad 5) Fuente 6) Etiquetas 7) Fecha de creación 8) Frecuencia de actualización 9) Última actualización 10) Versión 11) Licencia 12) Idioma 13) Nivel de acceso público 14) Autor 15) Email del autor (correo electrónico) 16) Mantenedor 17) Email del mantenedor (correo electrónico) 18) Tipo de recurso 19) Formato 20) Cobertura

2. Diccionario de datos

Archivo que contiene los metadatos del conjunto de datos. Se debe incorporar un metadato por cada dato cargado.

4. Aplicar las buenas prácticas de calidad de datos para la publicación

Los datos abiertos de alta calidad son una condición previa para analizar, reutilizar y garantizar el valor de los mismos. Su calidad es sinónimo de credibilidad. Estos son los principales estándares que debe tener tu dataset o conjunto de datos a publicar en la Plataforma Nacional de Datos Abiertos:

  • Anonimización: su objetivo es eliminar o reducir al mínimo los riesgos de identificar a las personas a las que corresponden los datos. Este es un proceso obligatorio.
  • Granularidad: es el nivel de detalle con el que se desea almacenar la información sobre el dataset analizado.
  • Estandarización: su finalidad es la formulación de reglas que permitan el desarrollo ordenado de una actividad.
  • Completitud: todos los registros u observaciones deben tener un valor.
  • Validez: los registros u observaciones representan correctamente al mundo real.
  • Usar catálogos oficiales: existen identificadores únicos fundamentales para la prestación de servicios digitales o trámites (cuando correspondan) como la Reniec, INEI, Sunarp.

5. Publicar en la Plataforma Nacional de Datos Abiertos y tener indicadores (KPI’s) de usabilidad

Primero se designará al encargado de publicar los datos de tu entidad, se sugiere al director o jefe o responsable del área de Tecnología de la Información (TI).

Segundo, se solicitará a la Secretaría de Gobierno y Transformación Digital de la PCM el acceso a la PNDA a través del correo: mesadeayuda@gobiernodigital.gob.pe. Se le facilitará:

  • Un usuario
  • Una contraseña
  • La ruta o link para cargar archivos
  • La explicación del proceso de carga de archivos

Al crear su usuario, ya podrá publicar su información en la PNDA, incluyendo los tres archivos trabajados previamente:
  • Contexto de metadatos
  • Diccionario de datos
  • Dataset o conjunto de datos

Como entidad, de acuerdo a sus recursos, definirá la frecuencia de publicación. Suele ser mensualmente.

Para medir el uso que le da la ciudadanía a la información publicada, ten en cuenta los indicadores (KPI’s) de usabilidad. Estos son algunos indicadores a tener en cuenta:

  • Número de visitas al dataset
  • Número de descargas del dataset
  • Ranking de dataset más descargados

Esto serviría para confirmar la demanda de información de la población establecida en el paso 1.

6. Comunicar a la población

Los datos no tienen valor si no se usan. En ese sentido, es importante informar a la ciudadanía qué información has puesto a su disponibilidad. Por ejemplo:

  • Utiliza tus propios canales de comunicación (redes sociales, boletines, etc.) para comunicar los nuevos datos que tiene la ciudadanía a su disposición.
  • Elabora contenidos (infografías, videos, artículos) y promuévelos desde tu institución para sensibilizar y fomentar el uso de los datasets.
  • Incorpora esta práctica en las estrategias de comunicación de tu entidad y compártelo de manera masiva a través de notas de prensa, campañas informativas, etc.