Definiciones

Qué son datos abiertos

El sector público produce una gran variedad de información interesante para los ciudadanos y empresas, como por ejemplo, información social, económica, geográfica, estadística, meteorológica o turística y sobre empresas y educación. Esta información tiene unas características que la hacen particularmente atractiva para el sector de los contenidos digitales, ya que es completa, fiable y de calidad.

La filosofía detrás de los datos abiertos es el método científico que se basa en la investigación existente para desarrollar avances cuyo fin último es ayudar a las personas y al planeta que compartimos.

Los siguientes son algunos ejemplos de datos abiertos:

  • Datos financieros gubernamentales
  • La información sobre las acciones que usted ve desplazarse en su newsfeed
  • Datos estadísticos de mercado de acceso desde su buscador
  • Publicaciones de investigación académica

Para qué se publican datos abiertos

La tecnología nos ha permitido capturar datos de maneras y en volúmenes en los que nunca nos imaginamos. Herramientas cada vez más sofisticadas de análisis de datos nos permiten diseccionarlos en nuevas maneras para descubrir tendencias y hallazgos que han moldeado decisiones de negocios cruciales. Estas herramientas nos permiten ver conexiones entre datos que nunca han sido explorados.

  • Transparencia. La fiabilidad y origen de los datos hacen que se convierta en un excelente medio para comunicar la gestión pública realizada, la rendición de cuentas y control externo a la gestión todo ello destinado a ser transparente en la gestión del servicio público y generar confianza en la población. 
  • Reutilización de la información pública. Cualquier organización genera ingentes cantidades de información útil para otros departamentos u organizaciones. Los Datos Abiertos se establecen como una herramienta de publicación y reutilización de la información en la que las administraciones ponen a disposición de la ciudadanía su trabajo para que esta lo reutilice. 
  • Generación incentivación de economías. La generación de economías a partir de los datos abiertos tiene múltiples facetas como son la eficiencia en la gestión ahorros debidos a la reutilización de la información eliminando gastos duplicados, eficiencias asociadas a una mayor visibilidad de los procesos y posibilidad de establecer acciones de mejora sobre ellos, creación de servicios nuevos, permitir establecer mecanismos de colaboración internos o externos, permitir mecanismos de generación de servicios a bajo coste, establecer modelos de comercialización de los datos. 
  • Fuente de innovación. La disponibilidad de nuevas fuentes de datos dan paso a la innovación permitiendo reforzar líneas de negocio, crear nuevos servicios, enfocar problemas desde otras perspectivas, colaboración frente a retos.

 Para quién se publican datos abiertos

  • Para Desarrolladores: Fomentando la reutilización de la información pública, permitiendo la creación de nuevos servicios, favoreciendo la innovación, disminuyendo las inversiones necesarias para el desarrollo de aplicaciones y en general proporcionando una información fiable sobre la que desarrollar investigación y negocio. 
  • Para la Ciudadanía: Poniendo en valor el resultado de la Gestión pública de un modo transparente, consistente y fiable. para la Administración: Disminuyendo las barreras a la reutilización de la información, eliminando redundancias, favoreciendo la eficiencia en la gestión y dificultando situaciones no deseables como corrupción o malversación de fondos públicos.

Decálogo de datos abiertos

Se debería tener en cuenta a la hora de comenzar cualquier iniciativa Open Data de calidad:

  • Publicar datos en formatos abiertos y estándares. Formatos que sean adecuados para permitir la reutilización de los mismos por parte del colectivo de agentes reutilizadores o infomediarios. 
  • Usar esquemas y vocabularios consensuados. En la medida de lo posible se debe hacer uso de estructuras de datos que sigan algún convenio o esquemas definidos. Si se crean vocabularios o esquemas de representación de la información específicos, éstos se deberían exponer públicamente. 
  • Inventario en un catálogo de datos estructurado. También es necesario mantener un punto de consulta donde se incluya un inventario con información descriptiva y técnica sobre los conjuntos de datos que se exponen, así como los metadatos y taxonomías utilizadas para clasificar los diferentes conjuntos de datos que se expongan. 
  • Datos accesibles desde direcciones web persistentes y amigables: El acceso tanto a las fichas como a la propia descarga de datos debe hacerse desde Url’s (direcciones web) que persistan en el tiempo y así evitar que se pierdan las referencias en el futuro. Además deben seguir una estructura homogénea y bien definida, con información legible para que los reutilizadores conozcan o “intuyan” el contenido referido por dichas direcciones web. 
  • Exponer un mínimo conjunto de datos relativos al nivel de competencias del organismo y su estrategia de exposición de datos. Toda administración o entidad que impulse una iniciativa Open Data debe especificar la estrategia de exposición de los conjuntos de datos y sus prioridades, así como publicar los conjuntos de mayor interés según las competencias del propio organismo. 
  • Compromiso de servicio, actualización y calidad del dato, manteniendo un canal eficiente de comunicación reutilizador. Se debe mantener un mínimo de calidad y servicio en la iniciativa Open Data y establecer un canal eficiente de comunicación que permita la interacción bidireccional organismo público – infomediarios. 
  • Monitorizar y evaluar el uso y servicio mediante métricas. Con esto se consigue analizar si se está cumpliendo el compromiso con la comunidad de reutilizadores y cuáles son las potenciales carencias del sistema o de la estrategia. 
  • Datos bajo condiciones de uso no restrictivas y comunes. Las condiciones de uso deberían ser lo menos restrictivas posible y permitir la reutilización libre, incluso para fines comerciales. Se recomienda la creación y uso de licencias tipo, autodocumentadas y que sean comunes entre distintas administraciones. 
  • Evangelizar y educar en el uso de datos. Es necesario concienciar en el uso de los datos, tanto a los colectivos de reutilización específicos (sector TIC, periodismo, investigación, etc.) como a la sociedad en general. Esto fomentará la obtención de conocimiento de forma autónoma y que las nuevas generaciones sean capaces de llegar a conclusiones por sí mismos, sin intermediarios que “piensen” por ellos.
  • Recopilar aplicaciones, herramientas y manuales para motivar y facilitar la reutilización.

Información sobre los formatos de conjuntos de datos

El portal de datos abiertos del Consejo de Transparencia de Andalucia publica los datos en distintos formatos. Preferiblemente se utilizan formatos no propietarios, aunque también se genera información en algún formato propietario que sea considerado un estándar de facto por la mayor parte de la ciudadanía:

  • CSV: (Comma-separated values). Valores separados por coma. Los ficheros CSV son un tipo de documento en formato abierto sencillo para representar datos en formato de tabla. Las columnas se separan por comas (o punto y coma) y las filas por saltos de línea. 
  • XLS: (Microsoft Office Excel) Es un formato propietario de Microsoft que muestra la información en celdas organizadas en filas y columnas, y cada celda contiene datos o fórmulas, con referencias relativas o absolutas a otras celdas.
  • XML: (Extensible Markup Language). Este formato tiene una importante función en el proceso de intercambio, estructuración y envío de datos en la Red. Describe los datos de tal manera que es posible estructurarlos utilizando para ello etiquetas que no están predefinidas. De esta manera los datos están delimitados, lo que favorece la interoperabilidad de los mismos.
  • TXT: Documento de texto plano. Puede utilizar diferentes codificaciones de caracteres.
  • RDF: (Resource Description Framework) RDF no es un formato concreto sino una infraestructura para la descripción de los recursos de la red mediante expresiones de la forma sujeto-predicado-objeto. El sujeto es el recurso que se describe, el predicado es la propiedad sobre la que se quiere establecer el recurso y el objeto es el valor de la propiedad con el que se establece la relación. La combinación de RDF con otras herramientas permite añadir significado a las páginas y es una de las tecnologías esenciales para la web semántica. Existen varios formatos de representación: XML, para procesamiento automático; N3, para representación en texto plano de forma más legible para humanos; Turtle, como simplificación del anterior.
  • RSS: (Really Symple Sindication) Es un formato XML para la distribución de contenidos de páginas web. Facilita la publicación de información actualizada a los usuarios suscritos a la fuente RSS sin necesidad de usar un navegador, utilizando un software especializado en este formato.
  • SHP: (Shapefile) Es un formato propietario estándar de datos espaciales, desarrollado por la compañía ESRI, que almacena tanto la geometría como la información alfanumérica. Este formato no está preparado para almacenar información topológica. Actualmente se ha convertido en formato estándar de facto para el intercambio de información geográfica entre Sistemas de Información Geográfica por la importancia que los productos ESRI tienen en el mercado SIG y por estar muy bien documentado.
  • KML: (Keyhole Markup Language) Es un lenguaje de marcado basado en XML para representar datos geográficos en tres dimensiones.
  • DCAT: El Dataset Catalog es un formato RDF que describe de manera estándar los catálogos de datos para que sean interoperables.
  • WMS y WFS: Son servicios definidos por el OGC para, de forma dinámica y partir de información geográfica, producir mapas de datos referenciados espacialmente.
  • GPX: o GPS (eXchange Format) (Formato de Intercambio GPS) es un esquema XML pensado para representar información para navegadores. Se puede usar para describir puntos (waypoints), recorridos (tracks), y rutas (routes).
  • GeoRSS: es un conjunto de estándares para representar información geográfica mediante el uso de capas y está construido dentro de la familia de estándares RSS. El contenido consiste en puntos de interés georreferenciados y otras anotaciones, en general las fuentes se diseñan para generar mapas.
  • KMZ: formato de compresión de ficheros KML.
  • GEO: es un microformato utilizado para el marcado de coordenadas geográficas en HTML. El uso de Geo permite a las herramientas que utilicen analizadores sintácticos (por ejemplo otros sitios web, o la extensión Operator de Firefox), extraer las ubicaciones y mostrarlas usando algún otro sitio web o herramienta de mapeo, o cargarlas en un dispositivo GPS, indexarlas, acumularlas, o convertirlas en un formato alternativo.
  • MDB: Extensión de archivo utilizado en ciertas versiones de bases de datos de Microsoft Access.
  • ZIP: es un formato de compresión sin pérdida, muy utilizado para la compresión de documentos, imágenes o programas.

Información sobre las licencias de conjuntos de datos

En 2009, la organización OKFN (Open Knowledge Foundation Network) desarrolló las primeras licencias específicas para datos abiertos, las licencias Open Data Commons:

  • Open Data Commons Public Domain Dedication and License (PDDL) que permite difundir, reutilizar o adaptar los datos sin restricción alguna. 
  • Open Data Commons Attribution License al igual que la licencia de Creative Commons Reconocimiento, se exige la referencia a la autoría o fuente de los datos para la reutilización de la información.
  • Open Data Commons Open Database License (ODbL) que permite la reutilización de los datos siempre que se reconozca la autoría de la información original; se mantenga la misma licencia en las obras derivadas las cuales puede restringir su uso si, además, se distribuye una versión sin dichas restricciones de uso. 

En general se está estandarizando el uso de las licencias Creative Commons. Creative Commons desarrolla, apoya y administra infraestructuras técnicas y jurídicas que maximizan la creatividad digital, el compartir e la innovación. 

Poner vuestras obras bajo una licencia Creative Commons no significa que no tengan copyright. Este tipo de licencias ofrecen algunos derechos a terceras personas bajo ciertas condiciones:

Imagen Descripción
Imagen Reconocimiento

Reconocimiento (Attribution): En cualquier explotación de la obra autorizada por la licencia hará falta reconocer la autoría.

imagen No comercial

No Comercial (Non commercial): La explotación de la obra queda limitada a usos no comerciales.

Imagen Sin obras derivadas

Sin obras derivadas (No Derivate Works): La autorización para explotar la obra no incluye la transformación para crear una obra derivada.

Imagen Compartir Igual

Compartir Igual (Share alike): La explotación autorizada.

 

Con estas condiciones se pueden generar las seis combinaciones que producen las licencias Creative Commons: 

Imagen Descripción
Imagen Reconocimiento by Reconocimiento (by): Se permite cualquier explotación de la obra, incluyendo una finalidad comercial, así como la creación de obras derivadas, la distribución de las cuales también está permitida sin ninguna restricción.
Imagen Reconocimiento by nc Reconocimiento – NoComercial (by-nc): Se permite la generación de obras derivadas siempre que no se haga un uso comercial. Tampoco se puede utilizar la obra original con finalidades comerciales.
Imagen Reconocimiento by nc sa Reconocimiento – NoComercial – CompartirIgual (by-nc-sa): No se permite un uso comercial de la obra original ni de las posibles obras derivadas, la distribución de las cuales se debe hacer con una licencia igual a la que regula la obra original.
Imagen Reconocimiento by nc nd Reconocimiento – NoComercial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original ni la generación de obras derivadas.
Imagen Reconocimiento by sa Reconocimiento – CompartirIgual (by-sa): Se permite el uso comercial de la obra y de las posibles obras derivadas, la distribución de las cuales se debe hacer con una licencia igual a la que regula la obra original.
Imagen Reconocimiento by nd Reconocimiento – SinObraDerivada (by-nd): Se permite el uso comercial de la obra pero no la generación de obras derivadas.

 

El ANEXO del Real Decreto 1495/2011, de 24 de octubre, de desarrollo de la Ley 37/2007, sobre reutilización de la información del sector público, para el ámbito del sector público estatal establece un modelo de Aviso legal tipo que es el que el Consejo establece para el uso y reutilización de sus datos. Ver Aviso legal.

Licencia de datos del Consejo (Aviso legal)

Obligatoriedad de las condiciones generales.

Las presentes condiciones generales, vincularán a cualquier agente reutilizador por el mero hecho de hacer uso de los documentos sometidos a ellas.

Autorización de reutilización y cesión no exclusiva de derechos de propiedad intelectual.

Las presentes condiciones generales permiten la reutilización de los documentos sometidos a ellas para fines comerciales y no comerciales. Se entiende por reutilización el uso de documentos que obran en poder de los órganos de la Administración General del Estado y los demás organismos y entidades del sector público estatal referidos en el artículo 1.2 del Real Decreto 1495/2011, de 24 de octubre, por el que se desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público estatal, por personas físicas o jurídicas, con fines comerciales o no comerciales, siempre que dicho uso no constituya una actividad administrativa pública. La reutilización autorizada incluye, a modo ilustrativo, actividades como la copia, difusión, modificación, adaptación, extracción, reordenación y combinación de la información.

El concepto de documento es el establecido en el apartado 2 del artículo 3 de la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público, por lo que comprende toda información cualquiera que sea su soporte material o electrónico así como su forma de expresión gráfica, sonora o en imagen utilizada, incluyendo, en consecuencia, también los datos en sus niveles más desagregados o “en bruto”.

Esta autorización conlleva, asimismo, la cesión gratuita y no exclusiva de los derechos de propiedad intelectual, en su caso, correspondientes a tales documentos, autorizándose la realización de actividades de reproducción, distribución, comunicación pública o transformación, necesarias para desarrollar la actividad de reutilización autorizada, en cualquier modalidad y bajo cualquier formato, para todo el mundo y por el plazo máximo permitido por la Ley.

Condiciones generales para la reutilización.

Son de aplicación las siguientes condiciones generales para la reutilización de los documentos sometidos a ellas:

  • Está prohibido desnaturalizar el sentido de la información.
  • Debe citarse la fuente de los documentos objeto de la reutilización. Esta cita podrá realizarse de la siguiente manera: “Origen de los datos: Consejo de Transparencia y Protección de Datos de Andalucía.
  • Debe mencionarse la fecha de la última actualización de los documentos objeto de la reutilización, siempre cuando estuviera incluida en el documento original.
  • No se podrá indicar, insinuar o sugerir que el Consejo de Transparencia y Protección de Datos de Andalucía titular de la información reutilizada participa, patrocina o apoya la reutilización que se lleve a cabo con ella.
  • Deben conservarse, no alterarse ni suprimirse los metadatos sobre la fecha de actualización y las condiciones de reutilización aplicables incluidos, en su caso, en el documento puesto a disposición para su reutilización.

Exclusión de responsabilidad.

La utilización de los conjuntos de datos se realizará por parte de los usuarios o agentes de la reutilización bajo su propia cuenta y riesgo, correspondiéndoles en exclusiva a ellos responder frente a terceros por daños que pudieran derivarse de ella.

El Consejo de Transparencia y Protección de Datos de Andalucía no será responsable del uso que de su información hagan los agentes reutilizadores ni tampoco de los daños sufridos o pérdidas económicas que, de forma directa o indirecta, produzcan o puedan producir perjuicios económicos, materiales o sobre datos, provocados por el uso de la información reutilizada.

El Consejo de Transparencia y Protección de Datos de Andalucía no garantiza la continuidad en la puesta a disposición de los documentos reutilizables, ni en contenido ni en forma, ni asume responsabilidades por cualquier error u omisión contenido en ellos.

Responsabilidad del agente reutilizador.

El agente reutilizador se halla sometido a la normativa aplicable en materia de reutilización de la información del sector público, incluyendo el régimen sancionador previsto en el artículo 11 de la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público.