Reaprovechar la información, pero bien
Últimamente me las estoy viendo con las bases de datos de patentes, esas raras estructuras donde el contenido se vierte de la forma más ininteligible posible para el usuario. Cosas de la industria, supongo.
A veces, cuando uno acude a google a buscar algún dato sobre una patente o una tesis (no es que sea masoquista, es que forma parte de mi trabajo), no acaba en Teseo (base de datos de tesis, elaborada por el Ministerio de Educación y Ciencia) o en la base de datos de la Oficina Española de Patentes y Marcas, dos fuentes más o menos fiables de las que extraer la información.
No. Cada vez con más frecuencia uno se ahoga buceando en las turbias aguas de sitios web como Cibernetia o Invenia. Estas web, se sirven de información externa a ellas (muchas veces sin pedir permiso a los particulares y organismos productores) para rellenar miles de páginas web que (por mor de los enlaces entre ellas supongo) les colocan casi siempre en lo más alto en el ránking de resultados devueltos por google. En cierto modo se aprovechan de la mala optimización de estas bases de datos (Teseo es invisible a los ojos de google, por ejemplo) y de su contenido para ganar dinero a través de los anuncios que atestan sus páginas. La mezcla entre contenido y publicidad, de la manera más confusa posible, revela a las claras las intenciones de estos sitios. Otra pista definitiva: estas web no contienen ni una palabra de texto original.
Otra de las características de estas web es su opacidad; en Cibernetia no encontramos un triste quiénes somos o qué hacemos. Tan sólo un correo-e de contacto. En Invenia, sin embargo, sí dan la cara. Encontramos datos de contacto e incluso el nombre de su fundador. Según su definición y sus objetivos, es una empresa documental en toda regla. Su director, incluso, acudió al último FESABID a participar en una mesa redonda sobre Rentabilidad de la Información. Ahí está bien grandote el logotipo en su página de inicio, supongo que con la intención de otorgar cierta credibilidad a sus contenidos.
Es una pena que las empresas que aprovechan el contenido recopilado, estructurado y clasificado (con el costo económico que ello genera) por los organismos oficiales no sean capaces tampoco de darles un valor añadido a la información, desarrollando productos útiles que proporcionen un servicio de interés, y les permitan un beneficio económico lógico. En EEUU, por ejemplo, hay todo un ecosistema informativo alrededor de la base de datos Medline. A partir de sus datos, se están desarrollando decenas de interfaces y de aproximaciones alternativas a la información que contienen, focalizadas en tipologías de usuarios concretas o en criterios documentales diferentes a los usados por la institución productora.
La recién aprobada Ley sobre reutilización de la información del sector público en España [pdf] abre la puerta a acuerdos entre Estado y empresas para el reaprovechamiento de esta ingente cantidad de información administrativa generada a diario por las distintas instituciones. Espero que prevalezca el buen criterio, y sólo se estimen las solicitudes emitidas por empresas que realmente aporten un valor extra a la información y un servicio de calidad al ciudadano. Sin duda, las administraciones llevan años demostrando su incapacidad para hacerlo por sí solas.

Foto: Alonso Lobato


