Una de las premisas del denominado movimiento o moda de la Web 2.0, más allá de los frívolos comentarios sobre fuentes grandes, colores brillantes, reflejos, Ajax y demás posts de la blogosfera amarilla, es la de "ofrecer" o "facilitar" tus datos para que otras aplicaciones se nutran de ellos, vía APIs o webservices.
Dapper, o Data Mapper surge con esa finalidad, la de permitir aprovechar (siempre que sea posible) fragmentos de datos de distintas webs para construir una nueva aplicación, de ahí lo de ver la web como un Lego.
Veamos por ejemplo la última aplicación desarrollada con Dapper y comentada en su blog: Blotter.
Se trata de una pequeña aplicación que genera un gráfico con la popularidad de tu blog según Technorati. Para ello lo que hacen es leer el ranking de Technorati y analizarlo, para luego generar un XML con los datos, que ya parsean y generan la gráfica correspondiente a tu blog.

Esa es la potencia de Dapper, y la magia: poder generar datos estructurados a partir de fuentes de datos sin ninguna estructura, gracias al aprendizaje, la repetición y la inferencia de estructuras y patrones.
Así pues, el proceso es el siguiente:
- indicamos un nuevo campo o Field a aprender: para ello nos dirigimos a la URL en cuestión y le indicamos que nuestro campo se va a componer de un determinado fragmento de dicha web (todo esto indicado gráficamente vía Javascript y con una interfaz muy cómoda)
- una vez definido el campo, podremos crear más campos o finalizar esta parte del proceso
- si tenemos varios campos los podemos combinar
- finalizado el proceso se nos mostrarán las diferentes opciones con las que trabajar en nuestra aplicación: con datos XML, en un feed, HTML, etc.
Con el Dapper ya generado lo podemos utilizar indicando una URL que será la fuente de datos, y que generará los datos estructurados y a los que podremos acceder vía una URL única. Perfecto para utilizar en nuestra aplicación.
¿Y esto para qué me sirve?
Para poco o mucho, depende de tu imaginación y de tu curiosidad. Por ejemplo, yo en cuanto tuve la cuenta lo primero que hice fue crear un proyecto nuevo, abrir un post cualquiera de Taberna del Turco e intentar enseñarle qué era contenido de un post y qué era un comentario.
Esto tiene infinidad de utilidades, como por ejemplo, poder generar un feed de los comentarios y saber si alguien ha contestado un comentario mío.
Por desgracia la herramienta no ha funcionado muy bien, supongo que porque se basará en la estructura del HTML que encuentra en el contenido que le hemos marcado para el aprendizaje. Pero esto no tiene porqué pasar siempre (esto era algo realmente difícil), de hecho hay varias aplicaciones que funcionan y bien con Dapper (ahora mismo no se pueden ver porque sigue la beta cerrada, pero pedir una cuenta y buscad el listado).
Ahora me gustaría probar más cosas, como por ejemplo, cómo se comporta ante contenido microformateado, pues estoy seguro que aportarían la mínima información estructural para que se puedan obtener resultados interesantes.

... que lo han abierto y que deja de ser beta privada.
Podéis ver una pequeña revisión en: Dapper, la web vista como un Lego.