canal.cl / blog: 2010/04

Creación de un medio temático de agregación vía Twitter con Yahoo Pipes y otras herramientas

Una de de cosas en que me he entretenido últimamente es creando cuentas temáticas en Twitter usando herramientas "en la nube".

Esto es un resúmen de lo que presenté en la UDP, mi receta para hacerlo, que pasa por el uso combinado de Google Reader, Yahoo Pipes y algún servicio como Friendfeed. El taller estuvo particularmente dirigido a periodistas presentes o futuros que deseen centralizar información sobre un tema a través de su cuenta Twitter.

Algunos ejemplos de lo que he hecho son @Sociability, @Sociabilidad y el más exitoso: @canal_chile. En taller vimos paso el proceso de creación, y algunos asistentes pudieron seguirlos con sus propios feeds para crear sus propios medios de agregación o newsbots.

Si bien las tres herramientas que he mencionado pueden ser parte importante del proceso, la más interesante quizás sea Yahoo Pipes, que permite hacer operaciones sobre feeds RSS bastante sofisticadas sin necesidad de programar en el sentido tradicional.

El proceso está lleno de detalles, pero conceptualmente es sencillo y consiste en los siguientes pasos:

Paso 1: planificación, recolección de feeds.:

Paso 2: agregación y filtrado dentro de Yahoo Pipes, lo que permite:

agregación de fuentes múltiples con criterios diferentes,
filtros por palabras clave,
filtros para disminuir duplicados y priorizar posts recientes,
uso de APIs externas como OpenCalais.

Paso 3: conexión desde un gestor de feeds vía RSS. Esto permite complementar los feeds automáticos con acciones manuales como "favoritear", "compartir". "diggear", etc.

Paso 4: conexión desde Yahoo Pipes hacia Twitter, usando al menos uno de estos servicios:

Twitterfeed,
Feedburner,
Dlvr.it.
Otra posibilidad: correr un agente que hable con la API de Twitter en tu propia máquina Linux o BSD.

Naturalmente, un esquema de este tipo se potencia cuando es parte de una estrategia que va más allá de la agregación; plantear preguntas y gatillar conversaciones en torno a un tema o ámbito –rol conocido como el "community manager"– es algo que he aplicado un poco a través de @canal_chile y el resultado parece sumamente expansivo.

Actualización: en un artículo relacionado cuento por qué hacer un newsbot y cuento como hacerlo sin Yahoo Pipes.

Poniendo en contexto la web semántica o 3.0

Hola, soy Ignacio y soy una persona.

Esa frase, que para la mayoría de los seres humanos es perfectamente comprensible, para un computador y para la web pre 3.0 no tiene significado, es simplemente un conjunto de caracteres que perfectamente podrían indicar una dirección postal, la naturaleza de un plato de comida o un insulto para el que lee.

Los humanos podemos interpretar una frase como esa porque tenemos una red neural que contiene una descripción de un lenguaje en común, sin necesidad de que el mensaje haga referencia explícita a un diccionario donde se explica ese lenguaje.

La web pre 3.0 no es tan "inteligente". O más bien, los computadores, capaces de acceder a la web y mostrarnos su contenido, no son tan inteligentes como los humanos.

La primera etapa de la web: los hipervínculos aportaron cierto significado

Una solución provisoria para que los contenidos de la web tengan más sentido se ha logrado mediante el uso de metadatos y la indexación con algoritmos que reconocen denominaciones de los enlaces y por tanto pueden asociar una etiqueta a un recurso de manera automática. Por ejemplo:

<a href="en.wikipedia.org/wiki/Albert_Einstein">Información sobre Albert Einstein</a>

Esa declaración, que debe estar presente en más de un sitio Web que Google ha indexado, permitirá que al buscar "Información sobre Albert Einstein" en Google el sistema nos pueda entregar como resultado la dirección de su entrada en Wikipedia. Ahi observamos la relación entre una descripción o título y una dirección de la web.

Dotar a los textos de significados precisos permite nuevas aplicaciones

La Web semántica o 3.0 es el resultado de implementar en Web una sintaxis donde relaciones más granulares se pueden definir, para que el texto contenido en páginas consista no sólo en datos, también significados que tanto computadores como personas puedan usar. De esa manera, si la información contenida en la página de Wikipedia sobre Einstein hubiera etiquetado adecuadamente la información, una aplicación Web sensible a la sintaxis semántica nos podría contestar preguntas más específicas como "¿en qué fecha nació Albert Einstein?" o "¿Quiénes influenciaron a Albert Einstein?".

Esto es importante no sencillamente para las búsquedas. En la web semántica, un sitio podría decir "soy un banco y guardo tu dinero", otro podría declarar "soy la compañía telefónica" y eso permitirá que le digas a tu computador: "usa el dinero del banco para pagar la cuenta telefónica".

Como se puede ver, es un cambio cualitativo en las posibilidades de la Web, y por lo mismo podríamos hablar en este caso de una real nueva versión de la Web. Sin embargo como el término "web 2.0" ya se ha adoptado incorrectamente para masificación social de la Web, Tim Berners-Lee recomienda que a la Web semántica le llamemos "Web 3.0".

Anatomía de la Web 3.0

Como los computadores tras la web del banco y la web de la compañía telefónica no cuentan con redes neurales que entiendan lenguaje natural, tenemos que estandarizar una manera de describir las relaciones, y una manera de hacer eso se llama RDF (Resource Description Framework).

Este dialecto XML consiste en simples declaraciones en la forma de la llamada triple, que siempre es un recurso con una propiedad (predicado) y un objeto. La estructura recuerda a la relación entre sujeto, predicado y objeto en la oración simple. Ejemplo:

Albert Einstein nació el 14 de marzo de 1879

Donde "Albert Einstein" es el sujeto, "nació el" es el predicado o propiedad y "14 de marzo de 1879" es el objeto.

Mediante el uso de RDFa, es posible declarar RDF dentro de documentos XHTML, como en el siguiente ejemplo:

<div about="http://dbpedia.org/resource/Albert_Einstein">
<span property="foaf:name">Albert Einstein</span>
<span property="dbp:dateOfBirth" datatype="xsd:date">1879-03-14</span>
</div>

Como se puede ver, esta declaración depende de términos (los que a veces se denominan vocabularios o taxonomías) que hayan sido definidos previamente: en este ejemplo se observa el úso de los términos foaf:name y dbp:dateOfBirth.

Otra declaración podría establecer otras relaciones, nóteses el uso de dbp:influenced:

<div about="http://dbpedia.org/resource/Baruch_Spinoza" rel="dbp:influenced">
<div about="http://dbpedia.org/resource/Albert_Einstein">
<span property="foaf:name">Albert Einstein</span>
</div>
</div>

Y aquí un ejemplo que establece dos influencias:

<div about="http://dbpedia.org/resource/Baruch_Spinoza">
<div rel="dbp:influenced">
<div typeof="foaf:Person">
<span property="foaf:name">Albert Einstein</span>
<span property="dbp:dateOfBirth" datatype="xsd:date">1879-03-14</span>
</div>
<div typeof="foaf:Person">
<span property="foaf:name">Arthur Schopenhauer</span>
<span property="dbp:dateOfBirth" datatype="xsd:date">1788-02-22</span>
</div>
</div>
</div>

Existen también otras maneras de representar RDF. Y hay otras normas para mapear las declaraciones sobre las relaciones entre las declaraciones y los hechos. Por ejemplo los mapas de tópico son una norma ISO y tienen su propio dialecto del lenguaje XML (XTM). Las ontologías son estructuras que también están utilizando un schema RDF o OWL (Web Ontology Language writable).

Para el desarollador web que quiera abordar la Web semántica, comprender RDF, el uso de RDFa, XTM y OWL será necesario, de manera similar a como el diseñador web tuvo que aprender HTML y luego CSS.

A continuación una linkografía recomendada por la W3C para profundizar:

GRDDL: <http://www.w3.org/2001/sw/grddl-wg/>
RDF: <http://www.w3.org/RDF/>
SPARQL: <http://www.w3.org/2001/sw/DataAccess/>
OWL: <http://www.w3.org/2004/OWL/>
POWDER: <http://www.w3.org/2007/powder/>
RDFa : <http://www.w3.org/2006/07/SWD/>

El Quinto Poder, espacio de debate y construcción de ideas y acciones

Quiero contarles que con mucho gusto participé como usuario de prueba (beta tester dirían los geeks) de una nueva plataforma para la participación democrática.

Especialmente interesante me parece la metáfora de acciones que el sitio presenta, haciendo posible ir un paso más allá de las causas de Facebook, que a menudo se quedan en muchas palabras pero poco efecto. El desafío entonces será ver si las acciones que allí planteamos llegarán al mundo de lo físico, involucrando a personas e instituciones offline, además de fomentar un amplio debate y participación en torno a ir haciendo del país un mejor lugar donde vivir.

Les invito entonces, el sitio a partir de este momento ya está abierto para todo público, en la URL http://www.elquintopoder.cl/.

¿Matar el libro? Sí, pero sólo el de papel. Demos vida al acceso digital a contenido científico y artístico

El bueno de Enzo Abbagliati en un provocativo artículo propone que "matemos al libro para que se multipliquen las lecturas". Una lectura detenida de lo que propone Enzo es recomendable, pero quiero complementar lo expresado por Enzo (que hoy está de cumpleaños) con la siguiente idea:

El libro a estas alturas no es un soporte, es un concepto asociable más al formato del mensaje que al medio físico. Los libros tienen para rato, pero el papel no.

Los dueños de los nuevos medios están haciendo un gran esfuerzo por que adoptemos plataformas de lectura electrónica, y a diferencia de viejos medios que combinaban el soporte con la información (ejemplo: diarios, revistas y libros) los nuevos medios son desagregados: al proveedor de acceso a Internet no le interesa si consumimos LUN o Shakespeare, se rige por las frías leyes corporativas y si LUN le sale más barato será su opción subvencionarlo.

La solución puede ser subvencionar acceso masivo a contenidos de orientación educativa, científica y artística, evitando la subvención del acceso a la cultura farandulera y opiácea. El que quiere leer LUN que pague por el acceso, el que quiere Wikipedia no. Eso pasa por no olvidar esa diferencia cuando pensemos en iniciativas como Un Computador por Niño o la inevitable idea de que cada estudiante o -¿por qué no?- cada habitante tenga derecho a un Kindle o a un iPad conectado a Internet.

Amazon subvenciona con el Kindle un acceso a Internet que permite acceder a algunos servicios, incluyendo Wikipedia. El paso lógico para un Estado interesando en fortalecer educación y disminuir desigualdad es asegurar acceso a los conocimientos, y nos acercamos cada vez más a que ello deje de ser utopía.

Y curiosamente no necesitamos remitirnos a ejemplos del primer mundo. Sin ir más lejos, ya hay una empresa de telecomunicaciones móviles en Chile que está entregando un plan de acceso prácticamente gratuito a Wikipedia y otros contenidos educativos ¿Qué está esperando el Estado para subvencionar un iPad que utilice dicho acceso?

Como decimos en Chile: está diciendo.

Creación de un medio temático de agregación vía Twitter con Yahoo Pipes y otras herramientas

Poniendo en contexto la web semántica o 3.0

El Quinto Poder, espacio de debate y construcción de ideas y acciones

¿Matar el libro? Sí, pero sólo el de papel. Demos vida al acceso digital a contenido científico y artístico

canal.cl / blog

Archivo del Blog

Etiquetas