Cómo (y por qué) crear un "newsbot" o agente agregador de noticias sencillo usando dlvr.it


La presente es una guía introductoria para la creación de un newsbot, a partir de conceptos y ejercicios del primer módulo del ramo correspondiente en el diplomado de social media en Instituto Arcos.

¿Qué es un newsbot? 

El newsbot es la combinación de tecnología Web para la obtención de contenidos filtrados de acuerdo a un criterio predeterminado, ya sea definido temáticamente (términos, etiquetas) u obtenido socialmente (perfiles como fuentes, intermediarios, selección por popularidad). El presente documento apunta más a lo primero, vale decir construir newsbots que traen contenidos en base a términos o etiquetas.

Vamos a comenzar asumiendo que el lector sabe de tecnologías Web en general y domina HMTL y RSS. En caso contrario, es recomendable partir familiarizándose especialmente con el RSS, una de las piezas importantes de la Web hoy, no tan visible pero fundamental para la interconexión de aplicaciones en la "nube" y para el tema que nos convoca: http://es.wikipedia.org/wiki/RSS

¿Por qué hacer un newsbot?

El newsbot permite asociar fuentes o tema(s) contingente(s) a un perfil o marca en medios participativos, facilitando
  • la identificación de dicha marca con la fuente o tema(s), 
  • y la propagación de dicha marca a través de los usuarios gracias a la propagación voluntaria de contenidos de valor, 
  • la consiguiente construcción de prestigio e influencia.

Esto es válido tanto para perfiles de organizaciones o marcas como para perfiles personales.

Ejemplo: un experto en telecomunicaciones puede compartir recursos y noticias sobre telecomunicaciones, con lo cual logra fidelizar a sus usuarios (followers, suscritos).

Similarmente, una organización puede utilizar esta técnica para generar conversaciones en torno a lo que está ocurriendo en su ámbito de competencia. Una ONG dedicada al tema de la salud podría crear un newsbot como @canal_salud.

La persona u organización contará gracias al newsbot con una ayuda para formar efectivamente parte de la web de tiempo real sin tener que estar todo el día dedicando tiempo a poblar el perfil (cuenta Twitter, pagina Facebook, etc.) con contenidos.

Cabe señalar también la posibilidad de newsbot privado, correspondiente más a la definición clásica de agente de noticias, que automáticamente trae noticias relacionadas con algún tema determinado, sin necesariamente compartirlo. En esta modalidad, el newsbot puede ser un paso intermedio para semi automatizar un esfuerzo curaturial.

En cualquier caso, el newsbot responde a la necesidad de mantenerse al día uno y/o mantener al día a otros, informados selectivamente respecto de cualquier especialidad o ámbito, una actividad de valor creciente ante la abundancia de información introducida por la Internet en general y los medios participativos en particular.

Vamos a lo principal: ¿Cómo crear un newsbot?

Una manera sencilla en 4 pasos:
  1. Reunir direcciones (URI) de fuentes (en RSS) sobre el tema que nos interesa,
  2. Agrupar esas direcciones en una plataforma.*
  3. Establecer filtros por palabra para inclusión y/o exclusión*,
  4. Conectar con los perfiles sociales que deseamos automatizar.
Un ejemplo: noticias de salud con dlvr.it

Paso 1: las direcciones:
Estas son URLs de recursos en formato RSS. Nótese que aunque aquí están con "feed" el protocolo es HTML y algunas webapps hay que ingresarlas de esa manera (en dlvr.it se pueden ingresar tal como están acá):
  • feed://www.cooperativa.cl/prontus_nots/site/tax/rss/all/7_429_0.xml
  • feed://www.diariomedico.com/services/rss
  • feed://www.supersalud.com/util/rss.php
  • feed://medicinacodigoabierto.wordpress.com/feed/
  • feed://saludycomunicacion.com/blog/?feed=rss2
  • feed://farmacologiaymedicina.com/feed/
  • feed://sp.rian.ru/export/rss2/health/index.xml
  • feed://www.nuevastecnologias.com/salud-2/feed/
Paso 2: ingresar URLs en dlvr.it:
Luego de crear una cuenta en dlvr.it, podemos usar esta webapp para ingresar estas fuentes, asociar a cada una periodos de actualización y ventanas horarias. Se puede hacer algo similar con Twitterfeed, Friendfeed, IFTTT,  Zapier y Buffer.

Paso 3: filtros:
Podemos usar la misma plataforma dlvr.it para ingresar filtros. Por ejemplo podemos prohibir la palabra "peso", porque una fuente en particular hace hincapié en reducción de peso y eso no nos interesa tanto.

Cabe mencionar que la versión actualmente al aire de @canal_salud además incorpora algunas fuentes adicionales, curaduría manual y ranking social, para eso algunas de sus fuentes pasan por una plataforma llamada Yahoo Pipes.

*Más adelante profundizaremos en hacer esto con Yahoo Pipes.

Paso 4: conectar una cuenta Twitter: 
Estamos conectando con la cuenta @canal_salud en Twitter. Dlvr.it permite conectar también con perfiles o páginas Facebook y presenta métricas interesantes acerca de los links compartidos, la cantidad de followers o suscriptores y otros datos.

Y listo, ya tenenos funcionando nuestro 'bot.

Hay un artículo relacionado, más breve, sobre una exposición que hice usando Yahoo Pipes y otras webapps para hacer un newsbot en UDP.

Por favor no dudes en hacerme notar cualquier error o falencia o hacerme preguntas técnicas, ya sea acá en los comentarios o en el grupo Facebook dedicado a la Sociabilidad. Gracias.

Hoy por casualidad fui a Google News… y los diarios están en grandes problemas

Fue un día curioso, no estuve muy atento a Twitter (ni a Google+, ni a Facebook), así que al final del día quise ver qué noticias me había perdido, así que fui a news.google.com para ver qué había.

Y había exactamente lo que quería ver:

  • Una noticia internacional destacada (y buena) con links a varias fuentes y reseña de reacciones,
  • noticias de lo más relevante de tecnología,
  • un par de noticias locales relevantes.

Ni idea como supo Google de mis preferencias, no recuerdo si alguna vez personalicé Google News, pero como sea que lo hizo, no estuvo mal, me presentó un adecuado equilibrio entre los temas que me interesan y temas que no especialmente pero donde habían noticias relevantes.

A continuación fui a ver tres portadas de medios locales, en las tres me pasó que:

  • cargaron más lento que Google News,
  • tienen diseño más recargado, donde el logotipo ocupa aproximadamente un 15%, y la autopromoción al menos un 10%,
  • noticias internacionales del día anterior,
  • fútbol, que no me interesa,
  • publicidad, que tampoco me interesa.

Creo que no es necesario decir más.

Ignacio Rodríguez de Rementería