Google Anaylitcs

Recortes de Ignace Rodríguez de Rementería

2012/07/10

Cómo (y por qué) crear un "newsbot" o agente agregador de noticias sencillo usando dlvr.it


El presente artículo es una guía introductoria para la creación de un newsbot. Está construído a partir de conceptos y ejercicios del primer módulo del ramo que imparto en el diplomado dirigido a community managers en Instituto Arcos.

Más adelante publicaré complementos para este artículo, profundizando en tácticas y técnicas de conexión social y scraping.

¿Qué es un newsbot? 

El newsbot en la Internet es la combinación de tecnología Web para la obtención de contenidos filtrados de acuerdo a un criterio predeterminado, ya sea definido temáticamente (términos, etiquetas) u obtenido socialmente (perfiles como fuentes, intermediarios, selección por popularidad). El presente documento apunta más a lo primero, vale decir construir newsbots que traen contenidos en base a términos o etiquetas.

Vamos a comenzar asumiendo que el lector sabe de tecnologías Web en general y domina HMTL y RSS. En caso contrario, recomiendo partir familiarizándose con:
Otras lecturas interesantes para entender la Web, pero no obligatorias son:
¿Por qué hacer un newsbot?

El newsbot permite asociar fuentes o temas tema(s) contingente(s) a un perfil o marca en medios participativos, facilitando
  • la identificación de dicha marca con la fuente o tema(s), 
  • y la propagación de dicha marca a través de los usuarios gracias a la facilitación del acceso a contenidos de valor, 
  • la consiguiente construcción de prestigio e influencia.

Esto es válido tanto para perfiles de organizaciones o marcas como para perfiles personales.

Por ejemplo un experto en telecomunicaciones puede compartir recursos y noticias sobre telecomunicaciones, con lo cual logra fidelizar a sus usuarios (followers, suscritos).

Similarmente, una organización puede utilizar esta técnica para generar conversaciones en torno a lo que está ocurriendo en su ámbito de competencia. Una ONG dedicada al tema de la salud podría crear un newsbot como @canal_salud.

La persona u organización contará gracias al newsbot con una ayuda para formar efectivamente parte de la web de tiempo real sin tener que estar todo el día dedicando 100% de atención al perfil en medios participativos.

Por otra parte existe también el newsbot privado, correspondiente más a la definición clásica de agente de noticias, que automáticamente filtra noticias relacionadas con algún tema determinado, sin necesariamente compartirlo. En esta modalidad, el newsbot puede ser un paso intermedio para semi automatizar un esfuerzo curaturial.

En cualquier caso, el newsbot responde a la necesidad de mantenerse al día uno y/o mantener al día a otros, informados selectivamente respecto de cualquier especialidad o ámbito, una actividad de valor creciente ante la abundancia de información introducida por la Internet en general y los medios participativos en particular.

Vamos a lo principal: ¿Cómo crear un newsbot?

Una manera sencilla en 4 pasos:
  1. Reunir direcciones (URI) de fuentes (en RSS) sobre el tema que nos interesa,
  2. Agrupar esas direcciones en una plataforma.*
  3. Establecer filtros por palabra para inclusión y/o exclusión*,
  4. Conectar con los perfiles sociales que deseamos automatizar.
Un ejemplo: noticias de salud con dlvr.it

Paso 1: las direcciones:
Estas son URI de recursos en formato RSS. Nótese que aunque aquí están con "feed" el protocolo es HTML y algunas webapps hay que ingresarlas de esa manera (en dlvr.it se pueden ingresar tal como están acá):
  • feed://www.cooperativa.cl/prontus_nots/site/tax/rss/all/7_429_0.xml
  • feed://www.diariomedico.com/services/rss
  • feed://www.supersalud.com/util/rss.php
  • feed://medicinacodigoabierto.wordpress.com/feed/
  • feed://saludycomunicacion.com/blog/?feed=rss2
  • feed://farmacologiaymedicina.com/feed/
  • feed://sp.rian.ru/export/rss2/health/index.xml
  • feed://www.nuevastecnologias.com/salud-2/feed/
Paso 2: ingresar URIs en dlvr.it:
Luego de crear una cuenta en dlvr.it, podemos usar esta webapp para ingresar estas fuentes, asociar a cada una periodos de actualización y ventanas horarias. Se puede hacer algo similar con Twitterfeed, Friendfeed, IFTTT y Buffer.

Paso 3: filtros:
Podemos usar la misma plataforma dlvr.it para ingresar filtros. Por ejemplo podemos prohibir la palabra "peso", porque una fuente en particular hace un hincapié que no nos interesa en el tema del peso.

Cabe mencionar que la versión actualmente al aire de @canal_salud además incorpora algunas fuentes adicionales, curaduría manual y ranking social, para eso algunas de sus fuentes pasan por una plataforma llamada Yahoo Pipes y recibe salida (vía RSS) desde una cuenta Google Reader. Lamentablemente Google ya no permite crear canales de salida de RSS desde Reader.

*Más adelante profundizaremos en hacer esto con Yahoo Pipes.

Paso 4: conectar una cuenta Twitter: 
Estamos conectando con la cuenta @canal_salud en Twitter. Dlvr.it permite conectar también con perfiles Facebook, incluso páginas, y presenta métricas interesantes acerca de los links compartidos, la cantidad de followers o suscriptores y otros datos.

Y listo, ya tenenos funcionando nuestro 'bot.

Hay un artículo relacionado, más breve, sobre una exposición que hice usando Yahoo Pipes y otras webapps para hacer un newsbot en UDP.

Por favor no dudes en hacerme notar cualquier error o falencia o hacerme preguntas técnicas, ya sea acá en los comentarios o en el grupo Facebook dedicado a la Sociabilidad. Gracias.
blog comments powered by Disqus