Ir al contenido principal

El archivo de Tuits de la Biblioteca del Congreso de los EEUU

Un tuit es un nuevo tipo de documento que debe formar parte de la colección de una biblioteca nacional, y representa además un alto valor para su misión. Debido a que nuestra sociedad utiliza los medios sociales como forma prioritaria de comunicación y expresión creativa, estos nuevos medios están sustituyendo muchas veces las cartas, periodicos, revistas y otros recursos que las bibliotecas de investigación deben recoger y conservar (Gayle Osterberg, director de Comunicación de la Biblioteca). Incluso los emails están siendo sustituidos por estos medios sociales como formas de comunicación prioritaria.

La misión de la Biblioteca del Congreso de los EEUU es, según Osterberg, recoger la historia de America, su Memoria, y adquirir aquellas coleciones que tienen valor para futuras investigaciones. Por esta razón la Biblioteca comenzó adquiriendo el archivo de tuits desde marzo de 2006 hasta abril de 2010,  que fué ofrecido gratuitamente por Twitter a través de la empresa gnip (http://gnip.com/). 

A partir de ese momento, abril de 2010, comenzó a almacenar los tuits de Twitter y su colección no ha parado de crecer hasta la cifra actual de 170 mil millones de tuits (85 terabytes de datos). En 2010, se procesaban 50 millones de tuits cada dia, y en octubre de 2012, la cifra diaria de tuits que se recibian era casi la mitad de mil millones de tuits (http://blogs.loc.gov/loc/2013/01/update-on-the-twitter-archive-at-the-library-of-congress/). 
 




“Los medios sociales dan la oportunidad a todos squellos que no tienen tiempo de escribir, de registrar una parte de la historia,” dice Osterberg. “Esta visión de lo que está pasando actualmente, desde los personajes de a pié, es de gran valor para los investigadores y políticos"

En este libro blanco se presentan los objetivos alcanzados hasta el momento por la Biblioteca del Congreso y los proyectos de futuro de cara a la conservación y organización de los tuits para la investigación.

Aunque el objetivo de la Biblioteca sea ofrecer estos datos, de forma organizada, a los investigadores, el reto actual está en el coste del procesamiento de los datos, ya que ante tal volumen, se necesitan servidores potentes que ofrezcan los datos de forma rápida.  Una simple pregunta a la base de datos del 2006-2010, tarda unas 24 horas. Aumentar la velocidad a un nivel razonable requeriría la compra de cientos de servidores, hecho que la biblioteca no puede asumir. No se sabe para cuando los tuits estarán disponibles para los investigadores.

Incluso aunque fuera posible acceder de forma rápida al archivo de Twitter, que los datos tengan sentido es otra cosa. ¿Cómo recuperar contendos con significado? O ¿cómo evaluar el sentimiento humano, las emociones, en los tuits?.

Todos los investigadores están de acuerdo en que Twitter es una herramienta muy poderosa para los estudios sociales, pero depende de que la Biblioteca del Congreso de los EEUU haga posible su consulta. "Algún dia, nuestros tuits seguirán viviendo aunque nosotros no estemos ya aquí" (http://business.time.com/2013/02/25/what-the-library-of-congress-plans-to-do-with-all-your-tweets/)


Publicar un comentario

Entradas populares de este blog

¿Qué es la comunicación científica?

La comunicación científica es el sistema por el cual científicos e investigadores crean, distribuyen, usan y conservan sus trabajos.
Es sabido ya por todos que el panorama de las publicaciones científicas está cambiando: Las tecnologías están multiplicando las posibilidades de compartir conocimiento y aumentando las audiencias potenciales de los trabajos científicos; sin embargo, el coste del acceso y las restricciones legales para compartir estas publicaciones y otros usos, está haciendo decrecer la lectura de muchas de estas publicaciones.
Además, para las ciencias y la medicina, el mercado se concentra en muy pocas manos que encarecen las suscripciones y menguan los presupuestos de las bibliotecas, que de esta forma se ven obligadas a reducir sus adquisiciones de monografías de humanidades, de revistas para disciplinas concretas o bases de datos de un dominio específico.
Las bibliotecas por su parte, están centrando sus esfuerzos en defender el open access, informar sobre los derechos…

Plan de marketing para bibliotecas

Plan de Marketing 2.0 para bibliotecas
por Nieves González

Ejercicio del curso "Promoción de servicios de información" de la AAB en colaboración con el IAPH. Mayo 2010.

1.- Investigación y análisis de marketing: Se trata de hacer un análisis de nuestro mercado. Quienes son los usuarios potenciales de la biblioteca, reales y potenciales, los que van y los que no van. Tendremos en primer lugar que detectar a qué usuarios queremos llegar. A qué tipo de usuarios nos vamos a dirigir?
2.- Segmentación de marketing: Se trata de localizar a los usuarios potenciales del producto, a la larga cola. Hay que segmentar a nuestros usuairos en grupos muy concretos, que realmente se sientan identificados con nuestro servicio. Hay que identificar primero al usuario al que nos vayamos a dirigir.Qué usuario es el que vamos a encontrarnos en las redes sociales? Cómo los podemos atraer? Hay que evitar estar por estar y crear espacios que después no se van a atender ya que el efecto puede ser justo e…

Decadencia y muerte del imperio bibliotecario

Con el título "Decadencia y muerte del imperio bibliotecario" "The Decline and Fall of the Library Empire", Steve Coffman, pionero de los servicios de referencia virtual y vice presidente de Library Systems & Services LLC (LSSI), ha escrito un artículo que todo bibliotecario debería leer y del que me gustaría hacer una reseña y añadirle mis propias reflexiones. Yo hubiera preferido titular el post "los distintos roles que la biblioteca debe jugar", pero no se puede negar que el título que le ha dado es de lo más sugestivo.  El artículo en resumen viene a decir que los bibliotecarios nos hemos pasado los últimos 30 años soñando con tener un papel central en la revolución digital que está transformando todo lo que nos rodea, y que algunos de esos sueños no llegaron ni a despegar.  Entre los proyectos a los que les hemos dedicado ganas y horas, pero que no hemos logrado, Coffman enumera los siguientes: 
Los directorios web. Hubo un tiempo no muy lejano e…