9/3/11

Books Ngram Viewer

Books Ngram Viewer Con este buscador, inaugurado por Google el 16 de diciembre de 2010, podemos ver gráficamente la frecuencia de palabras o frases (hasta 5 palabras) a lo largo de la historia. Remitiéndonos, posteriormente, a las fuentes en donde aparecen en su contexto. Algunos expertos comienzan a hablar de Culturomics para analizar las tendencias culturales a lo largo de la historia reflejada en los libros. Para ello, Google se basa en su inmensa biblioteca digitalizada. Se estima que, desde la invención de la imprenta, se han publicado 129 millones de libros, de los cuales Google escaneó 12; de ellos, 5 están en la base de datos de este visor. Se pueden hacer búsquedas de frecuencias de palabras y/o frases por años y en 11 idiomas; entre ellos, el español.

Las bases de datos que estamos haciendo hoy disponibles para la investigación en humanidades se basan en un subconjunto de un corpus que contiene 500 mil millones de palabras en 5,2 millones de libros en chino, Inglés, francés, alemán, ruso y español. Los conjuntos de datos contienen frases de hasta cinco palabras con un recuento de la frecuencia con que ocurrieron en cada año. (…) El Visor de Ngram le permite graficar y comparar frases de estos conjuntos de datos a través del tiempo, mostrando cómo su uso ha sufrido altibajos en los últimos años. (Jon Orwant, Equipo de Google Books).


Ver una explicación más detallada en los artículos de Ricardo Martínez (TerceraCultura.cl):

CULTUROMICS: el corpus más grande del mundo, by GOOGLE

El “corpus” de Google Books: ¿genoma o juguete?
Related Posts Plugin for WordPress, Blogger...