lunes, 8 de septiembre de 2008

Google y la nueva naturaleza de la indización

Ars Technica comenta sobre los grandes cambios que Google ha producido, y destaca cómo ha alterado lo que se entendía por indización
Ultimately, the key difference between Google's index and the Index that was Yahoo! was this: Yahoo!'s (user-facing) index was a human-invented topic hierarchy that was imposed on the archive from without, exactly like the Dewey Decimal System that was its immediate precursor; in contrast, the semantic or topical structure of Google's (machine-facing) index reflected only the relationships that the search algorithms found in the archive, with the result that the index's structure was (usefully) a direct expression and artifact of the data at any given moment. Importantly, that structure was never visible to the user—and it wouldn't have been useful if it was—but it was accessible via the simple search box.
Puede sonar recontratécnico, pero efectivamente, el cambio que ha producido Google a través de sus algoritmos ha tenido consecuencias mayores. No solo la forma como se enfrenta la Web: de Yahoo! y su intento de organizar sistemáticamente al poder del algoritmo de búsqueda a texto completo de Google. También en ámbitos fuera de la Web la noción del texto completo como un espacio buscable está alterando nuestra lógica de organización de la información.

Ahora asumimos que nada necesita orden: basta un algoritmo potente para solucionar los problemas de la abundancia informacional. Perú 21 es una expresión de esta noción: métele Google y no importa qué haya adentro, igual lo encontraremos. Esta noción, sin embargo, suele ser desmentida por la realidad, puesto que Google no es la mejor forma de encontrar algo en un sitio web relativamente pequeño.

En las Mac, que cuentan con tecnología exclusiva de búsqueda, la rapidez y flexibilidad de Spotlight impresiona a cualquiera que haya tratado de usar Windows Search o incluso Google Desktop. Pero igual, funciona en el contexto relativamente controlado de una computadora; Google funciona en el contexto significativamente enorme de toda la Web. Colecciones intermedias usando Google: no siempre marcha igual. El modelo de Google parece funcionar perfectamente en el espacio abierto de la Web, pero no soluciona el desafío de la Web local, que equivale a la biblioteca, pero sin zona de control. Complejo, porque la información se vuelve caótica con facilidad si no se invierte en mantenerla a raya, y a pesar de todo, Google todavía no logra cubrir completamente esta necesidad.

Un tema que da para mucho más, sobre todo porque me remite al sueño de la biblioteca universal, uno de mis rayes de cuando era bibliotecario. Ya volveré...

No hay comentarios: