Nuestro nuevo sistema de indexación web: Caffeine

jueves, 24 de junio de 2010

Os anunciamos que ha finalizado el desarrollo de Caffeine, nuestro nuevo sistema de indexación web. Este sistema, que genera resultados de búsqueda un 50 por ciento más recientes que los de nuestro índice anterior, ofrece el mayor conjunto de contenido web que hemos proporcionado hasta el momento. Ahora podrás acceder a enlaces del contenido que te interese mucho más rápido que antes, independientemente de lo que estés buscando, ya sea una noticia, un blog o una publicación en un foro.

Los usuarios que no os ganéis la vida desarrollando motores de búsqueda como nosotros debéis saber que, al realizar una búsqueda en Google, no se explora la Web al completo, sino el índice que Google hace de la Web. Este índice se puede comparar con la lista que aparece al final de un libro y que nos permite localizar exactamente la información que necesitamos. (Si quieres saber cómo funciona, consulta esta explicación en inglés).

Te preguntarás por qué hemos desarrollado un nuevo sistema de indexación de búsqueda. El contenido de la Web no deja de aumentar. De hecho, no solo se incrementan el tamaño y la cantidad del contenido, sino también la riqueza y la complejidad medias de las páginas web gracias a la introducción de vídeos, de imágenes, de noticias y de actualizaciones en tiempo real. Además, ahora los usuarios esperan obtener mejores resultados que antes al realizar una búsqueda. El objetivo de los usuarios es encontrar el contenido relevante más reciente, mientras que los editores desean aparecer en los resultados de búsqueda inmediatamente después de haber publicado su contenido.

Hemos desarrollado Caffeine para mantener el ritmo de evolución de la Web y para satisfacer las crecientes expectativas de los usuarios. En la imagen que aparece a continuación puedes ver las diferencias de funcionamiento entre nuestro antiguo sistema de indexación y Caffeine:


El antiguo índice estaba formado por varias capas, algunas de las cuales se actualizaban más rápido que otras. La capa principal se actualizaba cada dos semanas. Para actualizar una capa del antiguo índice era necesario analizar toda la Web. Por este motivo, transcurría un tiempo considerable desde que encontrábamos una página hasta que el usuario podía acceder a ella.