El Instituto Cervantes creará el Primer Buscador General Panhispánico para el centro Virtual Cervantes. Éste contará con un robot capaz de rastrear en Internet y seleccionar los documentos más relevantes de la cultura y de la lengua española. Jon Juaristi, el director del Instituto Cervantes, ha afirmado que «como catalizador universal de la lengua española y de la cultura hispánica, el Instituto Cervantes necesita el impulso que brinda la Red para llegar a un público que excede el objetivo de los medios tradicionales»
La información se ordenará a través de dos sistemas; uno gestionará la clasificación de contenidos y otro indexará los resultados de forma automática manteniendo así actualizada la información, evitando presentar contenidos obsoletos al usuario. También se desarrollarán herramientas para agilizar las búsquedas con filtros semánticos y para revisar la morfosintaxis de textos en español.
Además, mediante un sistema de control de versiones, se podrá acceder a datos que, en su día, estuvieron publicados en la Red y después se retiraron.
La página desarrollará los siguientes módulos: un metabuscador, que recopilará información y una herramienta de catalogación, un robot (‘crawler’) para descargar y actualizar las páginas de cada enlace y un buscador para atender las consultas de los usuarios del portal que permitirá recuperar información previamente catalogada en el sistema.