Sean o no un negocio, todos los sitios web están interesados en saber cuántas visitas tienen y conocerlas en la medida de lo posible. Actualmente conviven diversos sistemas para medir la audiencia en Internet que, según los expertos, no han conseguido la fiabilidad suficiente para presentar un panorama claro del universo online, ni generar la confianza que necesitan los anunciantes para invertir en la Red. Frente a los paneles de internautas o los análisis de logs, se impone un sistema de etiquetado de las páginas, adoptado por la OJD, que genera información accesible y precisa.
¿Por qué es tan importante medir la audiencia?
La audiencia son los ojos que ven las páginas web y que, a la postre, dan sentido a su existencia. Por eso, desde el nacimiento de Internet se han desarrollado diversos sistemas para medir las audiencias. Pero al tratarse de un medio nuevo, no ha sido fácil extrapolar los sistemas de medición ya establecidos. Si en radio, televisión o prensa el número de oyentes, espectadores o lectores era vital para que los medios nutriesen su principal fuente de ingresos: la publicidad, en Internet ocurrió tres cuartas partes de lo mismo cuando, muy pronto, el negocio comenzó a echar raíces en la Red.
Es cierto que a no todos los sitios web les interesa el tráfico de la misma forma, pues para unos se traduce directamente en dinero (una tienda online) o relevancia -que al final también se transforma en publicidad e ingresos- (un medio de comunicación), mientras que a los que no llevan la etiqueta de negocio ‘sólo’ les importa captar atención. Al final, a todos les interesan los visitantes y obtener de ellos la máxima información.
Precisamente, la posibilidad que ofrecía Internet de saber mucho -cuántos son, de dónde vienen, qué páginas visitan, cuánto tiempo están, qué anuncios ven y cuáles pinchan…- de los visitantes, supuso un gran problema que forma parte del cúmulo de despropósitos que condujeron al reventón de la burbuja.com (el cierre de muchas webs sobredimensionadas). A los anunciantes se les prometió mucho más que en los sistemas anteriores (radio y televisión) y muchos sitios web hipotecaron su futuro gastando lo que no tenían en hinchar el tráfico de sus páginas.
Pero el tráfico, en la mayoría de los casos, no se tradujo en ingresos. Los distintos y dispares sistemas de medición de audiencia unidos a la ineficacia de la publicidad online (que no cumplía sus enormes exigencias) llevaron a los anunciantes a retroceder el medio paso que habían dado hacia la Red. La desconfianza tocó techo con la debacle de las empresas de Internet y se retornó a un punto donde ambos, publicidad y medición de tráfico, debían reinventarse.
La publicidad sigue siendo vital para la supervivencia de buena parte de los negocios de Internet, aunque es verdad que el cobro por contenidos se abre paso en algunos campos específicos. Y para la publicidad es imprescindible que los sistemas de medición de audiencias generen confianza entre todos los implicados. Lo mismo vale para quien no vive de la publicidad o para quien pretende hacer negocio: conocer a los visitantes ayuda a dar los pasos correctos y ofrecer un mejor servicio al visitante.
No era mentira que la tecnología permitía crear eficaces y precisos sistemas de medición de audiencia. Los nuevos sistemas así lo quieren demostrar, apostando por ofrecer información que combine cantidades de audiencia con el máximo conocimiento de los perfiles de los usuarios, que fijan, más allá de la jerarquía de los sitios web por el número de vistas, las pautas de actuación de todos los actores online. Todo esto, ahora imprescindible, mediante sistemas transparentes que sean inteligibles, controlables por los participantes y, sobre todo, respetuosos con la intimidad del usuario.
Sistemas de medición
En Internet conviven tres métodos para medir el tráfico, cada uno con sus limitaciones, y todos con sus partidarios y detractores:
Basado en el usuario (user-centric)
Se obtiene la información mediante paneles de usuarios, ya sea mediante entrevistas (EGM/AIMC), encuestas online (EGI) o a través programas instalados en los ordenadores de los internautas que, a modo de caja negra, registran la navegación (Nielsen/Netratings o comScore MediaMetrix). Es el equivalente al sistema de medición de audiencias de la televisión, en el que unos pocos audímetros instalados en un número muy concreto de televisores dictan la audiencia de todas las cadenas.
Basado en la publicidad (ad-centric)
Analiza el tráfico mediante los banners y otros elementos publicitarios a través de los archivos de registro (logs) de los servidores de anuncios. Cada vez que un anuncio se muestra, un sistema lo contabiliza.
Orientado al sitio web (site-centric)
El sitio web registra la actividad de sus visitas mediante los logs del servidor o las etiquetas (código HTML o Java) colocadas en sus páginas. En el primer sistema, no hay ninguna seguridad de que el sitio-web no haya alterado la audiencia, mientras que el segundo (el basado en etiquetas) existe un tercero, ajeno, que hace de árbitro y garantiza la integridad de los datos.
Para valorar estos sistemas de medición conviene tener en cuenta tanto la cantidad de información que proporcionan como su calidad, es decir, la fiabilidad de sus datos. Al margen de los sistemas basados en los anuncios, que aunque son bastantes fiables están orientados hacia las agencias publicitarias, en España el universo internauta ha estado fiscalizado por el EGM y la OJD, que muestran la cal y la arena de los sistemas de paneles y de logs.
El Estudio General de Medios (EGM) realiza oleadas de encuestas, tres al año, en las que participan más de 40.000 personas. Esta técnica permite añadir una serie de datos socioculturales y demográficos al mero conteo de internautas. En sus oleadas, además del número de usuarios, analiza los sitios más visitados, el lugar de acceso, los servicios utilizados y los perfiles por sexo, edad o clase social. Como todos los panelistas, flaquea en cuanto a la representatividad del universo internauta, e incluso en cuanto a la veracidad de sus datos (respuestas de los internautas). Algo parecido a lo que ocurre con los documentales en televisión, que mucha gente afirma verlos, aunque los datos finales de audiencia contradigan a estas encuestas.
Estos dos lastres han sido en parte pulidos por los sistemas de paneles basados en software que han logrado implantarse internacionalmente. Por un lado, el internauta no puede mentir sobre lo que hace -aunque quizá deje de hacer ciertas cosas si se sabe vigilado- y, por otro, muestras de un millón y medio de internautas como la que maneja comScorec ofrecen una visión cercana a la realidad. Además, los programas instalados en el PC son capaces de extraer infinidad de datos, aunque éstos se empaqueten para fines comerciales. Otros sistemas, como el de Alexa y su barra de navegación, no son muy fiables, pues sólo extraen datos de sus usuarios, que no han sido elegidos por su representatividad, lo que acaba repercutiendo en el sesgo de las conclusiones (por ejemplo, la barra de navegación de Alexa sólo está disponible para el navegador Internet Explorer, por lo que los usuarios de Netscape, Mozilla u Opera quedan al margen).
Por su parte, la Oficina de Justificación de la Difusión (OJD) hasta hace poco obtenía la información mediante los logs de las páginas que así lo solicitaban (previo pago). Estos archivos de los servidores registran la actividad de las visitas, aunque la OJD sólo extraía el número de visitas y páginas vistas por franja horaria, día (de la semana y el mes) y meses. Su trabajo ha recibido severas críticas por ‘qué’ es lo que medía pero también por ‘cómo’, ya que además de informar sólo del tráfico, los logs se han mostrado como un sistema poco eficaz y fácilmente manipulable para desvelar la realidad de un sitio web.
Quizá por eso la OJD ha optado recientemente por abrazar el método de los tags (marcas o etiquetas) incrustados en las páginas web. Mediante una sencilla línea de código en cada página, este sistema se presenta como una buena solución para alcanzar un estándar fiable, pues ofrece numerosas e incuestionables ventajas frente a los logs. Varias empresas, como Nielsen/Netratings tras la adquisición de RedSheriff o la francesa Weborama con su Weboscope, están utilizando con éxito los tags. Su principal virtud es que el sistema es mucho más difícil de manipular.
¿Qué se mide?
Los hits cuentan todas las peticiones realizadas a un servidor al visitar una página (textos, imágenes, etc.) y es una medición en desuso. Lo habitual es medir el tráfico en visitas (a partir de 30 minutos de inactividad se cuenta una visita nueva aunque se trate del mismo usuario) y páginas vistas (el número de páginas solicitadas a un sitio web). También es relevante el número de usuarios únicos, identificados a través del número IP o, más preciso, mediante los sistemas de etiquetas.
Hacia un estándar
La necesidad de un estándar o, al menos, un sistema de gran implantación y fiable para medir las audiencias se presenta como un asunto importante con la finalidad de que aumente la inversión en publicidad online, despegue el comercio electrónico o los medios y portales conozcan a su público y sean capaces de ofrecerle lo que demanda.
tags vs. Logs
El método de medición mediante marcadores o etiquetas (tags) es un sistema nada oneroso que puede implantar cualquier sitio web que desee estadísticas precisas sobre sus páginas. El código insertado en la página recoge información simple (contadores) o gran cantidad de datos (trackers) que son almacenados en un servidor ajeno y se pueden consultar fácilmente vía web. Últimamente está desplazando al análisis de los archivos de registro de los servidores (logs) porque presenta evidentes ventajas:
- Páginas vistas. Al contrario que los logs, las etiquetas registran las visitas de las páginas almacenadas en el caché del PC o el servidor. Se pueden situar al final de la página, lo que evita que afecte al tiempo de descarga y, además, garantiza que el visitante haya abierto completamente la página.
- Usuarios únicos de verdad. Los logs cuentan los usuarios únicos mediante el número de IP, algo impreciso, pues todos los trabajadores de una empresa pueden conectarse a Internet a través de la misma IP y con las IP dinámicas un mismo usuario puede ser contabilizado varias veces. Las etiquetas identifican los navegadores, no las IPs, y envían una cookie que se almacena en el ordenador del usuario (siempre que el usuario tenga activada esta función) que garantiza que siempre será el mismo.
- Flexibilidad. Los logs almacenan los datos en el servidor propio por periodos preestablecidos. Los marcadores acaban con esta rigidez, pues los datos son accesibles desde Internet, sin descargar archivos y sin conocimientos técnicos, en tiempo real. Además, es sencillo definir y recoger la información que se precisa, generando una base de datos muy manejable.
- Independiente de la tecnología. A las etiquetas les da igual el lenguaje de la página web (cgi, php, asp, shtml, etc.) o el tipo de servidor (Windows, Linux, Unix…). Auditan cualquier formato de página, sea Flash, sitio seguro (SSL) o WAP, por ejemplo.
- Información global. Las cookies permiten analizar la actividad de un visitante en distintas páginas web, y además las etiquetas permiten combinar datos de diferentes sitios. Cada web genera un log independiente, por lo que mediante su análisis es complicado obtener datos globales de varios sitios.
En su contra se puede mencionar la dificultad de insertar los códigos en las páginas de los sitios pequeños que no se puedan permitir un software que las edite de forma masiva.
Y, desde luego, este sistema no puede sustituir la información sociocultural y demográfica obtenida mediante entrevista, ni puede conseguir tantos datos del usuario como hacen los programas instalados en los PCs (uso de correo electrónico, mensajería instantánea, intercambio de archivos, etc.). Pero además de ser un sistema asaz preciso para medir el tráfico, es capaz de extraer suficiente información como para trazar perfiles de usuarios, demandados por cualquier parte.