• No results found

CHAPTER 3 MODELING APPROACH

3.2 Classical Linear Regression

Los marcadores ofrecían las siguientes ventajas:

· Capturan el tráfico en tiempo real. Permite un seguimiento del tráfico por hora del día y

se pueden ver los datos obtenidos a las cuatro horas de producirse.

· Ofrece datos de usuarios únicos, visitas, páginas vistas y duración media.

· Filtran todo el tráfico que accede a una página web sin usar un navegador (robots de

indexación, programas, etc.).

· Contabiliza las páginas servidas desde los cachés de los buscadores.

· Resolvía con un algoritmo estadístico a los usuarios únicos (PC) eliminando el error

acumulado por el borrado de las cookies.

Manuel Sala asegura que “el cambio de medición a través de logs a tags (etiquetas) no supu- so una gran variación en los datos resultantes, aunque sí hubo pérdida en páginas vistas en algunos medios”.

Tal y como ocurre en papel, la guerra de las cifras se traslada también a Internet y la foto en el ranking era fundamental. Sólo parece que cuenta el ranking y el volumen. De hecho, no faltan los artículos sobre liderazgos no compartidos por la competencia...

http://www.elpais.com/todosobre/organismo/OJD/Oficina/Justificacion/Difusion/723/ El número de páginas vistas que tenía un site fue adoptado desde un principio como la medida del éxito de un web. Y por ello, la batalla por el liderazgo conllevó la búsqueda de fórmulas para incrementar el número de páginas. El certificador tuvo que ir corrigiendo y penalizando el empleo de estas tácticas que se inventaban día tras día.

Una de las cuestiones en las que se tenía que trabajar era precisamente en clarificar el origen del tráfico de un site. Se puede contabilizar, pero se debería de presentar de manera independiente, por ejemplo, las descargas de ejemplares de los diarios en for- mato pdf (se solicitaba sumar a la cifra de OJD por parte de algunos miembros de la AEDE: Asociación de Editores de Diarios de España); asimismo, el hecho de poder sumar tráfi- co de otros sites, simplemente por un acuerdo de cesión de tráfico, también tuvo que ser revisado. En definitiva, se trata de dar transparencia y confianza a los datos que pro- porcionamos al mercado.

Cookie

un fragmento de información que se almacena en el disco duro del visitante de una página web a través de su navegador, a petición del servidor de la página. Esta información puede ser luego recuperada por el servidor en posteriores visitas. En ocasiones también se le llama “huella”.

De esta forma, los usos más frecuentes de las cookiesson:

· Llevar el control de usuarios: cuando un usuario introduce su nombre de usua-

rio y contraseña, se almacena una cookiepara que no tenga que estar introdu-

ciéndolas para cada página del servidor. Sin embargo, una cookie no identifica a una persona, sino a una combinación de computador y navegador.

· Conseguir información sobre los hábitos de navegación del usuario. http://es.wiki-

Engordando “legalmente” las cifras... creatividad en el engaño Por recordar alguna de ellas:

· Se nombraba a una imagen transparente con la extensión que correspondía

a una página: imagen.html. De esta manera, la página descargada sumaba por dos.

· Se elaboraban páginas con frames, es decir, una página que llamaba a otras

tres o cuatro páginas a su vez, contabilizándose cada una de ellas como si fueran visitas a páginas independientes.

· Se establecía una actualización automática de la página (refresh) cada deter-

minados segundos sin que hubiera ningún cambio en el contenido.

· Se han llegado a generar automáticamente direcciones ficticias de IP para simu-

lar nuevos usuarios...

· Se incluían etiquetas en las publicidades.

· Se insertaban varios marcadores en una misma página.

· Se asociaban a la visita páginas no requeridas (pop-up, redirect, etc.).

· Servicios “inflacionistas” (chat, foros, traductor, etc.).

· Mientras duró... allá por el año 2000: Microsoft permitía crear un “canal acti-

vo” (o canal push) mediante un contrato de adhesión. Ese canal activo se ins-

talaba en el navegador del usuario y consistía en archivos de texto con for- mato .cdf y etiquetas como las de html. En ese canal podías meter todo el contenido de la web que quisieras, de modo que el usuario, al hacer clic sobre

las palabras Add Active Channelde la página del medio que tenía ese canal,

lo que hacía era descargarse de golpe todo tu web e instalarse como un web offline. Eso provocaba que muchísima gente pudiera generar miles de páginas, pero que difícilmente leían al completo. La teoría era que en tu canal, una vez bajado la primera vez, sólo enviaría al usuario las actualizaciones reales del día; en la práctica, mucha gente cambiaba un acento o una coma, para pro- vocar que también una página sin actualizar se bajara a los usuarios. Ade- más, se llegó a conseguir que el canal se bajara al usuario incluso varias veces al día... Finalmente estos canales push de Microsoft fracasaron y murieron pero durante ese tiempo, las páginas contabilizaron, multiplicando las estadísticas. Todas estas prácticas han sido ya reguladas. Sin embargo, la normativa va muchas veces por detrás de las prácticas que va permitiendo la tecnología. Por ello está siempre en constante estudio y regulación.