LUN, 20 / MAY / 2024

Una de cada cuatro páginas de Internet que existieron entre 2013 y 2023 ya no existen

Un trabajo del Pew Research Center revela como una gran parte del contenido de la red tiene en realidad una existencia bastante fugaz.

Internet es uno de los fenómenos que definen nuestro tiempo. Con ella podemos, entre otras cosas, acceder a una enorme cantidad de información que solo puede aumentar a medida que pasa el tiempo. Sin embargo, puede que esto no sea del todo cierto. Según un informe del Pew Research Center, una de cada cuatro páginas creadas entre 2013 y 2023 no estaban disponibles durante octubre de 2023.

Como es lógico, la cantidad de contenido desaparecido es, por lo general, mayor cuanto más atrás en el tiempo vamos. Para la fecha ya señalada el 38% de las páginas de 2013 y el 8% de las de 2023 eran inaccesibles.

Definición y método

Aunque hay varias definiciones de accesibilidad, para este trabajo los investigadores adoptaron una opción sencilla: Páginas que ya no existen. Se tomó una muestra al azar de un millón de sitios web que aparecen en el servicio Common Crawl. Se incluyeron en esta operación páginas de 2013 a 2023, aproximadamente unas 90 mil de cada año. Y luego se comprobó si las páginas todavía existían.

Un 16% de las páginas eran inaccesibles pero pertenecían a un dominio todavía en funcionamiento. Otro 9% pertenecía a un dominio que ya no funcionaba.

Pérdida de referencias

Las pérdida de estas páginas en ocasiones repercute en la funcionalidad de otras. Por ejemplo, el 54% de las páginas en Wikipedia contiene al menos un enlace a una página que no existe. El 21% de las páginas de sitios gubernamentales contiene un enlace a una página que no existe.

Uno de cada 5 tuits que fueron publicados en X dejaron de ser públicamente visibles unos pocos meses luego de ser publicados. En el 60% de los casos la cuenta original fue configurada como privada, suspendida o borrada.

No todo el contenido es igual

Ahora bien, es posible que mucho del contenido perdido en realidad haya estado, por su naturaleza, destinado a perderse. Páginas relacionadas con eventos pueden quedar sin mantenimiento una vez que han cumplido su función o incluso ser borradas. Contenido inapropiado para un servicio o fuera de le ley tiene siempre los días contados. Un sitio web o página puede ser reemplazado con otro. Una empresa puede dejar de prestar un servicio.

Aún así la proporción es llamativa.

¡Comparte esta noticia!
TAGS