Publicado en Walled Culture
https://walledculture.org/we-are-losing-vast-swathes-of-our-digital-past-and-copyright-stops-us-saving-it/
Estamos perdiendo vastas franjas de nuestro pasado digital, y los derechos de autor nos impiden salvarlo
PUBLICADO EL
5 DE JUNIO DE 2024
Es difícil imaginar el mundo sin Internet. Colectivamente, accedemos de forma rutinaria a miles de millones de páginas web sin pensar en ello. Pero a menudo damos por sentado que el material al que queremos acceder estará ahí, tanto ahora como en el futuro. Todos nos topamos de vez en cuando con el temido error «404 no encontrado», pero simplemente pasamos a otras páginas.
Lo que tendemos a ignorar es cómo estos mensajes de error en línea son una señal de advertencia intermitente de que algo malo está ocurriendo en la World Wide Web. Así lo revela un nuevo informe del Pew Research Center, basado en el análisis de medio millón de páginas web:
Una cuarta parte de todas las páginas web que existieron en algún momento entre 2013 y 2023 ya no son accesibles, a partir de octubre de 2023. En la mayoría de los casos, esto se debe a que una página individual fue eliminada o suprimida en un sitio web que, por lo demás, funcionaba.
En el caso de los contenidos más antiguos, la tendencia es aún más marcada. Alrededor del 38% de las páginas web que existían en 2013 no están disponibles hoy en día, frente al 8% de las páginas que existían en 2023.
Este deterioro digital se produce a ritmos ligeramente diferentes según el material en línea:
El 23% de las páginas web de noticias contienen al menos un enlace roto, al igual que el 21% de las páginas web de sitios gubernamentales. Los sitios web de noticias con un alto nivel de tráfico y los que tienen menos tienen la misma probabilidad de contener enlaces rotos.
Las páginas de las administraciones locales (ayuntamientos) son especialmente propensas a tener enlaces rotos.
El 54% de las páginas de Wikipedia contienen al menos un enlace en su sección "Referencias" que apunta a una página que ya no existe.
Estas cifras demuestran que el problema del que hablábamos hace unas semanas -que el acceso al conocimiento académico está en peligro- es en realidad mucho más amplio y se aplica a casi todo lo que está en línea. Aunque las razones por las que desaparece el material varían mucho, el principal obstáculo para hacer frente a esa pérdida es el mismo en todos los campos. El control obsesivo del material por parte de la industria de los derechos de autor, y las leyes punitivas que pueden aplicarse incluso contra la infracción más trivial de los derechos de autor, significan que rara vez se hacen copias de seguridad rutinarias y múltiples de material en línea clave o histórico.
La principal excepción a esta regla es el excelente trabajo realizado por el Internet Archive, fundado por Brewster Kahle, cuya Fundación Kahle/Austin apoya este blog. En el momento de escribir estas líneas, el Archivo de Internet conserva copias de 866.000 millones de páginas web, muchas de ellas en múltiples versiones que reflejan sus cambios a lo largo del tiempo. Es un recurso único e inestimable.
También está siendo demandado por los editores por atreverse a compartir de forma controlada algunos de sus fondos. Es decir, el único baluarte contra la pérdida de vastas franjas de nuestra cultura digital está siendo atacado por una industria que es en gran parte culpable del problema que el Internet Archive intenta resolver. Es otra razón importante por la que debemos alejarnos del sistema de derechos de autor y anular el poder que tiene para destruir, en lugar de crear, nuestra cultura.
**********************************
We are losing vast swathes of our digital past, and copyright stops us saving it
BEYOND THE BRICKS/KNOWLEDGE/LIBRARIES/MEDIA/THOUGHTS
POSTED ON
5 JUNE 2024
It is hard to imagine the world without the Web. Collectively, we routinely access billions of Web pages without thinking about it. But we often take it for granted that the material we want to access will be there, both now and in the future. We all hit the dreaded “404 not found” error from time to time, but merely pass on to other pages. What we tend to ignore is how these online error messages are a flashing warning signal that something bad is happening to the World Wide Web. Just how bad is revealed in a new report from the Pew Research Center, based on an examination of half a million Web pages, which found:
A quarter of all webpages that existed at one point between 2013 and 2023 are no longer accessible, as of October 2023. In most cases, this is because an individual page was deleted or removed on an otherwise functional website.
For older content, this trend is even starker. Some 38% of webpages that existed in 2013 are not available today, compared with 8% of pages that existed in 2023.
This digital decay occurs at slightly different rates for different online material:
23% of news webpages contain at least one broken link, as do 21% of webpages from government sites. News sites with a high level of site traffic and those with less are about equally likely to contain broken links. Local-level government webpages (those belonging to city governments) are especially likely to have broken links.
54% of Wikipedia pages contain at least one link in their “References” section that points to a page that no longer exists.
These figures show that the problem we discussed a few weeks ago – that access to academic knowledge is at risk – is in fact far wider, and applies to just about everything that is online. Although the reasons for material disappearing vary greatly, the key obstacle to addressing that loss is the same across all fields. The copyright industry’s obsessive control of material, and the punitive laws that can be deployed against even the most trivial copyright infringement, mean that routine and multiple backup copies of key or historic online material are rarely made.
The main exception to that rule is the sterling work carried out by the Internet Archive, which was founded by Brewster Kahle, whose Kahle/Austin Foundation supports this blog. At the time of writing the Internet Archive holds copies of an astonishing 866 billion Web pages, many in multiple versions that chart their changes over time. It is a unique and invaluable resource. It is also being sued by publishers for daring to share in a controlled way some of its holdings. That is, the one bulwark against losing vast swathes of our digital culture is being attacked by an industry that is largely to blame for the problem the Internet Archive is trying to solve. It’s another important reason why we must move away from the copyright system, and nullify the power it has to destroy, rather than create, our culture.