Mostrando entradas con la etiqueta Preservación digital. Mostrar todas las entradas
Mostrando entradas con la etiqueta Preservación digital. Mostrar todas las entradas

miércoles, 1 de mayo de 2024

Millones de documentos de investigación corren el riesgo de desaparecer de Internet

Publicado en Nature
https://www.nature.com/articles/d41586-024-00616-5



Millones de documentos de investigación corren el riesgo de desaparecer de Internet


Un análisis de los DOI sugiere que la preservación digital no está a la altura del floreciente conocimiento académico.


    Por Sarah Wild


Según un estudio de más de siete millones de publicaciones digitales, más de una cuarta parte de los artículos académicos no se archivan ni conservan adecuadamente. Los resultados, publicados en Journal of Librarianship and Scholarly Communication el 24 de enero1, indican que los sistemas de conservación de documentos en línea no han seguido el ritmo de crecimiento de la producción investigadora.


"Toda nuestra epistemología de la ciencia y la investigación se basa en la cadena de notas a pie de página", explica el autor Martin Eve, investigador en literatura, tecnología y edición de Birkbeck, Universidad de Londres. "Si no puedes verificar lo que alguien ha dicho en algún otro punto, sólo estás confiando en la fe ciega de unos artefactos que ya no puedes leer por ti mismo".


Eve, que también trabaja en investigación y desarrollo en la organización de infraestructuras digitales Crossref, comprobó si 7.438.037 obras etiquetadas con identificadores de objetos digitales (DOI) se conservan en archivos. Los DOI, que consisten en una cadena de números, letras y símbolos, son huellas dactilares únicas que se utilizan para identificar y enlazar a publicaciones específicas, como artículos académicos e informes oficiales. Crossref es la mayor agencia de registro de DOI, que asigna los identificadores a unos 20.000 miembros, entre ellos editoriales, museos y otras instituciones.


La muestra de DOI incluidos en el estudio estaba formada por una selección aleatoria de hasta 1.000 registrados en cada organización miembro. El 28% de estas obras -más de dos millones de artículos- no aparecían en ningún archivo digital importante, a pesar de tener un DOI activo. Sólo el 58% de los DOI hacían referencia a obras que habían sido almacenadas en al menos un archivo. El 14% restante se excluyó del estudio por haberse publicado demasiado recientemente, no ser artículos de revistas o no tener una fuente identificable.


El reto de la conservación


Eve señala que el estudio tiene limitaciones: a saber, que sólo rastreó artículos con DOI y que no buscó artículos en todos los repositorios digitales (no comprobó si los artículos con DOI estaban almacenados en repositorios institucionales, por ejemplo).


No obstante, los especialistas en preservación han acogido favorablemente el análisis. "Ha sido difícil conocer el alcance real del reto de la preservación digital al que se enfrentan las revistas electrónicas", afirma William Kilbride, director general de la Digital Preservation Coalition, con sede en York (Reino Unido). La coalición publica un manual en el que se detallan las buenas prácticas de preservación.


"Mucha gente tiene la suposición ciega de que si tienes un DOI, está ahí para siempre", dice Mikael Laakso, que estudia la publicación académica en la Hanken School of Economics de Helsinki."Pero eso no significa que el enlace funcione siempre".En 2021, Laakso y sus colegas informaron2 de que más de 170 revistas de acceso abierto habían desaparecido de Internet entre 2000 y 2019.


Kate Wittenberg, directora gerente del servicio de archivo digital Portico, de Nueva York, advierte de que los pequeños editores corren más riesgo de no conservar los artículos que los grandes."Preservar contenidos cuesta dinero", afirma, y añade que archivar implica una infraestructura, una tecnología y unos conocimientos a los que muchas organizaciones pequeñas no tienen acceso.


El estudio de Eve sugiere algunas medidas que podrían mejorar la preservación digital, entre ellas unos requisitos más estrictos en las agencias de registro DOI y una mejor educación y concienciación sobre el tema entre editores e investigadores.


"Todo el mundo piensa en los beneficios inmediatos que puede reportar la publicación de un artículo en algún sitio, pero en realidad deberíamos pensar en la sostenibilidad a largo plazo del ecosistema de investigación", afirma Eve. "Cuando lleves 100 años muerto, ¿podrá la gente acceder a las cosas en las que has trabajado?".



doi: https://doi.org/10.1038/d41586-024-00616-5  


Actualizaciones y correcciones   


Aclaración 05 marzo 2024: El titular de esta noticia se ha modificado para reflejar el hecho de que algunos de estos trabajos no han desaparecido por completo de Internet. Más bien, muchos de ellos siguen siendo accesibles pero no han sido archivados correctamente.






****************************


    NEWS

    04 March 2024

    Clarification 05 March 2024


Millions of research papers at risk of disappearing from the Internet

An analysis of DOIs suggests that digital preservation is not keeping up with burgeoning scholarly knowledge.


    By Sarah Wild


More than one-quarter of scholarly articles are not being properly archived and preserved, a study of more than seven million digital publications suggests. The findings, published in the Journal of Librarianship and Scholarly Communication on 24 January1, indicate that systems to preserve papers online have failed to keep pace with the growth of research output.


“Our entire epistemology of science and research relies on the chain of footnotes,” explains author Martin Eve, a researcher in literature, technology and publishing at Birkbeck, University of London. “If you can’t verify what someone else has said at some other point, you’re just trusting to blind faith for artefacts that you can no longer read yourself.”


Eve, who is also involved in research and development at digital-infrastructure organization Crossref, checked whether 7,438,037 works labelled with digital object identifiers (DOIs) are held in archives. DOIs — which consist of a string of numbers, letters and symbols — are unique fingerprints used to identify and link to specific publications, such as scholarly articles and official reports. Crossref is the largest DOI registration agency, allocating the identifiers to about 20,000 members, including publishers, museums and other institutions. 


The sample of DOIs included in the study was made up of a random selection of up to 1,000 registered to each member organization. Twenty-eight percent of these works — more than two million articles — did not appear in a major digital archive, despite having an active DOI. Only 58% of the DOIs referenced works that had been stored in at least one archive. The other 14% were excluded from the study because they were published too recently, were not journal articles or did not have an identifiable source.

Preservation challenge


Eve notes that the study has limitations: namely that it tracked only articles with DOIs, and that it did not search every digital repository for articles (he did not check whether items with a DOI were stored in institutional repositories, for example).


Nevertheless, preservation specialists have welcomed the analysis. “It’s been hard to know the real extent of the digital preservation challenge faced by e-journals,” says William Kilbride, managing director of the Digital Preservation Coalition, headquartered in York, UK. The coalition publishes a handbook detailing good preservation practice.


“Many people have the blind assumption that if you have a DOI, it’s there forever,” says Mikael Laakso, who studies scholarly publishing at the Hanken School of Economics in Helsinki. “But that doesn’t mean that the link will always work.” In 2021, Laakso and his colleagues reported2 that more than 170 open-access journals had disappeared from the Internet between 2000 and 2019. 


Kate Wittenberg, managing director of the digital archiving service Portico in New York City, warns that small publishers are at higher risk of failing to preserve articles than are large ones. “It costs money to preserve content,” she says, adding that archiving involves infrastructure, technology and expertise that many smaller organizations do not have access to.


Eve’s study suggests some measures that could improve digital preservation, including stronger requirements at DOI registration agencies and better education and awareness of the issue among publishers and researchers.


“Everybody thinks of the immediate gains they might get from having a paper out somewhere, but we really should be thinking about the long-term sustainability of the research ecosystem,” Eve says. “After you’ve been dead for 100 years, are people going to be able to get access to the things you’ve worked on?”


doi: https://doi.org/10.1038/d41586-024-00616-5 


Updates & Corrections


    Clarification 05 March 2024: The headline of this story has been edited to reflect the fact that some of these papers have not entirely disappeared from the Internet. Rather, many papers are still accessible but have not been properly archived.


References


    Eve, M. P. J. Libr. Sch. Commun. 12, eP16288 (2024).


    Laakso, M., Matthias, L. & Jahn, N. J. Assoc. Inf. Sci. Technol. 72, 1099–1112 (2021).


    


miércoles, 23 de noviembre de 2022

4 SISTEMAS DE PRESERVACIÓN DIGITAL PARA REVISTAS ACADÉMICAS

Publicado en Paideia Studio
https://paideiastudio.net/4-sistemas-de-preservacion-digital/?utm_source=Paideia+Studio&utm_campaign=e920b69739-RSS_EMAIL_CAMPAIGN&utm_medium=email&utm_term=0_86b6a71850-e920b69739-602277485&goal=0_86b6a71850-e920b69739-602277485&mc_cid=e920b69739&mc_eid=9a9e627f39


  • 21/11/2022
4 SISTEMAS DE PRESERVACIÓN DIGITAL PARA REVISTAS ACADÉMICAS

Geraldine Trujillo para Paideia Studio
 
Preservación digital: qué es y cómo implementarla en revistas académicas

El paso del tiempo y el impacto del cambio tecnológico pueden representar un gran problema para los documentos digitales y para las revistas en sí mismas; el incremento de los objetos digitales y la gran diversidad de formatos hacen que la preservación digital sea necesaria para perdurar en una era en donde la tecnología muta cada 24 horas.

¿Pero cómo es posible resguardar en el tiempo recursos digitales? A lo largo de este artículo te hablaremos de qué es la preservación digital, qué métodos hay para resguardar documentos y cómo implementarlos en revistas académicas.

La preservación digital es un concepto que suele pasar desapercibido, pero a pesar de esto debes entender que es un asunto significativo que requiere de gran cuidado, pues de ello dependerá la conservación en el tiempo de diferentes archivos digitales.

La preservación digital es entendida como un proceso destinado a garantizar la reutilización de documentos digitales varios, mantener por periodos largos objetos digitales y los contenidos informativos que estos contengan. Por ejemplo, una de las cosas más relevantes de una revista digital, en este caso, es la información que posee, aparte de su formato claro, por ello se deberá amparar su autenticidad.

La conservación del patrimonio digital es un montón de técnicas y procesos agrupadas en pro de la durabilidad de la información virtual. Tiene por objeto asegurar algunos aspectos, como:

  • Integridad
  • Autenticidad
  • Fiabilidad
  • Legibilidad
  • Funcionalidad
  • E independencia de los cambios tecnológicos
 Ahora, ¿Cuál es el objeto de la conservación digital? Ya puede que lo sepas, pero por si no, te lo recalcamos. El objetivo de todo esto es la preservación y uso de la información a largo plazo, ahí su importancia porque con los años todo puede perderse, pero haciendo de la preservación es más probable que se resista al cambio.

De nada valdría conservar un CD si no se puede usar. El soporte o el formato queda en segundo plano cuando es la información contenida lo que más vale, es por ello que garantizar el uso a lo largo de los años es un gran reto para editoriales, bibliotecas u organizaciones.

¿Pero a todo esto, qué tipo de archivo documental es indispensable conservar? Bueno, esta es una pregunta que cuya respuesta dependerá de opiniones y necesidades de cada institución, autor o servicio.

Algunos científicos sostienen que los archivos sonoros son los que requieren de preservación más que otros archivos, ya que son documentos vulnerables a los cambios tecnológicos, pues al ser grabado en soporte o materiales en específicos corren con la suerte de pasar de moda o quedar obsoletos con el tiempo, como los CD o los casetes.

Sin embargo, no solo los archivos sonoros tienen esta suerte, las revistas académicas, aunque tienen más posibilidad de perdurar, al estar en formato digital, pueden borrarse del sistema o volverse discontinuadas.

Algo fundamental a tener en cuenta antes de proseguir con este artículo es lo siguiente: hay que hacer una separación entre dos elementos que suelen confundirse: copia de seguridad y preservación digital.

No es lo mismo preservación a copia de seguridad, esto hay que tenerlo muy en claro porque son entes diferentes. Tener guardada una copia y preservar por largos años un archivo son asuntos distintos.

Veamos, las copias de seguridad evitan que la información actual se pierda, esta pérdida la causa un fenómeno catastrófico como lo puede ser el daño de una computadora o los apagones imprevistos que pueden ocasionar perdida de datos.

Por su parte, la preservación digital no tiene que ver con el material, soporte o respaldo y con eventos adversos que pudieran ocurrir, la conservación en este caso va enfocada a proteger los recursos digitales para el futuro con formatos generados automáticamente. Se enfoca en salvar los elemento que estén en formato digital, que sean de alta calidad y que probablemente necesitaremos en un futuro, como las publicaciones científicas.

Con la copia de seguridad es necesario generar copias regularmente y con la preservación digital basta con grabarla en otro soporte nuevo.

Es así como, no es lo mismo lo que se resguarda para días futuros y para la obtención de derivados, que lo que se guarda por prudencia.


4 sistemas de preservación digital para revistas académicas

El miedo de muchos editores/as, bibliotecarios/as e incluso autores/as es que una revista OJS (Open Journal Systems), software de código abierto el cual permite dirigir la totalidad del flujo editorial de una revista científica, deje de publicarse o se desconecte de un día para otro.

Pensado en esta problemática tan desastrosa, se crearon varios sistemas de preservación para revistas. A continuación, algunas alternativas:
  1. La Red de Preservación PKP (PKP PN): el PKP PN facilita servicios de preservación gratuitos para las revistas OJS siempre y cuando estas cumplan con una serie de requisitos básicos. Cabe mencionar, que el PKP entrega contenido haciendo uso del programa LOCKSS. 

PKP ha creado PKP Preservation Network (PKP PN) que cuida digitalmente las revistas OJS que no formen parte de otros sistemas de preservación, como los que se mencionan más abajo, para que se pueden guardar en una disposición a plazo largo.
Las revistas OJS que quieran acceder a la instalación y configuración de PKP PN deberán tener:

  • Versión compatible de OJS – OJS 3.1.2 o más actual
  • Un ISSN
  • Tener publicado al menos un artículo.
Cabe destacar, que el servicio es sin costo para quienes tengan OJS.
 

    2. LOCKSS (Lots of Copies Keep Stuff Safe): es un programa de la biblioteca de la Universidad de Stanford y es un software de código abierto. Muchas comunidades hacen uso de este          servicio para construir políticas de preservación que examinan y reparan diferentes archivos digitales. Los costos de participación están detallados aquí

    3. CLOCKSS (Controlled Lots of Copies Keep Stuff Safe): según su propia definición, su principal característica es que su principio de gobernanza es la comunidad y no una empresa matriz:

CLOCKSS is a tax-exempt, 501(c)3, not-for-profit charitable organization, developed and governed by libraries and publishers. Unlike other archiving solutions, CLOCKSS answers to its community, not to a parent company. Because CLOCKSS is a 501(c)3 not-for-profit organization, all contributions to CLOCKSS are tax deductible in the United States.

Los costos del servicios se encentran aquí

    4. Pórtico: es un prestador de servicios de archivo digital mundial proporcionado por ITHAKA , una organización sin fines de lucro. Pórtico tiene como finalidad preservar libros electrónicos y revistas digitales, así como otros contenidos académicos en diferentes formatos. También tiene como objetivo la preservación del contenido intelectual de revistas digitales por medio de contenidos asentados en JSTOR (un sistema de almacenamiento en línea para documentos académicos).

Los costos de Pórtico para editores se encuentran aquí

Si tienes una revista y necesitas preservarla vas a necesitar hacer uso de alguno de estos sistemas y si tienes dudas sobre cuál es mejor para tu revista consúltanos.

Puedes ver una comparación entre los diferentes servicios de preservación digital  en este documento elaborado por CLOCKSS que compartimos a continuación:

Buenas prácticas de backups

La preservación digital supone una serie de aspectos que se deben toman en cuenta para asegurar el acceso continuo a los materiales digitales durante el tiempo que sea necesario. Elegir los medios apropiados pese a los cambios tecnológicos es todo un reto, pero existen algunas técnicas o métodos de seguridad y conservación digital que debes conocer por su gran utilidad:

  • Refreshing: traspaso de datos a un soporte a otro, se cambia de soporte/material más no de contenido.
  • Migración: transferencia de datos de un formato a otro, es lo típico que hacemos cuando tenemos un archivo original y sacamos varias copias.
  • Emulación: reproducción de la operación del software original con el cual se crearon los archivos digitales para que puedan ejecutarse y usarse independientemente del programa fuente.
  • Metadatos: creación de datos relacionados con la información para reconocer y describir correctamente los documentos.
Estos son apenas algunas técnicas de preservación, pero existen otras, muchas de estas técnicas se pueden ajustar para la preservación de revistas académicas. Asegurar el contenido intelectual de las revistas u otros documentos electrónicos a lo largo del tiempo es sumamente importante. 

Mantener características como integridad, originalidad, autenticidad, accesibilidad e inalterabilidad es un compromiso de toda institución u organización y supone también un compromiso para todos los autores/as de revistas.

Dejar que una revista pase al olvido no es buena opción, el trabajo que una vez se construyó con esfuerzo no debe tirarse a la basura, por eso como creadores de contenido digital u organismo enfocados en la preservación es menester hacernos algunas preguntas que nos ayuden a identificar si algún archivo necesita o no preservarse:

¿Por qué guardar tu revista? ¿En cuál sistema guardarla? ¿Qué tiempo quieres que perdure? ¿Cómo quieres que usuarios y lectores accedan a ella?, y ¿Cómo hacer para que tu revista se mantenga inalterada?

Si tienes algunas respuestas, pero no todas, deja que los expertos te ayuden.

viernes, 4 de febrero de 2022

Criterios básicos para valorar sistemas de preservación digital

Publicado en blog Universo abierto
https://universoabierto.org/2022/01/17/criterios-basicos-para-valorar-sistemas-de-preservacion-digital/



Criterios básicos para valorar sistemas de preservación digital

Criterios básicos para valorar sistemas de preservación digital. Área de Tecnología del Grupo de Preservación Digital. México: UNAM–IIB, 2020.


Texto completo

PDF

ePub

Esta obra es el resultado del esfuerzo iniciado en 2017 por expertos en tecnologías y estudios de la información a partir de la conformación del Grupo de Preservación Digital promovido en la Biblioteca Nacional de México. En él participan especialistas de diversas áreas, con la intención de impulsar mejoras en la labor de preservar documentos patrimoniales digitales en México, generando y recopilando instrumentos que sustentan las iniciativas relacionadas con este tema. Aquí se presenta una guía integrada por un conjunto de elementos que son resultado de la investigación sobre estándares, así como de las experiencias y buenas prácticas relacionadas con la preservación digital y la ingeniería de software. En ella, se proponen criterios generales para la elección de un sistema para preservación digital o herramienta de software con el fin de establecer una plataforma que ayude a administrar las actividades de este tipo de procesos.

miércoles, 28 de abril de 2021

LIBRO: Textos, pixeles y bits [ Galina, Isabel , Instituto de Investigaciones Bibliográficas UNAM 2015 ]

 




Disponible en: http://librosoa.unam.mx/handle/123456789/2560


Textos, pixeles y bits


ISBN: 978-607-02-6369-9
Año de publicación: 2015

Autor(es): Galina, Isabel

Resumen
Libro electrónico que analiza los retos que enfrenta la producción editorial en el cada vez más acelerado campo tecnológico. El uso de las redes sociales y la llamada web 2.0 han permitido la publicación, por parte de los mismos usuarios, de una enorme cantidad de material digital, como novelas electrónicas, fotografías, ilustraciones y blogs, lo cual ha generado otro orden de difusión de las distintas formas del saber. Atendiendo estas premisas, los estudios que componen la presente obra buscan responder las preguntas más apremiantes acerca de las publicaciones digitales.

URL del recurso

Subárea de conocimiento

Plan 2.0 para el acceso abierto: ¿un plan o una nueva ambigüedad?

Publicado en THE Times Higher Education https://www.timeshighereducation.com/news/plan-s-20-open-access-plan-bold-may-prove-ineffective   El...