Boletín SciELO-México: Por qué los editores deben preocuparse por los identificadores persistentes

lunes, 9 de agosto de 2021

Por qué los editores deben preocuparse por los identificadores persistentes

https://scholarlykitchen.sspnet.org/2021/06/21/why-publishers-should-care-about-persistent-identifiers/

Por qué los editores deben preocuparse por los identificadores persistentes

Por Phill Jones, Alice Meadows

21 de junio de 2021

El post de hoy es el primero de dos en los que analizamos el estado de los identificadores persistentes y lo que significan para los editores, coincidiendo con la primera reunión, el 21 de junio, del nuevo Consejo Nacional de Coordinación de Identificadores de Investigación del Reino Unido (RINCC) y la publicación, el mismo día, de un informe de análisis de costes y beneficios ( Cost Benefit Analysis Report ), financiado por el proyecto de Identificadores Persistentes (PID) del Reino Unido para el acceso abierto.

En los últimos años se ha avanzado mucho en el desarrollo de recomendaciones, políticas y procedimientos para crear, promover y utilizar identificadores persistentes (IDP). PIDapalooza, la conferencia insignia para proveedores y usuarios de IDP, cumple ahora cinco años (five years old) y sigue creciendo. Varios financiadores y organizaciones nacionales de investigación están elaborando sus propias hojas de ruta de los IDP, como ésta del Consejo de Investigación Holandés (NWO) -Dutch Research Council (NWO)- y el Consorcio Nacional de IDP del Reino Unido -UK National PID Consortium. Y a los proveedores de IDP más consolidados (Crossref, ORCID, DataCite), se suman organizaciones e iniciativas nuevas y emergentes. Entre ellas se encuentra el Registro de Organizaciones de Investigación (ROR) -Research Organization Registry (ROR)-, cada vez más adoptado, un identificador abierto dirigido por la comunidad para las instituciones de investigación; y el Identificador de Actividades de Investigación (RAiD) -Research Activity Identifier (RAiD)-, un proyecto en fase inicial, dirigido por el Australian Research Data Commons (ARDC) y la Estrategia Nacional de Infraestructura de Investigación Colaborativa (NCRIS) -National Collaborative Research Infrastructure Strategy (NCRIS)- que es un identificador contenedor para proyectos de investigación. Además, la propia Crossref está trabajando con los financiadores (working with funders) para registrar los DOI de las subvenciones concedidas.

Los editores -y los proveedores de sistemas de publicación- fueron los primeros en adoptar con entusiasmo los identificadores persistentes. Crossref fue fundada originalmente por un grupo de editores que competían entre sí para abordar la vinculación de las citas en las publicaciones en línea, y la gran mayoría de sus 14,000 miembros actuales, aproximadamente, son organizaciones editoriales. Los fundadores de ORCID también incluían a varios editores y, aunque sólo 83 de los más de 1,100 miembros actuales son editores, se podría argumentar que están por encima de su peso, ya que los iDs de ORCID se utilizan más a menudo en los flujos de trabajo de publicación de revistas que cualquier otro. La mayoría de los principales sistemas de presentación de manuscritos cuentan con integraciones de ORCID, y más de 2,000 revistas exigen ahora la identificación de ORCID para el autor colaborador, y miles más la solicitan.

Sin embargo, creemos que es justo decir que muchos -probablemente la mayoría- de los editores no están aprovechando todo el potencial de los IDP. Los DOIs se registran para la mayoría de las publicaciones (especialmente los DOIs de Crossref) y los iDs de ORCID se recopilan, pero su valor total - tanto para los autores como para los editores - no se está explotando actualmente. Por ejemplo, a pesar de que se recogen los ID de ORCID de un gran número de autores (y, en algunos casos, también de los revisores), los sistemas de presentación de manuscritos no suelen extraer muchos datos del registro de ORCID, o ninguno. Esto significa que los autores tienen que volver a introducir la información, por ejemplo, sobre su institución, subvención(es), etc., lo que lleva tiempo y corre el riesgo de crear errores, por no hablar de la mala experiencia del usuario cuando esto ocurre en varias revistas, incluso cuando el autor ha iniciado sesión en el sistema utilizando su ID ORCID. Los editores también se han implicado menos en el desarrollo de otros IDP y (probablemente relacionado) parecen utilizarlos menos que las organizaciones de otros sectores de la comunidad investigadora. Por ejemplo, sólo seis de los más de 60 asesores de la comunidad ROR son editores.

Sin embargo, el uso de las IDP en la publicación de acceso abierto sí parece ser de interés para los editores, y los editores de acceso abierto (OA) también son más propensos a tener una estrategia clara de IDP (F1000 e Hindawi son buenos ejemplos). Esto puede deberse a que, desde el punto de vista funcional, adjuntar información precisa sobre las subvenciones a los artículos de acceso abierto es fundamental para una facturación precisa y (en su caso) para demostrar el cumplimiento de los acuerdos de publicación transformadora. Nos gustaría que todos los editores adoptaran el uso de IDPs - más allá de la simple recopilación de IDs ORCID y el registro de DOIs para las publicaciones - para ayudar a mejorar la experiencia del usuario para sus autores y revisores, y permitir el reconocimiento preciso de sus contribuciones; para aumentar la descubribilidad y, por lo tanto, el uso de sus publicaciones; para garantizar el cumplimiento de un número creciente de políticas, incluyendo el Plan S; y para facilitar un mejor análisis y presentación de informes.

En el PIDapalooza 2021, Ed Pentz y Rachael Lammey, de Crossref, dieron una charla descaradamente titulada "PIDapap party-pooper: Los IDP son un callejón sin salida; viva la infraestructura abierta" ( “PIDapap-party-pooper: PIDs are a dead end; long live open infrastructure” ). La charla en sí misma es bastante técnica en algunos puntos, así que si los recorridos por las respuestas de la API codificadas en JSON no son necesariamente lo tuyo, permítenos resumir lo que creemos que es el punto importante…

Lo más importante de los IDP no es que sean únicos, ni que sean persistentes, ni que se resuelvan, es decir, que eviten la pérdida de enlaces. Lo más importante de los IDP son los metadatos que se asocian a ellos, es decir, la información que se puede recuperar cuando un programa, plataforma o aplicación web solicita datos a la API del proveedor de IDP, que puede contener, y a menudo contiene, otros IDP. Los metadatos permiten establecer conexiones entre los artículos publicados, los investigadores, los conjuntos de datos, los programas informáticos, las instituciones, las subvenciones, los financiadores, etc., incluyendo eventualmente cosas como las instalaciones compartidas (EG CERN), los instrumentos (el Hubble, o la resonancia magnética humana de 10,5T en la Universidad de Minnesota / 10.5T human MRI at University of Minnesota), y otras inversiones de nivel estratégico de importancia nacional y mundial.

Una entrada del blog (blog post) de Martin Fenner y Amir Aryani en el sitio web de FREYA introduce el concepto de gráfico IDP y explica su importancia. A medida que más y más objetos (publicaciones, datos, personas, lugares, cosas, etc.) tienen metadatos cada vez más ricos asociados a ellos, podemos establecer más y más conexiones entre esos objetos, lo que nos permite plantear y responder a preguntas útiles, como cuántos artículos de investigación se escribieron a partir de los datos de un instrumento compartido o qué instituciones o países están produciendo el trabajo más impactante en un área determinada. Esto, a su vez, nos permite analizar datos más completos, más oportunos y más precisos, lo que permite mejorar la toma de decisiones.

Representación esquemática del gráfico IDP con objetos digitales conectados por IDP, que muestra tres casos de uso: A: Diferentes versiones de código de software, B: Conjuntos de datos alojados en un determinado repositorio, C: Todos los objetos digitales conectados a un objeto de investigación.

Teniendo en cuenta que cada año se gastan alrededor de 1,7 billones de dólares en investigación y desarrollo ($1.7 trillion is spent on research and development) en todo el mundo, no cabe duda de que los responsables políticos de los sectores gubernamental, sin ánimo de lucro y comercial quieren acceder a análisis que demuestren si están haciendo el mejor uso posible de todo ese dinero.

¿Un panorama político cambiante?

Los IDP han llegado para quedarse porque ofrecen a los responsables políticos un mecanismo transparente para seguir el impacto de las decisiones estratégicas que toman, pero ¿cómo afectará esto a la industria editorial?

Cada vez es mayor la demanda de una evaluación de la investigación de mayor calidad, como demuestran ejercicios como el Research Excellence Framework (REF) del Reino Unido y el Excellence in Research for Australia (ERA), así como la San Francisco Declaration on Research Assessment (DORA). Hasta la fecha, la carga de permitir estas evaluaciones ha recaído de manera desproporcionada en las instituciones, y en los investigadores y administradores que trabajan para ellas. Una encuesta realizada en 2018 a los miembros de la Young Academy of Europe descubrió que los investigadores que inician su carrera profesional dedican casi el 20% de su tiempo a tareas administrativas (20% of their time doing administrative work). Este problema no ha pasado desapercibido. En el Reino Unido, por ejemplo, la reducción de la carga administrativa para los investigadores se ha convertido en un objetivo político importante (a major policy objective). Los financiadores también están adoptando cada vez más medidas concretas. Algunos ejemplos de proyectos de automatización de los financiadores son el Europe PMC Grant Finder (Europe PMC Grant Finder), que vincula más de 16,000 becas con DOI a los artículos de investigación asociados, y el proyecto ORCID ORBIT, creado para que los financiadores se comprometan a utilizar identificadores persistentes para automatizar y agilizar el flujo de información sobre investigación entre sistemas. Y, en un reciente documento de política del gobierno del Reino Unido (UK government policy paper), el financiador nacional UKRI se comprometió a "poner fin a las múltiples solicitudes de datos o información que ya existen en otros lugares, por ejemplo, en ORCID, CrossRef, DataCite...".

Dado que los gobiernos, los financiadores y las instituciones están trabajando en favor de una infraestructura abierta y optimizada para la identificación personal con el fin de reducir la carga de los investigadores y aumentar la transparencia, los editores deben estar preparados para seguirles.

Posibles ventajas para los editores: automatización y capacidad de descubrimiento

Las políticas de IDP no se limitan a trasladar la carga de la administración de los investigadores a los financiadores y editores. Una infraestructura abierta bien diseñada ofrece beneficios a todas las partes interesadas a través de la eficiencia, así como datos más completos, precisos y oportunos. Estos beneficios se dividen en tres grandes categorías:

Intercambio de metadatos
Automatización de procesos
Mejora de la visión y el análisis empresarial

Empezando por el principio, consideremos cómo obtienen actualmente los editores los metadatos. Por lo general, se obtienen directamente de los autores, a menudo en el momento de la presentación de los contenidos, y a menudo a través de sistemas tortuosos y largos que requieren que los autores obtengan los números de subvención, las direcciones de afiliación, las identificaciones ORCID de los colaboradores, etc. Según este estudio publicado recientemente (Alice es una de las autoras), la mayoría de los editores que respondieron a una encuesta de Metadata 2020 informaron de que sus metadatos son, al menos parcialmente, introducidos manualmente, o más exactamente, reintroducidos. Existen herramientas que pueden extraer los metadatos de los manuscritos, pero los resultados suelen ser contradictorios y requieren una comprobación. Si los datos pueden identificarse positivamente y trasladarse de un sistema a otro, serán más precisos y completos, a la vez que supondrán una menor carga, no sólo para los autores, sino también para los departamentos de redacción y producción. Además, esos metadatos estarán disponibles para el autor, el editor y las demás organizaciones y sistemas con los que interactúan, lo que permitirá a todos beneficiarse de un flujo de información de alta calidad. Como señala el estudio Metadata 2020, "a través de sus interacciones con los investigadores como creadores y consumidores de contenidos, los editores están bien situados para desempeñar un papel más importante en la mejora de los flujos de trabajo de metadatos de lo que parece que hacen actualmente..."

A continuación, la automatización, que amplía las ventajas del intercambio de datos para mantenerlos actualizados sin problemas, y potencialmente incluso corregirlos automáticamente (ORCID auto-update). La actualización automática de ORCID, tanto de Crossref como de DataCite, es un gran ejemplo de ello. Lleva más de cinco años funcionando y permite a los investigadores que sus publicaciones se añadan automáticamente a su registro de ORCID cuando se registra el DOI. Esto no sólo les ahorra tiempo, sino que también les ayuda a hacer un seguimiento de sus publicaciones y a citarlas y compartirlas en las propuestas de subvención, así como en la evaluación de la investigación.

Esta información no sólo sale de los sistemas de las editoriales, sino que también puede entrar en ellos, lo que permite la última de nuestras tres ventajas: una mejor (y más fácil) visión del negocio. Durante años, las grandes editoriales han llevado a cabo sus propios análisis de las disciplinas y mercados emergentes utilizando técnicas avanzadas de bibliometría y cienciometría, y los consultores suelen proporcionar el mismo tipo de apoyo a las organizaciones más pequeñas. En un mundo totalmente optimizado para los IDP, unos metadatos más completos, precisos y oportunos, generados en la fuente en lugar de extraídos o recolectados, harán que este tipo de análisis sea más accesible para todos, así como más potente.

En la segunda parte de esta serie, Alice y Phill se adentrarán en las implicaciones del propio análisis coste-beneficio y analizarán los beneficios que aportaría un ecosistema de investigación totalmente optimizado para los IDP.

Phill Jones

@phillbjones

Phill Jones es cofundador de MoreBrains Consulting Cooperative. MoreBrains trabaja en la ciencia abierta, la infraestructura de investigación y la publicación. Como parte del equipo de MoreBrains, Phill apoya a una diversa gama de clientes, desde financiadores hasta comunidades de práctica, en una amplia gama de desafíos estratégicos y operativos. Ha trabajado en una variedad de puestos de responsabilidad y gobernanza en el ámbito editorial, de divulgación, de cienciometría, de producto y de tecnología en lugares como JoVE, Digital Science y Emerald. Anteriormente, fue investigador científico interdisciplinar en la Autoridad de la Energía Atómica del Reino Unido y en la Facultad de Medicina de Harvard.

*************************************************

Boletín SciELO-México

lunes, 9 de agosto de 2021

Por qué los editores deben preocuparse por los identificadores persistentes

No hay comentarios:

Publicar un comentario

MÉXICO: UNAM y el fraude con la IA en el examen de ingreso

Denunciar abuso

Etiquetas