Boletín SciELO-México

jueves, 18 de noviembre de 2021

APCs = pago por el prestigio: Por qué el precio de las publicaciones académicas es mucho más alto que el coste

Publicado en blog Sauropod Vertebra Picture of the Week
https://svpow.com/

Por qué el precio de las publicaciones académicas es mucho más alto que el coste

18 de octubre de 2021

La última vez examinamos la diferencia entre coste (Last time, we looked at the difference between cost, value and price), valor y precio, y aplicamos esos conceptos a mercados sencillos, como el de las sillas, y al complejo mercado de la publicación académica. Terminamos con la observación de que el precio que nuestra comunidad paga por la publicación de un artículo (unos 3.333 dólares de media) es entre 3 y 7 veces superior a lo que cuesta publicarlo (entre $500-$1000).

¿Cómo es posible? Una parte de la respuesta es que el valor de un artículo publicado para la comunidad es aún mayor: si no fuera así, nadie pagaría. Pero esa no puede ser la única razón.

En un mercado eficiente, los proveedores de un bien que compiten entre sí tratarán de rebajar sus precios hasta que los que cobran se acerquen al coste. Si, por ejemplo, Elsevier y Springer-Nature compitieran en un mercado libre y saludable, cada una de ellas cobraría un tercio de lo que cobra ahora, por miedo a ser superada por su competidor de menor precio. (La mitad de esos recortes de precios se absorberían simplemente disminuyendo los enormes márgenes de beneficio (the huge profit margins); el resto tendría que provenir de la racionalización de los procesos empresariales, en particular de cosas como los costes de mantenimiento de los muros de pago (costs of maintaining paywalls) y los medios para atravesarlos).

Entonces, ¿por qué la Mano Invisible (the Invisible Hand) no actúa sobre las editoriales académicas? Porque no compiten realmente. Las suscripciones no son bienes sustituibles porque cada artículo publicado es único. Si necesito leer un artículo de una revista de Elsevier, no sirve de nada que compre una suscripción a Springer-Nature de menor precio: no me dará acceso al artículo que necesito.

(Ésta es una de las razones por las que el modelo basado en el APC -a pesar de sus verdaderos inconvenientes- es mejor que el modelo de suscripción: porque los servicios editoriales y de publicación ofrecidos por Elsevier y Springer-Nature son sustituibles. Si uno de ellos ofrece el servicio por 3.000 dólares y el otro por 2.000 dólares, puedo acudir al proveedor de mayor valor. Y si alguna otra editorial lo ofrece por 1.000 o 500 dólares, puedo acudir a ella).

En los últimos años se han producido grandes y bienvenidos avances hacia el establecimiento del acceso abierto como modo dominante de publicación de trabajos académicos, y en la actualidad la producción se divide más o menos al 50% entre el acceso de pago y el abierto. Podemos esperar que el acceso abierto domine cada vez más en los próximos años. En muchos aspectos, la batalla por el AA está ganada: aún no hemos llegado al Día de la Victoria, pero el Desembarco del Día D ya está hecho.

Sin embargo, los APCs de los grandes editores todavía se sitúan en el rango de 3000 a 5000 dólares en lugar de converger en 500 a 1000 dólares. ¿Por qué?

Björn Brembs lleva años escribiendo (Björn Brembs has been writing for years) sobre el hecho de que cada mercado tiene un segmento de lujo (every market has a luxury segment): se puede comprar un reloj de pulsera perfectamente funcional por 10 dólares, pero la gente se gasta miles en relojes de alta gama. Hace tiempo que le preocupa que si las publicaciones académicas se convierten en APC, la gente hará cola para pagar los 9.500 euros de APC por Nature, en lo que se convertiría en un trato directo de pago por prestigio (queuing up to pay the €9,500 APC for Nature in what would become a straightforward pay-for-prestige deal). Y tiene razón: dada la forma extraordinariamente estúpida en que evaluamos a los investigadores para los puestos de trabajo, la promoción y la titularidad, mucha gente pagará un recargo de 10 veces por el distintivo "he sido publicado en Nature", aunque los artículos de Nature sean una forma objetivamente mala de comunicar la investigación.

Pero da la sensación de que aquí está ocurriendo algo más extraño. Es casi como si todo el maldito mercado fuera un segmento de lujo. El promedio de APC financiado por el Wellcome Trust en 2018/19 (unded by the Wellcome Trust in 2018/19) fue de 2.410 libras esterlinas, actualmente unos 3.300 dólares. Lo que es casi exactamente el coste medio de los artículos de 3.333 dólares que hemos calculado antes. Lo que sucede es que los grandes editores han aterrizado en los APC a tasas que preservan el nivel de ingresos anterior. Eso es comprensible por su parte, pero lo que quiero saber es ¿por qué seguimos pagándoles? ¿Por qué todos los becarios de Wellcome no se alejan de Elsevier y Springer-Nature y publican en alternativas mucho más baratas?

En otras palabras, ¿por qué no actúan las fuerzas del mercado?

Se me ocurren tres razones por las que los investigadores prefieren gastar 3.000 dólares en lugar de 1.000:

Podría ser que realmente obtuvieran un servicio tres veces mejor de las grandes editoriales. Menciono esto por puro interés, ya que no hay pruebas que respalden la hipótesis. No parece haber ninguna correlación entre el precio y la calidad del servicio.

Los investigadores se dejan llevar por la inercia y siguen enviando sus trabajos a las revistas que solían enviar en los viejos tiempos de las suscripciones. No estoy del todo exento de simpatía por esto: hay comodidad en la familiaridad, y conveniencia en conocer el sabor de una revista, las expectativas y el consejo editorial. Pero, ¿merecen estas cosas un aumento del 200%?
Los investigadores compran prestigio, o al menos lo que perciben como tal. (En realidad, no estoy convencido de que los artículos de las revistas no excepcionales de Elsevier o Springer-Nature se consideren más prestigiosos que los de las revistas más baratas pero mejor nacidas de Acceso Abierto. Pero para que esto ocurra, sólo hace falta que la gente piense que las revistas antiguas son más prestigiosas, no hace falta que tengan razón).

Pero detrás de todas estas razones para acudir a una editorial más cara hay una muy importante para no molestarse en acudir a una editorial más barata: los investigadores están gastando el dinero de otras personas. No es de extrañar que no les importen los miles de libras adicionales.

¿Cómo pueden los financiadores arreglar esto y conseguir que los APCs bajen a niveles que se aproximen al coste de publicación? Veo al menos tres posibilidades.

En primer lugar, podrían dejar de pagar los APC a sus beneficiarios. En su lugar, podrían añadir una cantidad fija a todas las subvenciones que conceden -1.500 dólares, por ejemplo- y dejar a los investigadores la decisión de gastar más en una editorial heredada (complementando los 1.500 dólares con otras fuentes propias) o gastar menos en una editorial más barata y redistribuir el exceso en otro lugar.

En segundo lugar, los financiadores podrían simplemente publicar los artículos ellos mismos. Para ser justos, varios grandes financiadores están haciendo esto ahora, así que tenemos Wellcome Open Research, Gates Open Research, etc. Pero, ¿no parece un poco absurdo separar la investigación según el organismo que haya concedido la subvención que la haya financiado? ¿Y qué pasa con los autores que no tienen una subvención de uno de estos organismos, o incluso ninguna subvención?

Por eso creo que la tercera solución es la mejor. Me gustaría que los financiadores dejaran de pagar los APC y de crear sus propias soluciones de publicación, y que en su lugar colaboraran en la creación y el mantenimiento de una solución de publicación global que todos los investigadores pudieran utilizar con independencia de su condición de beneficiarios de subvenciones. Tengo mucho que decir sobre cómo debería ser esa solución, pero eso es para otra ocasión.

Publicado por Mike Taylor

*************************

Why the price of scholarly publishing is so much higher than the cost

October 18, 2021

Last time, we looked at the difference between cost, value and price, and applied those concepts to simple markets like the one for chairs, and the complex market that is scholarly publication. We finished with the observation that the price our community pays for the publication of a paper (about $3,333 on average) is about 3–7 times as much as its costs to publish ($500-$1000)?

How is this possible? One part of the answer is that the value of a published paper to the commnity is higher still: were it not so, no-one would be paying. But that can’t be the whole reason.

In an efficient market, competing providers of a good will each try to undercut each other until the prices they charge approach the cost. If, for example, Elsevier and Springer-Nature were competing in a healthy free market, they would each be charging prices around one third of what they are charging now, for fear of being outcompeted by their lower-priced competitor. (Half of those price-cuts would be absorbed just by decreasing the huge profit margins; the rest would have to come from streamlining business processes, in particular things like the costs of maintaining paywalls and the means of passing through them.)

So why doesn’t the Invisible Hand operate on scholarly publishers? Because they are not really in competition. Subscriptions are not substitutable goods because each published article is unique. If I need to read an article in an Elsevier journal then it’s no good my buying a lower-priced Springer-Nature subscription instead: it won’t give me access to the article I need.

(This is one of the reasons why the APC-based model — despite its very real drawbacks — is better than the subscription model: because the editorial-and-publication services offered by Elsevier and Springer-Nature are substitutable. If one offers the service for $3000 and the other for $2000, I can go to the better-value provider. And if some other publisher offers it for $1000 or $500, I can go there instead.)

The last few years have seen huge and welcome strides towards establishing open access as the dominant mode of publication for scholarly works, and currently output is split more or less 50/50 between paywalled and open. We can expect OA to dominate increasingly in future years. In many respects, the battle for OA is won: we’ve not got to VE Day yet, but the D-Day Landings have been accomplished.

Yet big-publisher APCs still sit in the $3000–$5000 range instead of converging on $500-$1000. Why?

Björn Brembs has been writing for years about the fact that every market has a luxury segment: you can buy a perfectly functional wristwatch for $10, yet people spend thousands on high-end watches. He’s long been concerned that if scholarly publishing goes APC-only, then people will be queuing up to pay the €9,500 APC for Nature in what would become a straightforward pay-for-prestige deal. And he’s right: given the outstandingly stupid way we evaluate reseachers for jobs, promotion and tenure, lots of people will pay a 10x markup for the “I was published in Nature” badge even though Nature papers are an objectively bad way to communicate research.

But it feels like something stranger is happening here. It’s almost as though the whole darned market is a luxury segment. The average APC funded by the Wellcome Trust in 2018/19 was £2,410 — currently about $3,300. Which is almost exactly the average article cost of $3,333 that we calculated earlier. What’s happening is that the big publishers have landed on APCs at rates that preserve the previous level of income. That is understandable on their part, but what I want to know is why are we still paying them? Why are all Wellcome’s grantees not walking away from Elsevier and Springer-Nature, and publishing in much cheaper alternatives?

Why, in other words, are market forces not operating here?

I can think of three reasons why researchers prefer to spend $3000 instead of $1000:

It could be that they are genuinely getting a three-times-better service from the big publishers. I mention this purely for completeness, as no evidence supports the hypothesis. There seems to be absolutely no correlation between price and quality of service.
Researchers are coasting on sheer inertia, continuing to submit to the journals they used to submit to back in the bad old days of subscriptions. I am not entirely without sympathy for this: there is comfort in familiarity, and convenience in knowing a journal’s flavour, expectations and editorial board. But are those things worth a 200% markup?
Researchers are buying prestige — or at least what they perceive as prestige. (In reality, I am not convinced that papers in non-exceptional Elsevier or Springer-Nature journals are at all thought of as more prestigous than those in cheaper but better born-OA journals. But for this to happen, it only needs people to think the old journals are more prestigious, it doesn’t need them to be right.)

But underlying all these reasons to go to a more expensive publishers is one very important reason not to bother going to a cheaper publisher: researchers are spending other people’s money. No wonder they don’t care about the extra few thousand pounds.

How can funders fix this, and get APCs down to levels that approximate publishing cost? I see at least three possibilities.

First, they could stop paying APCs for their grantees. Instead, they could add a fixed sum onto all grants they make — $1,500, say — and leave it up to the researchers whether to spend more on a legacy publisher (supplementing the $1,500 from other sources of their own) or to spend less on a cheaper born-OA publisher and redistribute the excess elsewhere.

Second, funders could simply publish the papes themselves. To be fair several big funders are doing this now, so we have Wellcome Open Research, Gates Open Research, etc. But doesn’t it seem a bit silly to silo research according to what body awarded the grant that funded it? And what about authors who don’t have a grant from one of these bodies, or indeed any grant at all?

That’s why I think the third solution is best. I would like to see funders stop paying APCs and stop building their own publishing solutions, and instead collaborate to build and maintain a global publishing solution that all researchers could use irrespective of grant-recipient status. I have much to say on what such a solution should look like, but that is for another time.

Posted by Mike Taylor

martes, 16 de noviembre de 2021

La cobertura de los índices de citas abiertos se acerca a la de Web of Science y Scopus

La cobertura de los índices de citas abiertos se acerca a la de Web of Science y Scopus [1]

Alberto Martín-Martín ( albertomartin@ugr.es; @albertomartin)

Facultad de Comunicación y Documentación, Universidad de Granada, España. Miembro del Grupo ThinkEPI.

Para poder observar y comprender cómo se desarrolla la actividad académica es esencial contar con colecciones exhaustivas de metadatos sobre la misma. Históricamente, el sector comercial ha sido el principal desarrollador y proveedor de servicios de información utilizados para estos propósitos. Concretamente dos proveedores, Clarivate Analytics (y anteriormente Thomson Reuters) con su plataforma Web of Science, y Elsevier con Scopus, han mantenido durante años una posición dominante sobre este tipo de información al no existir otros competidores que ofrecieran servicios similares. Un tercer actor, Google, a pesar de ofrecer su buscador académico Google Scholar, no ha dado muestras de interés en este mercado, centrándose principalmente en el rol de herramienta de descubrimiento.

Los proveedores comerciales de metadatos académicos suelen elegir modelos de negocio que supeditan el acceso a sus plataformas al pago de suscripciones. Además, con el objetivo de salvaguardar la sostenibilidad y rentabilidad económica de sus servicios a lo largo del tiempo, mantienen un control exclusivo sobre sus colecciones de metadatos mediante la aplicación de licencias de uso restrictivas. De esta manera, estos servicios limitan las formas en las que sus clientes pueden acceder, reutilizar, y redistribuir la información disponible en estas plataformas.

En paralelo a esta situación, el constante desarrollo tecnológico ha generado un entorno en el que las barreras de acceso a hardware y software con altas prestaciones se han reducido considerablemente (a pesar de la crisis de abastecimiento de microchips en la que nos encontramos actualmente). Dicho escenario no sólo está contribuyendo a ampliar los horizontes de actuación de empresas y laboratorios consolidados, sino que está reduciendo el coste de entrada a nuevos grupos con ideas innovadoras. En el campo de los servicios de información científica, sin embargo, el crecimiento generalizado de las capacidades de computación disponibles contrasta con las todavía limitadas capacidades de acceso y reutilización de datos que ofrecen las fuentes tradicionales.

En el contexto actual, por tanto, es cada vez más problemático que la sostenibilidad de los sistemas de información científica, un elemento crítico de la infraestructura del sistema científico, requiera mantener una escasez artificial en el acceso y reutilización de los datos que contienen. Por un lado, estos modelos no facilitan que la comunidad académica pueda dotarse de nuevas infraestructuras y herramientas que busquen adaptarse mejor a las necesidades cambiantes. Por otro lado, el veto a la redistribución de metadatos que imponen los proveedores significa que los análisis que se derivan de sus datos no pueden alcanzar los crecientes estándares de auditabilidad y reproducibilidad que se deberían exigir a trabajos científicos realizados en el S. XXI.

Afortunadamente, tras un inevitable periodo en el que mayormente se reproducían en el entorno digital los modelos asentados en el entorno analógico, cada vez más sectores del sistema científico están explorando nuevos modelos y flujos de trabajo que aprovechen en mayor medida las oportunidades que ofrecen las tecnologías disponibles para afrontar los retos actuales. Podríamos considerar esto como una nueva fase del proceso de transformación digital de la ciencia, que como es normal también está afectando a la comunicación científica.

Un episodio reciente que nos ha mostrado tanto las oportunidades como los riesgos que es capaz de generar un modelo de servicio de información más abierto lo tenemos en el caso de Microsoft Academic (Tay et al., 2021). Desde 2016, el buscador académico de Microsoft ha distribuido su extensa colección de metadatos, actualmente con un tamaño superior y prestaciones en ocasiones comparables a la de servicios comerciales, mediante licencias abiertas que otorgan a los usuarios amplios derechos para transformar y redistribuir los metadatos. Así, a pesar de que su interfaz web de búsqueda no ha llegado a calar entre la población académica en general, el proyecto ha tenido una influencia mayúscula en el desarrollo de un nuevo ecosistema de herramientas innovadoras que utilizan sus datos como base (Figura 1). Tristemente, en mayo de 2021 trascendió que Microsoft Academic desaparecería a finales del mismo año, poniendo en peligro la continuidad de los proyectos que dependen de él.

Fig 1. Herramientas que han reutilizado datos de Microsoft Academic Graph. Producción propia, originalmente publicada en Tay et al. (2021)

Este revés trae consigo una importante lección: los elementos que forman parte de la infraestructura del sistema de información científico deben desarrollar y atenerse a una serie de principios de gobernanza, sostenibilidad, y protección que garanticen en la medida de lo posible su funcionamiento continuado. Los Principios de la Infraestructura Académica Abierta (POSI, por sus siglas en inglés) ofrecen un marco sobre el que pueden trabajar las organizaciones que tienen intención de ofrecer este tipo de servicios (Bilder et al., 2020).

Crossref es otro ejemplo de infraestructura de metadatos de investigación abierta, quizás la más crucial que existe actualmente en el entorno de la comunicación científica a nivel mundial. Asimismo, también es una organización pionera en su compromiso con POSI. Además de acuñar muchos de los DOIs que se asignan a las publicaciones científicas para servir como sus identificadores persistentes, Crossref publica metadatos sobre dichas publicaciones (más de 120 millones de registros en su último archivo público). Estos metadatos no tienen asignada ninguna licencia de uso por parte de Crossref, porque la organización considera que este tipo de datos son “hechos”, que según la ley en EE.UU. no pueden ser objeto de copyright. Esta colección de metadatos por tanto puede ser obtenida, reutilizada, y redistribuida sin ningún tipo de limitación.

Gracias a su naturaleza abierta, los metadatos disponibles en Crossref también han estimulado la innovación en servicios de información dirigidos al público académico. Algunos ejemplos:

· Muchas de las herramientas de descubrimiento de literatura académica lanzadas más recientemente, como Dimensions, The Lens, y Scilit aprovechan los metadatos de Crossref para mantener actualizados sus índices con los documentos publicados más recientemente.

· El gestor de referencias bibliográficas de código abierto Zotero es capaz de extraer metadatos de la API pública de Crossref a partir del DOI, lo que proporciona una manera fácil de alimentar colecciones personales de referencias bibliográficas. Este método es además mucho más fiable que utilizar las referencias bibliográficas generadas por Google Scholar.

· La base de datos Unpaywall (también abierta) utiliza metadatos de Crossref (entre otras fuentes) para identificar qué documentos están disponibles en acceso abierto. Estos datos a su vez alimentan el servicio Unsub, una herramienta diseñada para ayudar a las bibliotecas académicas a tomar decisiones informadas sobre las suscripciones de revistas que les conviene mantener y las que no.

Históricamente, la generación de índices de citas y herramientas derivadas de estos datos ha sido uno de los servicios que solo se ofertaban en las plataformas comerciales (como las mencionadas Web of Science y Scopus), o en plataformas de acceso gratuito, pero con grandes restricciones de uso (Google Scholar). En los últimos años, sin embargo, la exclusividad en la oferta de estos datos que hasta hace poco ejercían estas fuentes está menguando. En parte esto es una consecuencia de los cambios en los flujos de trabajo que se están asentando en la publicación académica digital.

Las editoriales que forman parte de Crossref pueden incluir las listas de referencias citadas entre el resto de los metadatos de las publicaciones cuando se están registrando nuevos documentos en la plataforma. Un gran número de editoriales, de hecho, ya lo están haciendo. La política de Crossref es hacer que estas listas de referencias citadas sean públicamente accesibles por defecto, aunque las editoriales pueden elegir mantenerlas ocultas. De lo anterior se desprende que si la mayoría de las editoriales depositaran sus listas de referencias citadas en Crossref y consintieran que éstas se hicieran públicas, sería posible generar un índice de citas exhaustivo que estuviera libre de las restricciones impuestas por las plataformas comerciales.

La Iniciativa en favor de las Citas Abiertas (I4OC por su acrónimo en inglés) es un grupo de presión que ha trabajado desde 2017 para conseguir precisamente este objetivo, y ya ha conseguido convencer a más de dos mil editoriales para que compartan públicamente las listas de referencias citadas que depositan en Crossref. En la primera mitad de 2021, Elsevier, la American Chemical Society, y Wolters Kluwer, se unieron a esta iniciativa, de manera que actualmente prácticamente todas las grandes editoriales académicas ya apoyan I4OC mediante la apertura de sus referencias en Crossref. La única excepción a destacar entre las grandes editoriales es IEEE (Institute of Electrical and Electronics Engineers).

Gracias a los esfuerzos de I4OC y de las editoriales colaboradoras, el 87% de los documentos con referencias citadas en Crossref tiene dichas referencias en abierto. Esto ha permitido que organizaciones como OpenCitations (uno de los miembros fundadores de I4OC) hayan podido generar índices de citas abiertos a partir de dichos datos. Uno de estos índices es COCI, un índice de citas DOI-a-DOI generado exclusivamente con datos de Crossref (Heibi et al., 2019; Peroni & Shotton, 2020). Otras organizaciones también están ofreciendo sus propios índices de citas abiertos: tras lanzar su propio buscador académico, Internet Archive recientemente ha liberado el índice citas (Refcat) en el que se apoya dicho buscador (Czygan et al., 2021). La iniciativa iCite, que ha desarrollado una colección de metadatos de publicaciones en el área de la biomedicina, también ofrece su índice de citas (NIH Open Citation Collection, o NIH-OCC) mediante una licencia abierta (Hutchins et al., 2019).

¿Qué pasa cuando comparamos estos índices de citas abiertos con otras fuentes? En 2019 unos compañeros y yo analizamos la cobertura de citas disponible en las fuentes de datos bibliográficas de carácter académico más ampliamente utilizadas (Web of Science, Scopus, y Google Scholar) y las comparamos con otras fuentes de datos creadas más recientemente (Microsoft Academic, Dimensions, y COCI). Para ello utilizamos una muestra inicial de 2,515 documentos altamente citados distribuidos entre todas las áreas temáticas. Para cada uno de estos documentos, se extrajeron las listas de documentos citantes ofrecidas por cada una de las fuentes de datos estudiadas. Los datos utilizados en dicho estudio mostraban a COCI como el índice de menor tamaño de entre las seis fuentes: era capaz de encontrar el 28% de todas las citas posibles (Martín-Martín et al., 2021). En comparación, Web of Science encontraba el 52% de todas las citas, Scopus, el 57%, y Google Scholar el 88%.

Hay varias razones que explican los bajos resultados de COCI en comparación con las otras fuentes:

· Cuando se extrajeron los datos, algunas de las editoriales comerciales de mayor tamaño como Elsevier, IEEE, y ACS, a pesar de depositar rutinariamente en Crossref las listas de referencias citadas de los documentos que publican, todavía no habían dado el visto bueno a que se compartieran públicamente.

· Muchas editoriales todavía no depositan listas de referencias citadas en Crossref, o bien han empezado a hacerlo, pero no han añadido retrospectivamente las listas de referencias de documentos publicados en el pasado.

· COCI solo es capaz de detectar relaciones de citación cuando tanto el documento citante como el citado poseen un DOI de Crossref y ambos son conocidos.

· Finalmente, aunque para nuestro estudio se extrajeron los datos de todas las fuentes durante los meses de mayo y junio de 2019, en ese momento la última actualización de COCI se había publicado en noviembre de 2018, aspecto que incrementó la desventaja de COCI sobre otras fuentes con ritmos de actualización más rápidos.

Teniendo en cuenta que Elsevier es la editorial académica que publica un mayor volumen de documentos a nivel mundial, su reciente decisión de abrir sus referencias en Crossref ha resultado en un incremento significativo del total de referencias disponibles públicamente esta plataforma. La actualización de COCI publicada el 3 de septiembre de 2021 (basada en las referencias abiertas de Crossref disponibles hasta agosto de 2021) ya contiene las referencias procesadas de Elsevier, así como las referencias de los documentos publicados más recientemente por ACS (las referencias disponibles en documentos publicados anteriormente aparecerán en versiones posteriores de COCI).

¿Cómo ha cambiado el panorama a raíz de estos cambios? Para averiguarlo, actualicé nuestro análisis de 2019 utilizando la versión de COCI del 3 de septiembre de 2021, así como el índice de citas de NIH-OCC publicado en el mismo mes. En esta última fuente solo se utilizaron aquellas citas en las que tanto el documento citante como el citado tenían DOI, aunque esta fuente también es capaz de identificar citas entre documentos sin DOIs conocidos, pero con identificadores Pubmed. A fin de realizar una comparación razonablemente justa entre estos datos publicados en 2021 y los extraídos de otras fuentes en 2019, de los conjuntos de datos abiertos solo se utilizaron las citas en las que el documento citante estuviera publicado antes de julio de 2019. La intención por tanto era conocer cómo ha crecido la cobertura de citas en fuentes abiertas desde 2019 como resultado de las decisiones de las editoriales de compartir abiertamente las listas de referencias que depositan en Crossref, o como resultado de iniciativas similares.

La combinación de las citas disponibles en COCI y en NIH-OCC en sus versiones de septiembre de 2021 arrojó una cifra de 1,62 millones de citas a nuestra muestra de documentos, un incremento del 91% comparado con los 0,85 millones de citas que estaban disponibles en COCI en 2019 (la primera versión de NIH-OCC no fue publicada hasta finales de 2019 y por tanto no pudo ser analizada en el estudio anterior). En este análisis se ha decidido combinar las colecciones de COCI y NIH-OCC porque a diferencia de lo que es habitual cuando se trabaja con fuentes cerradas, la disponibilidad de fuentes de datos con licencias abiertas elimina en gran medida las barreras, tanto técnicas como legales, para trabajar y desarrollar herramientas que reutilicen datos de varias fuentes a la vez.

Si consideramos todas las citas disponibles en cualquiera de las fuentes analizadas, el 53% de todas las citas están disponibles públicamente en COCI + NIH-OCC bajo una licencia CC0 (Figura 2), un porcentaje significativamente mayor que el 28% encontrado en 2019 en COCI. Este valor supera ligeramente el 52% encontrado por Web of Science, y está mucho más cercano al 54% encontrado por Dimensions o el 57% encontrado por Scopus. El solapamiento relativo entre COCI y las otras fuentes de datos también ha crecido considerablemente: en 2019 COCI encontraba el 47% de las citas disponibles en Web of Science, mientras que la combinación de COCI y NIH-OCC ahora encuentra el 87%. En el caso de Scopus, en 2019 las fuentes de citas abiertas solo encontraban el 44% de las citas en la plataforma de Elsevier, y ahora este valor se ha incrementado hasta el 81%. El número de citas identificadas por COCI y no por otras fuentes también se ha incrementado ligeramente.

Fig. 2. Porcentaje de citas disponibles en cada fuente de datos, comparado con todas las citas (primera fila de resultados), y comparado con las citas disponibles en cada una de las demás fuentes (siguientes filas). Producción propia.

¿De dónde vienen las nuevas citas abiertas? Como era de esperar, las citas provenientes de documentos publicados por Elsevier conforman la mayoría (cerca de la mitad) de las citas disponibles en fuentes abiertas en 2021 que no estaban ya disponibles en 2019 (Figura 3). También hay 250.000 citas nuevas provenientes de documentos publicados por editoriales que no forman parte del top 5 con mayor volumen de publicación, lo que indica que los esfuerzos de I4OC no se han centrado solamente en los grandes actores del mercado editorial, sino que también se han dirigido y han tenido éxito entre editoriales de menor tamaño.

Fig 3. Incremento en el número de citas disponibles en índices de citas abiertos (COCI + NIH-OCC) entre 2019 y 2021. Producción propia.

Pudiera parecer extraño que también se puedan encontrar un alto número de citas provenientes de documentos publicados por IEEE, a pesar de que esta editorial no comparte sus referencias públicamente en Crossref. La razón de esto es que en el pasado las listas de referencias en documentos publicados por esta editorial tenían asignada la categoría “limited” de Crossref, una opción intermedia (ni abiertas, ni cerradas) que las editoriales pueden elegir. Los metadatos que tienen asignada esta categoría solo están disponibles para miembros de CrossRef Metadata Plus, un servicio de pago que proporciona algunas ventajas adicionales sobre los servicios gratuitos ofrecidos por Crossref. Como miembro de este servicio, OpenCitations pudo obtener las listas de referencias de IEEE mientras estaban disponibles, e incluirlas en COCI. Más adelante, la editorial decidió cerrar completamente sus referencias, lo cual explica que en 2021 no se encontraran en COCI más citas provenientes de documentos publicados por IEEE.

En conclusión, la cobertura de los datos de citas disponibles bajo licencias CC0 desde fuentes abiertas es ahora comparable a la de las fuentes de suscripción como Web of Science y Scopus, lo que las convierte en alternativas viables para desarrollar servicios de información con datos e indicadores auditables y reproducibles.

La disponibilidad de metadatos académicos abiertos (y entre ellos los datos de citas abiertos) que no presentan limitaciones u obstáculos para su reutilización y redistribución tiene un gran potencial para beneficiar a toda la comunidad académica de una forma antes inédita. Gracias a Microsoft Academic, COCI, NIH-OCC, Internet Archive, y otras iniciativas, y a pesar de algunos percances sufridos por el camino, actualmente estamos siendo testigos de cómo las infraestructuras de metadatos abiertas están posibilitando el desarrollo de un ecosistema de nuevas herramientas de información científica que los modelos utilizados por los proveedores comerciales tradicionales no permitían.

Sin embargo, a pesar de que algunas de las iniciativas abiertas han recibido importantes subvenciones para seguir desarrollándose durante los próximos años, su continuidad a largo plazo no está asegurada por el momento. Esto supone un riesgo a la hora de desarrollar herramientas basadas en estas fuentes, tal y como nos ha enseñado el caso de Microsoft Academic. Ahora es por tanto el momento de trabajar juntos para desarrollar infraestructuras de metadatos de investigación abiertas, pero también sostenibles (Hendricks et al., 2021).

Las bibliotecas académicas podrían convertirse en importantes aliadas de las organizaciones que desarrollan infraestructuras abiertas, no solo mediante su apoyo económico sino también a través de colaboraciones. En España existe un claro antecedente: muchas bibliotecas de universidades públicas colaboran con servicios de información científica consolidados y de gran utilidad en el ámbito hispanohablante, como Dialnet. Este servicio ofrece una plataforma accesible de forma gratuita pero no distribuye sus metadatos bajo licencias abiertas (aunque una parte de sus registros están disponibles por OAI-PMH). Una posible vía de actuación por tanto sería buscar modelos en los que el fruto del trabajo colaborativo realizado por instituciones públicas para alimentar servicios de información científica quede disponible de manera que pueda ser reutilizado libremente por la comunidad académica al completo.

Referencias bibliográficas

Bilder, G., Lin, J., & Neylon, C. (2020). The Principles of Open Scholarly Infrastructure. https://doi.org/10.24343/C34W2H

Czygan, M., Holzmann, H., & Newbold, B. (2021). Refcat: The Internet Archive Scholar Citation Graph. arXiv:2110.06595 [cs]. http://arxiv.org/abs/2110.06595

Heibi, I., Peroni, S., & Shotton, D. (2019). Software review: COCI, the OpenCitations Index of Crossref open DOI-to-DOI citations. Scientometrics. https://doi.org/10.1007/s11192-019-03217-6

Hendricks, G., Kramer, B., Maccallum, C. J., Manghi, P., Neylon, C., Peroni, S., Shotton, D., Tay, A., & Waltman, L. (2021, octubre 27). Now is the time to work together toward open infrastructures for scholarly metadata. Impact of Social Sciences Blog. https://blogs.lse.ac.uk/impactofsocialsciences/2021/10/27/now-is-the-time-to-work-together-toward-open-infrastructures-for-scholarly-metadata/

Hutchins, B. I., Baker, K. L., Davis, M. T., Diwersy, M. A., Haque, E., Harriman, R. M., Hoppe, T. A., Leicht, S. A., Meyer, P., & Santangelo, G. M. (2019). The NIH Open Citation Collection: A public access, broad coverage resource. PLOS Biology, 17(10), e3000385. https://doi.org/10.1371/journal.pbio.3000385

Martín-Martín, A., Thelwall, M., Orduna-Malea, E., & Delgado López-Cózar, E. (2021). Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: A multidisciplinary comparison of coverage via citations. Scientometrics, 126(1), 871-906. https://doi.org/10.1007/s11192-020-03690-4

Peroni, S., & Shotton, D. (2020). OpenCitations, an infrastructure organization for open scholarship. Quantitative Science Studies, 1(1), 428-444. https://doi.org/10.1162/qss_a_00023

Tay, A., Martín-Martín, A., & Hug, S. E. (2021, mayo 27). Goodbye, Microsoft Academic – hello, open research infrastructure? Impact of Social Sciences Blog. https://blogs.lse.ac.uk/impactofsocialsciences/2021/05/27/goodbye-microsoft-academic-hello-open-research-infrastructure/

[1] Este texto es una versión ampliada y en castellano de un post publicado en el blog de OpenCitations durante la semana del Acceso Abierto de 2021. Agradezco a David Shotton y Silvio Peroni (directores de OpenCitations) sus comentarios sobre la versión original del texto, muchos de los cuales tienen su reflejo también en esta versión.

Alberto Martín-Martín

Postdoctoral Researcher

Facultad de Comunicación y Documentación, Universidad de Granada

Personal site: http://www.albertomartin.es

Twitter: @albertomartin @GScholarDigest

lunes, 15 de noviembre de 2021

Hoy la recomendación de la UNESCO sobre ciencia abierta ha sido adoptada por unanimidad en su totalidad por los Estados Miembros

Publicado en UNESCO
https://council.science/current/news/unesco-science-commission-adopts-open-science-recommendation/

Hoy la recomendación de la UNESCO sobre ciencia abierta ha sido adoptada por unanimidad en su totalidad por los Estados Miembros.

El camino hacia la adopción de la Recomendación sobre la Ciencia Abierta comenzó con una resolución de la 40ª reunión de la Conferencia General de la UNESCO en 2019, en la que 193 Estados miembros encargaron a la UNESCO la elaboración de un instrumento normativo internacional. Ese instrumento, la Recomendación de la UNESCO sobre la Ciencia Abierta, ha sido adoptado ahora por los Estados miembros en su 41ª Conferencia General. En este contexto, el Consejo Internacional de la Ciencia, en su papel de convocante como voz mundial de la ciencia, ha reafirmado que la defensa y el avance de la ciencia abierta es fundamental para la labor de lograr la visión del Consejo de la ciencia como un bien público mundial. Este camino hacia la adopción de la Recomendación sobre la Ciencia Abierta ha incluido una encuesta entre los miembros del ISC que contribuyeron a un documento de debate del ISC sobre la Ciencia Abierta para el Siglo XXI, convocando a los miembros del ISC a la reunión del Comité Especial de la UNESCO sobre la Ciencia Abierta, en mayo de 2021, que dio lugar a una declaración pública, contribuyendo más ampliamente al debate con el recién publicado documento de posición sobre la Ciencia como Bien Público Mundial, y respaldado por una resolución sobre la Ciencia Abierta y la reforma de la publicación aprobada en la reciente asamblea trienal del ISC. Geoffrey Boulton, miembro del Consejo de Administración del ISC, intervino en nombre del ISC y advirtió a la conferencia que:

Los principios fundamentales de la Ciencia Abierta están cerca del punto de crisis. Un sistema de publicación de la ciencia cada vez más disfuncional socava el escrutinio que es vital para el mantenimiento del rigor científico, inhibiendo el acceso al registro de la ciencia de manera que socava la inclusión global que a su vez corre el riesgo de perder la confianza del público.

Geoffrey Boulton, miembro del Consejo de Administración del ISC

Megha Sud, responsable de ciencia del ISC y líder del proyecto de Open Science , dijo:

Aunque en la sala se respiraba una sensación de optimismo por haber alcanzado este hito, también se percibe que el verdadero trabajo comienza ahora. La aplicación de la Recomendación tendrá que llevarse a cabo con la comunidad científica en el centro, y con un ojo atento a los potenciales que hay que aprovechar y a los escollos que hay que evitar a medida que el sistema científico evoluciona en respuesta a estos esfuerzos.

Megha Sud, Oficial Científico del ISC

Lea la intervención completa de Geoffrey Boulton

Hablo en nombre del Consejo Internacional de la Ciencia, que, de una forma u otra, ha sido la voz mundial de la ciencia durante más de 100 años. Sus miembros son las academias nacionales de ciencias de sus países y los organismos internacionales que representan a las sociedades científicas de sus países. Como comunidad internacional de científicos en activo, acoge con entusiasmo las recomendaciones de la UNESCO.

En ellas se establece lo que hay que hacer para lograr la Ciencia Abierta. La forma de conseguirlo no sólo dependerá de la colaboración internacional, sino también de la colaboración entre tres actores clave de los sistemas científicos nacionales

- los gobiernos, que articulan las prioridades generales y establecen los presupuestos científicos

- sus consejos de financiación, que asignan los recursos

- y los investigadores y sus instituciones que hacen la ciencia.

Este ha demostrado ser un sistema flexible y creativo a la hora de maximizar el rendimiento de la inversión de la sociedad en investigación. Tiene dos grandes puntos fuertes. Responde a las prioridades nacionales inmediatas; y amplía los límites del conocimiento como una inversión crucial en un futuro desconocido; como hemos visto durante la experiencia de COVID. Estos sistemas flexibles, creativos, colaborativos y probados están bien situados para promover el contrato social evolucionado que implica la ciencia abierta.

Pero un nuevo marco abierto para la ciencia debe conservar los elementos esenciales que hacen de la ciencia una forma especial de conocimiento fiable, ya que sin ellos la ciencia abierta no tiene valor. Son:

1. que las afirmaciones de la verdad publicadas deben ir acompañadas abiertamente de los datos en los que se basan, para ser contrastadas con la realidad y la lógica por el escrutinio de los pares;

2. y deben ser accesibles a todos los que deseen utilizarlas, ya sea como lectores o como autores.

Pero debemos ser realistas. Estos fundamentos absolutos están ahora cerca de la crisis. Un sistema de publicación científica cada vez más disfuncional socava el escrutinio que es vital para el mantenimiento del rigor científico, inhibe el acceso al registro de la ciencia de manera que socava la inclusión global, corre el riesgo de perder la confianza del público, no ha estado a la altura de los desafíos y las oportunidades de la revolución digital, y algunas editoriales importantes están evolucionando hacia empresas tecnológicas monopolísticas con el potencial de privatizar el acceso al conocimiento. Estas cuestiones son cruciales para la ciencia abierta e inclusiva que el mundo necesita.

En la reciente Asamblea General del Consejo Internacional de la Ciencia, sus miembros resolvieron por abrumadora mayoría buscar una reforma, en la que la gobernanza de estas cuestiones sea responsable ante la comunidad científica. Aplaudimos los esfuerzos de la UNESCO y de sus gobiernos miembros en la promoción de la ciencia abierta, pero buscamos su compromiso más profundo para asegurar que los cimientos sobre los que debe asentarse la ciencia abierta sean robustos, resistentes y capaces de apoyar a la ciencia abierta en los retos actuales del siglo XXI.

*****************************