Descarga. Manual de edición científica por KSJ
Knight Science Journalism Program at MIT, 2020. Manual de edición científica por KSJ. Cambridge, Mass.: Instituto Tecnológico de Massachusetts. https://ksjhandbook.org.
Noticias sobre publicación, comunicación, evaluación y política científica y tecnológica
Descarga. Manual de edición científica por KSJ
Knight Science Journalism Program at MIT, 2020. Manual de edición científica por KSJ. Cambridge, Mass.: Instituto Tecnológico de Massachusetts. https://ksjhandbook.org.
Publicado en blog Universo abierto
https://universoabierto.org/2021/11/22/comunicar-la-ciencia-una-perspectiva-global/
Broks, Peter, et al., editores. Communicating Science: A Global Perspective. ANU Press, 2020
La comunicación científica moderna ha surgido en el siglo XX como un campo de estudio, un cuerpo de práctica y una profesión, y es una práctica con profundas raíces históricas. Hemos asistido al nacimiento de los centros científicos interactivos, a las primeras acciones universitarias en la enseñanza y la realización de investigaciones, y a un fuerte crecimiento del empleo de comunicadores científicos. Esta colección traza el surgimiento de la comunicación científica moderna en todo el mundo. Se trata del primer volumen que traza un mapa de las inversiones realizadas en todo el mundo en centros científicos, cursos universitarios e investigación, publicaciones y conferencias, además de contar las historias nacionales de la comunicación científica. ¿Cómo empezó todo? ¿Cómo ha variado el desarrollo de un país a otro? ¿Qué motivó a los gobiernos, las instituciones y las personas a considerar la comunicación de la ciencia como una respuesta a las preguntas sobre el lugar social de la ciencia? Communicating Science describe los caminos seguidos por 39 países diferentes. Están representados todos los continentes y muchas culturas. Para algunos países, es la primera vez que se cuenta su historia de comunicación científica.
Publicado en Universo abierto
https://universoabierto.org/2021/11/19/estimacion-del-coste-del-tiempo-que-los-investigadores-dedican-a-la-revision-por-pares-una-donacion-de-mil-millones-de-dolares/
Aczel, B., Szaszi, B. & Holcombe, A.O. A billion-dollar donation: estimating the cost of researchers’ time spent on peer review. Res Integr Peer Rev 6, 14 (2021). https://doi.org/10.1186/s41073-021-00118-2
La cantidad y el valor del trabajo de revisión por pares de los investigadores es fundamental para el mundo académico y la publicación de revistas. Sin embargo, este trabajo está poco reconocido, se desconoce su magnitud y rara vez se consideran formas alternativas de organizar el trabajo de revisión por pares. Utilizando datos disponibles públicamente, se proporciona una estimación del tiempo de los investigadores y la contribución basada en el salario al sistema de revisión por pares de las revistas.
Se encontró que el tiempo total que los revisores trabajaron globalmente en revisiones por pares fue de más de 100 millones de horas en 2020, equivalente a más de 15 mil años. El valor monetario estimado del tiempo que los revisores de Estados Unidos dedicaron a las revisiones fue de más de 1.500 millones de dólares en 2020. Para los revisores de China, la estimación es de más de 600 millones de dólares estadounidenses, y para los del Reino Unido, cerca de 400 millones de dólares estadounidenses.
Conclusiones: Por su diseño, es muy probable que nuestros resultados estén subestimados, ya que sólo reflejan una parte del número total de revistas en todo el mundo. Las cifras ponen de manifiesto la enorme cantidad de trabajo y tiempo que los investigadores aportan al sistema de publicación, así como la importancia de considerar formas alternativas de estructurar y pagar la revisión por pares. Se fomenta este proceso discutiendo algunos modelos alternativos que pretenden potenciar los beneficios de la revisión por pares, mejorando así su relación coste-beneficio.
Publicado en blog Universo abierto
https://universoabierto.org/2021/10/25/mejores-practicas-en-los-metadatos-de-las-revistas/
Better Practices in Journal Metadata. Coalition Publica, 2021
Better Practices in Journal Metadata
Metadata Feedback for Coalition Publica
Los metadatos son un aspecto esencial de la publicación académica. Garantizan la identificación precisa del contenido de una revista y pueden mejorar la capacidad de descubrimiento, el acceso, la difusión, la preservación y, posiblemente, el impacto de la investigación.
Dado el importante papel de los metadatos en la publicación académica digital, Coalition Publica se complace en anunciar la publicación de dos importantes informes elaborados por su Grupo de Trabajo sobre Metadatos.
El Grupo de Trabajo de Metadatos fue convocado a principios de 2019 con un mandato de dos años para:
Publicado en The Conversation
https://theconversation.com/como-publicar-ciencia-todo-el-mundo-paga-menos-las-editoriales-171271
Cuántas veces hemos leído una noticia comenzar por: “Según un estudio”. Se utiliza esta fórmula para dar credibilidad, pero ¿son todas las publicaciones científicas veraces?
En un siglo hemos multiplicado por cien el número de publicaciones. Actualmente se publican más de 6 millones de artículos científicos al año y en cada una de las últimas dos décadas hemos duplicado la productividad (Figura 1). Aunque eso podría parecer un síntoma de que la ciencia avanza a un ritmo vertiginoso, también esconde peligros.
Si el proceso terminara aquí, nadie conocería los hallazgos obtenidos y el progreso se ralentizaría, puesto que estaríamos reinventando la rueda continuamente. Para evitarlo debemos comunicar nuestros resultados para que lleguen a otros científicos. Isaac Newton lo resumió diciendo que “había podido ver más allá gracias a que se había aupado a hombros de gigantes”. Esto significa que los descubrimientos, por importantes que sean, se basan en conocimientos previos.
La comunicación entre científicos ha sido clave para el desarrollo de la ciencia. Es famosa la correspondencia entre Darwin, en Inglaterra, y Wallace, en Malasia, acerca de la variación y distribución de las especies. Ésta contribuyó significativamente a la comprensión y desarrollo de la teoría de la evolución. En aquellos tiempos cada carta tardaba un par de meses en llegar a su destinatario, por lo que para acelerar este proceso, y sobre todo para ampliar el número de receptores, las Sociedades Científicas crearon las primeras revistas académicas.
¿Cuál es el proceso que sigue una publicación científica?Los descubrimientos científicos hay que describirlos para que los demás los entiendan, puedan ser reproducidos y, así, se validen. Cuando disponemos del manuscrito, se envía a una revista científica. El equipo editorial decidirá si el trabajo es interesante y se ajusta a la política editorial y área de conocimiento de la revista. Si no cumple alguno de estos requisitos el editor lo devuelve con algunos comentarios y generalmente los autores lo envían a otra revista.
Si el editor decide que el trabajo es interesante y se ajusta al ámbito de la revista, lo reenvía a los revisores, que son otros científicos no vinculados ni con el trabajo ni con sus autores. Estos realizan una revisión concienzuda y emiten un informe detallado con comentarios y recomendaciones al editor. Este sistema permite, en algunos casos, una mejora significativa de los artículos.
Si tras este proceso, que puede incluir varias rondas de experimentos y discusiones entre autores y revisores, el trabajo es aceptado finalmente por el editor, se procede a su publicación.
Un detalle importante es que los costes derivados de la producción, maquetación e impresión de las publicaciones corren a cargo de los autores. Contrariamente a lo que la gente cree, los autores no cobramos por publicar, sino que pagamos por ello.
Entonces, ¿por qué queremos publicar?
Porque además de impulsar el engranaje del conocimiento, en la actualidad el mundo de la ciencia pivota sobre las publicaciones científicas. La obtención de fondos se basa en gran medida en las publicaciones de los investigadores, así como sus promociones profesionales y se convierte en un ciclo en el que, si publicas, obtienes financiación que usas para realizar experimentos que te permitan publicar y obtener más financiación y mejores puestos de trabajo, y así sucesivamente.
El famoso “publica o perece” que se ha convertido en un mantra en el mundo académico.
Revistas científicas: un negocio milmillonarioEn los años 90, con la aparición de internet, este sistema basado en las revistas publicadas en papel fue cuestionado. De hecho, se llegó incluso a plantear su supervivencia. Si bien, no ha sido este el caso: las ganancias obtenidas por las editoriales científicas no han hecho más que crecer. En la actualidad esta industria tiene un volumen de negocio de más de 25 000 millones de dólares anuales con un margen de beneficio cercano al 40 % (Figura 2).
De hecho, un estudio reciente ha estimado que las horas que dedican los revisores a hacer este trabajo gratuito en 2020 representaron 1 500 millones de dólares solo en Estados Unidos.
Por si esto fuera poco, las editoriales cobran a las universidades y centros de investigación para que sus investigadores tengan acceso a las publicaciones en un formato de suscripciones cuyos precios no son públicos. Como si en nuestro ejemplo no supiéramos lo que paga otro cliente del mismo supermercado por un kilogramo de naranjas.
Todo ello con el agravante que este sistema puede tener en los países más desfavorecidos en los que sus instituciones no pueden afrontar facturas en muchos casos millonarias.
Ciencia abiertaEn las últimas décadas ha aparecido el movimiento de acceso abierto (open access). Aunque esto es una buena idea puesto que los lectores no pagan por acceder a las publicaciones, no parece ser la solución definitiva (Figura 3), dado que las editoriales cobran a los autores o a sus fuentes de financiación para proporcionar este acceso libre.
El “publica o perece” se ha convertido en un “paga y publica basura”.
En principio, este tipo de publicaciones no deberían representar un peligro porque tienen poca repercusión. De hecho, casi el 60 % nunca se citan. Sí esconden un enorme peligro derivado de la disminución drástica del rigor científico y abonan el terreno a la pseudociencia, la aparición de bulos, falsas noticias, pseudoterapias y demás problemas relacionados que, en situaciones como la pandemia, hemos visto que pueden ser extremadamente peligrosas.
Editor invitado
Una última tendencia que ha surgido en el mundo de las publicaciones científicas son los números “especiales”. Las editoriales han descubierto la estrategia de invitar a científicos de prestigio a ser editores de números especiales de sus revistas. Estos se encargan de reclutar, generalmente entre sus colegas, un número suficiente de artículos que completen estas ediciones, por supuesto pagando por dicha publicación.
Esta práctica ha crecido exponencialmente en los últimos años y, a menudo, los científicos aceptamos estas invitaciones por respeto al editor invitado.
De alguna forma debemos entre todos intentar revertir estas tendencias, bien mediante repositorios de trabajos prepublicados (pre-prints) como arXiv, bioRxiv, medRxiv y similares, o bien buscando nuevas fórmulas de publicación, probablemente más basadas en las sociedades científicas como un bonito guiño a los inicios.
Sobre todo debemos estar alerta y no engordar a la bestia. Si no le ponemos remedio, nos puede llevar del “publica o perece” al “publica y perece”.
Publicado en blog Sauropod Vertebra Picture of the Week
https://svpow.com/
Por qué el precio de las publicaciones académicas es mucho más alto que el coste
18 de octubre de 2021
La última vez examinamos la diferencia entre coste (Last time, we looked at the difference between cost, value and price), valor y precio, y aplicamos esos conceptos a mercados sencillos, como el de las sillas, y al complejo mercado de la publicación académica. Terminamos con la observación de que el precio que nuestra comunidad paga por la publicación de un artículo (unos 3.333 dólares de media) es entre 3 y 7 veces superior a lo que cuesta publicarlo (entre $500-$1000).
¿Cómo es posible? Una parte de la respuesta es que el valor de un artículo publicado para la comunidad es aún mayor: si no fuera así, nadie pagaría. Pero esa no puede ser la única razón.
En un mercado eficiente, los proveedores de un bien que compiten entre sí tratarán de rebajar sus precios hasta que los que cobran se acerquen al coste. Si, por ejemplo, Elsevier y Springer-Nature compitieran en un mercado libre y saludable, cada una de ellas cobraría un tercio de lo que cobra ahora, por miedo a ser superada por su competidor de menor precio. (La mitad de esos recortes de precios se absorberían simplemente disminuyendo los enormes márgenes de beneficio (the huge profit margins); el resto tendría que provenir de la racionalización de los procesos empresariales, en particular de cosas como los costes de mantenimiento de los muros de pago (costs of maintaining paywalls) y los medios para atravesarlos).
Entonces, ¿por qué la Mano Invisible (the Invisible Hand) no actúa sobre las editoriales académicas? Porque no compiten realmente. Las suscripciones no son bienes sustituibles porque cada artículo publicado es único. Si necesito leer un artículo de una revista de Elsevier, no sirve de nada que compre una suscripción a Springer-Nature de menor precio: no me dará acceso al artículo que necesito.
(Ésta es una de las razones por las que el modelo basado en el APC -a pesar de sus verdaderos inconvenientes- es mejor que el modelo de suscripción: porque los servicios editoriales y de publicación ofrecidos por Elsevier y Springer-Nature son sustituibles. Si uno de ellos ofrece el servicio por 3.000 dólares y el otro por 2.000 dólares, puedo acudir al proveedor de mayor valor. Y si alguna otra editorial lo ofrece por 1.000 o 500 dólares, puedo acudir a ella).
En los últimos años se han producido grandes y bienvenidos avances hacia el establecimiento del acceso abierto como modo dominante de publicación de trabajos académicos, y en la actualidad la producción se divide más o menos al 50% entre el acceso de pago y el abierto. Podemos esperar que el acceso abierto domine cada vez más en los próximos años. En muchos aspectos, la batalla por el AA está ganada: aún no hemos llegado al Día de la Victoria, pero el Desembarco del Día D ya está hecho.
Sin embargo, los APCs de los grandes editores todavía se sitúan en el rango de 3000 a 5000 dólares en lugar de converger en 500 a 1000 dólares. ¿Por qué?
Björn Brembs lleva años escribiendo (Björn Brembs has been writing for years) sobre el hecho de que cada mercado tiene un segmento de lujo (every market has a luxury segment): se puede comprar un reloj de pulsera perfectamente funcional por 10 dólares, pero la gente se gasta miles en relojes de alta gama. Hace tiempo que le preocupa que si las publicaciones académicas se convierten en APC, la gente hará cola para pagar los 9.500 euros de APC por Nature, en lo que se convertiría en un trato directo de pago por prestigio (queuing up to pay the €9,500 APC for Nature in what would become a straightforward pay-for-prestige deal). Y tiene razón: dada la forma extraordinariamente estúpida en que evaluamos a los investigadores para los puestos de trabajo, la promoción y la titularidad, mucha gente pagará un recargo de 10 veces por el distintivo "he sido publicado en Nature", aunque los artículos de Nature sean una forma objetivamente mala de comunicar la investigación.
Pero da la sensación de que aquí está ocurriendo algo más extraño. Es casi como si todo el maldito mercado fuera un segmento de lujo. El promedio de APC financiado por el Wellcome Trust en 2018/19 (unded by the Wellcome Trust in 2018/19) fue de 2.410 libras esterlinas, actualmente unos 3.300 dólares. Lo que es casi exactamente el coste medio de los artículos de 3.333 dólares que hemos calculado antes. Lo que sucede es que los grandes editores han aterrizado en los APC a tasas que preservan el nivel de ingresos anterior. Eso es comprensible por su parte, pero lo que quiero saber es ¿por qué seguimos pagándoles? ¿Por qué todos los becarios de Wellcome no se alejan de Elsevier y Springer-Nature y publican en alternativas mucho más baratas?
En otras palabras, ¿por qué no actúan las fuerzas del mercado?
Se me ocurren tres razones por las que los investigadores prefieren gastar 3.000 dólares en lugar de 1.000:
Podría ser que realmente obtuvieran un servicio tres veces mejor de las grandes editoriales. Menciono esto por puro interés, ya que no hay pruebas que respalden la hipótesis. No parece haber ninguna correlación entre el precio y la calidad del servicio.
Los investigadores se dejan llevar por la inercia y siguen enviando sus trabajos a las revistas que solían enviar en los viejos tiempos de las suscripciones. No estoy del todo exento de simpatía por esto: hay comodidad en la familiaridad, y conveniencia en conocer el sabor de una revista, las expectativas y el consejo editorial. Pero, ¿merecen estas cosas un aumento del 200%?
Los investigadores compran prestigio, o al menos lo que perciben como tal. (En realidad, no estoy convencido de que los artículos de las revistas no excepcionales de Elsevier o Springer-Nature se consideren más prestigiosos que los de las revistas más baratas pero mejor nacidas de Acceso Abierto. Pero para que esto ocurra, sólo hace falta que la gente piense que las revistas antiguas son más prestigiosas, no hace falta que tengan razón).
Pero detrás de todas estas razones para acudir a una editorial más cara hay una muy importante para no molestarse en acudir a una editorial más barata: los investigadores están gastando el dinero de otras personas. No es de extrañar que no les importen los miles de libras adicionales.
¿Cómo pueden los financiadores arreglar esto y conseguir que los APCs bajen a niveles que se aproximen al coste de publicación? Veo al menos tres posibilidades.
En primer lugar, podrían dejar de pagar los APC a sus beneficiarios. En su lugar, podrían añadir una cantidad fija a todas las subvenciones que conceden -1.500 dólares, por ejemplo- y dejar a los investigadores la decisión de gastar más en una editorial heredada (complementando los 1.500 dólares con otras fuentes propias) o gastar menos en una editorial más barata y redistribuir el exceso en otro lugar.
En segundo lugar, los financiadores podrían simplemente publicar los artículos ellos mismos. Para ser justos, varios grandes financiadores están haciendo esto ahora, así que tenemos Wellcome Open Research, Gates Open Research, etc. Pero, ¿no parece un poco absurdo separar la investigación según el organismo que haya concedido la subvención que la haya financiado? ¿Y qué pasa con los autores que no tienen una subvención de uno de estos organismos, o incluso ninguna subvención?
Por eso creo que la tercera solución es la mejor. Me gustaría que los financiadores dejaran de pagar los APC y de crear sus propias soluciones de publicación, y que en su lugar colaboraran en la creación y el mantenimiento de una solución de publicación global que todos los investigadores pudieran utilizar con independencia de su condición de beneficiarios de subvenciones. Tengo mucho que decir sobre cómo debería ser esa solución, pero eso es para otra ocasión.
Publicado por Mike Taylor
Last time, we looked at the difference between cost, value and price, and applied those concepts to simple markets like the one for chairs, and the complex market that is scholarly publication. We finished with the observation that the price our community pays for the publication of a paper (about $3,333 on average) is about 3–7 times as much as its costs to publish ($500-$1000)?
How is this possible? One part of the answer is that the value of a published paper to the commnity is higher still: were it not so, no-one would be paying. But that can’t be the whole reason.
In an efficient market, competing providers of a good will each try to undercut each other until the prices they charge approach the cost. If, for example, Elsevier and Springer-Nature were competing in a healthy free market, they would each be charging prices around one third of what they are charging now, for fear of being outcompeted by their lower-priced competitor. (Half of those price-cuts would be absorbed just by decreasing the huge profit margins; the rest would have to come from streamlining business processes, in particular things like the costs of maintaining paywalls and the means of passing through them.)
So why doesn’t the Invisible Hand operate on scholarly publishers? Because they are not really in competition. Subscriptions are not substitutable goods because each published article is unique. If I need to read an article in an Elsevier journal then it’s no good my buying a lower-priced Springer-Nature subscription instead: it won’t give me access to the article I need.
(This is one of the reasons why the APC-based model — despite its very real drawbacks — is better than the subscription model: because the editorial-and-publication services offered by Elsevier and Springer-Nature are substitutable. If one offers the service for $3000 and the other for $2000, I can go to the better-value provider. And if some other publisher offers it for $1000 or $500, I can go there instead.)
The last few years have seen huge and welcome strides towards establishing open access as the dominant mode of publication for scholarly works, and currently output is split more or less 50/50 between paywalled and open. We can expect OA to dominate increasingly in future years. In many respects, the battle for OA is won: we’ve not got to VE Day yet, but the D-Day Landings have been accomplished.
Yet big-publisher APCs still sit in the $3000–$5000 range instead of converging on $500-$1000. Why?
Björn Brembs has been writing for years about the fact that every market has a luxury segment: you can buy a perfectly functional wristwatch for $10, yet people spend thousands on high-end watches. He’s long been concerned that if scholarly publishing goes APC-only, then people will be queuing up to pay the €9,500 APC for Nature in what would become a straightforward pay-for-prestige deal. And he’s right: given the outstandingly stupid way we evaluate reseachers for jobs, promotion and tenure, lots of people will pay a 10x markup for the “I was published in Nature” badge even though Nature papers are an objectively bad way to communicate research.
But it feels like something stranger is happening here. It’s almost as though the whole darned market is a luxury segment. The average APC funded by the Wellcome Trust in 2018/19 was £2,410 — currently about $3,300. Which is almost exactly the average article cost of $3,333 that we calculated earlier. What’s happening is that the big publishers have landed on APCs at rates that preserve the previous level of income. That is understandable on their part, but what I want to know is why are we still paying them? Why are all Wellcome’s grantees not walking away from Elsevier and Springer-Nature, and publishing in much cheaper alternatives?
Why, in other words, are market forces not operating here?
I can think of three reasons why researchers prefer to spend $3000 instead of $1000:
It could be that they are genuinely getting a three-times-better service from the big publishers. I mention this purely for completeness, as no evidence supports the hypothesis. There seems to be absolutely no correlation between price and quality of service.
Researchers are coasting on sheer inertia, continuing to submit to the journals they used to submit to back in the bad old days of subscriptions. I am not entirely without sympathy for this: there is comfort in familiarity, and convenience in knowing a journal’s flavour, expectations and editorial board. But are those things worth a 200% markup?
Researchers are buying prestige — or at least what they perceive as prestige. (In reality, I am not convinced that papers in non-exceptional Elsevier or Springer-Nature journals are at all thought of as more prestigous than those in cheaper but better born-OA journals. But for this to happen, it only needs people to think the old journals are more prestigious, it doesn’t need them to be right.)
But underlying all these reasons to go to a more expensive publishers is one very important reason not to bother going to a cheaper publisher: researchers are spending other people’s money. No wonder they don’t care about the extra few thousand pounds.
How can funders fix this, and get APCs down to levels that approximate publishing cost? I see at least three possibilities.
First, they could stop paying APCs for their grantees. Instead, they could add a fixed sum onto all grants they make — $1,500, say — and leave it up to the researchers whether to spend more on a legacy publisher (supplementing the $1,500 from other sources of their own) or to spend less on a cheaper born-OA publisher and redistribute the excess elsewhere.
Second, funders could simply publish the papes themselves. To be fair several big funders are doing this now, so we have Wellcome Open Research, Gates Open Research, etc. But doesn’t it seem a bit silly to silo research according to what body awarded the grant that funded it? And what about authors who don’t have a grant from one of these bodies, or indeed any grant at all?
That’s why I think the third solution is best. I would like to see funders stop paying APCs and stop building their own publishing solutions, and instead collaborate to build and maintain a global publishing solution that all researchers could use irrespective of grant-recipient status. I have much to say on what such a solution should look like, but that is for another time.
Posted by Mike Taylor
La cobertura de los índices de citas abiertos se acerca a la de Web of Science y Scopus [1]
Alberto Martín-Martín ( albertomartin@ugr.es; @albertomartin)
Facultad de Comunicación y Documentación, Universidad de Granada, España. Miembro del Grupo ThinkEPI.
Para poder observar y comprender cómo se desarrolla la actividad académica es esencial contar con colecciones exhaustivas de metadatos sobre la misma. Históricamente, el sector comercial ha sido el principal desarrollador y proveedor de servicios de información utilizados para estos propósitos. Concretamente dos proveedores, Clarivate Analytics (y anteriormente Thomson Reuters) con su plataforma Web of Science, y Elsevier con Scopus, han mantenido durante años una posición dominante sobre este tipo de información al no existir otros competidores que ofrecieran servicios similares. Un tercer actor, Google, a pesar de ofrecer su buscador académico Google Scholar, no ha dado muestras de interés en este mercado, centrándose principalmente en el rol de herramienta de descubrimiento.
Los proveedores comerciales de metadatos académicos suelen elegir modelos de negocio que supeditan el acceso a sus plataformas al pago de suscripciones. Además, con el objetivo de salvaguardar la sostenibilidad y rentabilidad económica de sus servicios a lo largo del tiempo, mantienen un control exclusivo sobre sus colecciones de metadatos mediante la aplicación de licencias de uso restrictivas. De esta manera, estos servicios limitan las formas en las que sus clientes pueden acceder, reutilizar, y redistribuir la información disponible en estas plataformas.
En paralelo a esta situación, el constante desarrollo tecnológico ha generado un entorno en el que las barreras de acceso a hardware y software con altas prestaciones se han reducido considerablemente (a pesar de la crisis de abastecimiento de microchips en la que nos encontramos actualmente). Dicho escenario no sólo está contribuyendo a ampliar los horizontes de actuación de empresas y laboratorios consolidados, sino que está reduciendo el coste de entrada a nuevos grupos con ideas innovadoras. En el campo de los servicios de información científica, sin embargo, el crecimiento generalizado de las capacidades de computación disponibles contrasta con las todavía limitadas capacidades de acceso y reutilización de datos que ofrecen las fuentes tradicionales.
En el contexto actual, por tanto, es cada vez más problemático que la sostenibilidad de los sistemas de información científica, un elemento crítico de la infraestructura del sistema científico, requiera mantener una escasez artificial en el acceso y reutilización de los datos que contienen. Por un lado, estos modelos no facilitan que la comunidad académica pueda dotarse de nuevas infraestructuras y herramientas que busquen adaptarse mejor a las necesidades cambiantes. Por otro lado, el veto a la redistribución de metadatos que imponen los proveedores significa que los análisis que se derivan de sus datos no pueden alcanzar los crecientes estándares de auditabilidad y reproducibilidad que se deberían exigir a trabajos científicos realizados en el S. XXI.
Afortunadamente, tras un inevitable periodo en el que mayormente se reproducían en el entorno digital los modelos asentados en el entorno analógico, cada vez más sectores del sistema científico están explorando nuevos modelos y flujos de trabajo que aprovechen en mayor medida las oportunidades que ofrecen las tecnologías disponibles para afrontar los retos actuales. Podríamos considerar esto como una nueva fase del proceso de transformación digital de la ciencia, que como es normal también está afectando a la comunicación científica.
Un episodio reciente que nos ha mostrado tanto las oportunidades como los riesgos que es capaz de generar un modelo de servicio de información más abierto lo tenemos en el caso de Microsoft Academic (Tay et al., 2021). Desde 2016, el buscador académico de Microsoft ha distribuido su extensa colección de metadatos, actualmente con un tamaño superior y prestaciones en ocasiones comparables a la de servicios comerciales, mediante licencias abiertas que otorgan a los usuarios amplios derechos para transformar y redistribuir los metadatos. Así, a pesar de que su interfaz web de búsqueda no ha llegado a calar entre la población académica en general, el proyecto ha tenido una influencia mayúscula en el desarrollo de un nuevo ecosistema de herramientas innovadoras que utilizan sus datos como base (Figura 1). Tristemente, en mayo de 2021 trascendió que Microsoft Academic desaparecería a finales del mismo año, poniendo en peligro la continuidad de los proyectos que dependen de él.
Fig 1. Herramientas que han reutilizado datos de Microsoft Academic Graph. Producción propia, originalmente publicada en Tay et al. (2021)
Este revés trae consigo una importante lección: los elementos que forman parte de la infraestructura del sistema de información científico deben desarrollar y atenerse a una serie de principios de gobernanza, sostenibilidad, y protección que garanticen en la medida de lo posible su funcionamiento continuado. Los Principios de la Infraestructura Académica Abierta (POSI, por sus siglas en inglés) ofrecen un marco sobre el que pueden trabajar las organizaciones que tienen intención de ofrecer este tipo de servicios (Bilder et al., 2020).
Crossref es otro ejemplo de infraestructura de metadatos de investigación abierta, quizás la más crucial que existe actualmente en el entorno de la comunicación científica a nivel mundial. Asimismo, también es una organización pionera en su compromiso con POSI. Además de acuñar muchos de los DOIs que se asignan a las publicaciones científicas para servir como sus identificadores persistentes, Crossref publica metadatos sobre dichas publicaciones (más de 120 millones de registros en su último archivo público). Estos metadatos no tienen asignada ninguna licencia de uso por parte de Crossref, porque la organización considera que este tipo de datos son “hechos”, que según la ley en EE.UU. no pueden ser objeto de copyright. Esta colección de metadatos por tanto puede ser obtenida, reutilizada, y redistribuida sin ningún tipo de limitación.
Gracias a su naturaleza abierta, los metadatos disponibles en Crossref también han estimulado la innovación en servicios de información dirigidos al público académico. Algunos ejemplos:
· Muchas de las herramientas de descubrimiento de literatura académica lanzadas más recientemente, como Dimensions, The Lens, y Scilit aprovechan los metadatos de Crossref para mantener actualizados sus índices con los documentos publicados más recientemente.
· El gestor de referencias bibliográficas de código abierto Zotero es capaz de extraer metadatos de la API pública de Crossref a partir del DOI, lo que proporciona una manera fácil de alimentar colecciones personales de referencias bibliográficas. Este método es además mucho más fiable que utilizar las referencias bibliográficas generadas por Google Scholar.
· La base de datos Unpaywall (también abierta) utiliza metadatos de Crossref (entre otras fuentes) para identificar qué documentos están disponibles en acceso abierto. Estos datos a su vez alimentan el servicio Unsub, una herramienta diseñada para ayudar a las bibliotecas académicas a tomar decisiones informadas sobre las suscripciones de revistas que les conviene mantener y las que no.
Históricamente, la generación de índices de citas y herramientas derivadas de estos datos ha sido uno de los servicios que solo se ofertaban en las plataformas comerciales (como las mencionadas Web of Science y Scopus), o en plataformas de acceso gratuito, pero con grandes restricciones de uso (Google Scholar). En los últimos años, sin embargo, la exclusividad en la oferta de estos datos que hasta hace poco ejercían estas fuentes está menguando. En parte esto es una consecuencia de los cambios en los flujos de trabajo que se están asentando en la publicación académica digital.
Las editoriales que forman parte de Crossref pueden incluir las listas de referencias citadas entre el resto de los metadatos de las publicaciones cuando se están registrando nuevos documentos en la plataforma. Un gran número de editoriales, de hecho, ya lo están haciendo. La política de Crossref es hacer que estas listas de referencias citadas sean públicamente accesibles por defecto, aunque las editoriales pueden elegir mantenerlas ocultas. De lo anterior se desprende que si la mayoría de las editoriales depositaran sus listas de referencias citadas en Crossref y consintieran que éstas se hicieran públicas, sería posible generar un índice de citas exhaustivo que estuviera libre de las restricciones impuestas por las plataformas comerciales.
La Iniciativa en favor de las Citas Abiertas (I4OC por su acrónimo en inglés) es un grupo de presión que ha trabajado desde 2017 para conseguir precisamente este objetivo, y ya ha conseguido convencer a más de dos mil editoriales para que compartan públicamente las listas de referencias citadas que depositan en Crossref. En la primera mitad de 2021, Elsevier, la American Chemical Society, y Wolters Kluwer, se unieron a esta iniciativa, de manera que actualmente prácticamente todas las grandes editoriales académicas ya apoyan I4OC mediante la apertura de sus referencias en Crossref. La única excepción a destacar entre las grandes editoriales es IEEE (Institute of Electrical and Electronics Engineers).
Gracias a los esfuerzos de I4OC y de las editoriales colaboradoras, el 87% de los documentos con referencias citadas en Crossref tiene dichas referencias en abierto. Esto ha permitido que organizaciones como OpenCitations (uno de los miembros fundadores de I4OC) hayan podido generar índices de citas abiertos a partir de dichos datos. Uno de estos índices es COCI, un índice de citas DOI-a-DOI generado exclusivamente con datos de Crossref (Heibi et al., 2019; Peroni & Shotton, 2020). Otras organizaciones también están ofreciendo sus propios índices de citas abiertos: tras lanzar su propio buscador académico, Internet Archive recientemente ha liberado el índice citas (Refcat) en el que se apoya dicho buscador (Czygan et al., 2021). La iniciativa iCite, que ha desarrollado una colección de metadatos de publicaciones en el área de la biomedicina, también ofrece su índice de citas (NIH Open Citation Collection, o NIH-OCC) mediante una licencia abierta (Hutchins et al., 2019).
¿Qué pasa cuando comparamos estos índices de citas abiertos con otras fuentes? En 2019 unos compañeros y yo analizamos la cobertura de citas disponible en las fuentes de datos bibliográficas de carácter académico más ampliamente utilizadas (Web of Science, Scopus, y Google Scholar) y las comparamos con otras fuentes de datos creadas más recientemente (Microsoft Academic, Dimensions, y COCI). Para ello utilizamos una muestra inicial de 2,515 documentos altamente citados distribuidos entre todas las áreas temáticas. Para cada uno de estos documentos, se extrajeron las listas de documentos citantes ofrecidas por cada una de las fuentes de datos estudiadas. Los datos utilizados en dicho estudio mostraban a COCI como el índice de menor tamaño de entre las seis fuentes: era capaz de encontrar el 28% de todas las citas posibles (Martín-Martín et al., 2021). En comparación, Web of Science encontraba el 52% de todas las citas, Scopus, el 57%, y Google Scholar el 88%.
Hay varias razones que explican los bajos resultados de COCI en comparación con las otras fuentes:
· Cuando se extrajeron los datos, algunas de las editoriales comerciales de mayor tamaño como Elsevier, IEEE, y ACS, a pesar de depositar rutinariamente en Crossref las listas de referencias citadas de los documentos que publican, todavía no habían dado el visto bueno a que se compartieran públicamente.
· Muchas editoriales todavía no depositan listas de referencias citadas en Crossref, o bien han empezado a hacerlo, pero no han añadido retrospectivamente las listas de referencias de documentos publicados en el pasado.
· COCI solo es capaz de detectar relaciones de citación cuando tanto el documento citante como el citado poseen un DOI de Crossref y ambos son conocidos.
· Finalmente, aunque para nuestro estudio se extrajeron los datos de todas las fuentes durante los meses de mayo y junio de 2019, en ese momento la última actualización de COCI se había publicado en noviembre de 2018, aspecto que incrementó la desventaja de COCI sobre otras fuentes con ritmos de actualización más rápidos.
Teniendo en cuenta que Elsevier es la editorial académica que publica un mayor volumen de documentos a nivel mundial, su reciente decisión de abrir sus referencias en Crossref ha resultado en un incremento significativo del total de referencias disponibles públicamente esta plataforma. La actualización de COCI publicada el 3 de septiembre de 2021 (basada en las referencias abiertas de Crossref disponibles hasta agosto de 2021) ya contiene las referencias procesadas de Elsevier, así como las referencias de los documentos publicados más recientemente por ACS (las referencias disponibles en documentos publicados anteriormente aparecerán en versiones posteriores de COCI).
¿Cómo ha cambiado el panorama a raíz de estos cambios? Para averiguarlo, actualicé nuestro análisis de 2019 utilizando la versión de COCI del 3 de septiembre de 2021, así como el índice de citas de NIH-OCC publicado en el mismo mes. En esta última fuente solo se utilizaron aquellas citas en las que tanto el documento citante como el citado tenían DOI, aunque esta fuente también es capaz de identificar citas entre documentos sin DOIs conocidos, pero con identificadores Pubmed. A fin de realizar una comparación razonablemente justa entre estos datos publicados en 2021 y los extraídos de otras fuentes en 2019, de los conjuntos de datos abiertos solo se utilizaron las citas en las que el documento citante estuviera publicado antes de julio de 2019. La intención por tanto era conocer cómo ha crecido la cobertura de citas en fuentes abiertas desde 2019 como resultado de las decisiones de las editoriales de compartir abiertamente las listas de referencias que depositan en Crossref, o como resultado de iniciativas similares.
La combinación de las citas disponibles en COCI y en NIH-OCC en sus versiones de septiembre de 2021 arrojó una cifra de 1,62 millones de citas a nuestra muestra de documentos, un incremento del 91% comparado con los 0,85 millones de citas que estaban disponibles en COCI en 2019 (la primera versión de NIH-OCC no fue publicada hasta finales de 2019 y por tanto no pudo ser analizada en el estudio anterior). En este análisis se ha decidido combinar las colecciones de COCI y NIH-OCC porque a diferencia de lo que es habitual cuando se trabaja con fuentes cerradas, la disponibilidad de fuentes de datos con licencias abiertas elimina en gran medida las barreras, tanto técnicas como legales, para trabajar y desarrollar herramientas que reutilicen datos de varias fuentes a la vez.
Si consideramos todas las citas disponibles en cualquiera de las fuentes analizadas, el 53% de todas las citas están disponibles públicamente en COCI + NIH-OCC bajo una licencia CC0 (Figura 2), un porcentaje significativamente mayor que el 28% encontrado en 2019 en COCI. Este valor supera ligeramente el 52% encontrado por Web of Science, y está mucho más cercano al 54% encontrado por Dimensions o el 57% encontrado por Scopus. El solapamiento relativo entre COCI y las otras fuentes de datos también ha crecido considerablemente: en 2019 COCI encontraba el 47% de las citas disponibles en Web of Science, mientras que la combinación de COCI y NIH-OCC ahora encuentra el 87%. En el caso de Scopus, en 2019 las fuentes de citas abiertas solo encontraban el 44% de las citas en la plataforma de Elsevier, y ahora este valor se ha incrementado hasta el 81%. El número de citas identificadas por COCI y no por otras fuentes también se ha incrementado ligeramente.
Fig. 2. Porcentaje de citas disponibles en cada fuente de datos, comparado con todas las citas (primera fila de resultados), y comparado con las citas disponibles en cada una de las demás fuentes (siguientes filas). Producción propia.¿De dónde vienen las nuevas citas abiertas? Como era de esperar, las citas provenientes de documentos publicados por Elsevier conforman la mayoría (cerca de la mitad) de las citas disponibles en fuentes abiertas en 2021 que no estaban ya disponibles en 2019 (Figura 3). También hay 250.000 citas nuevas provenientes de documentos publicados por editoriales que no forman parte del top 5 con mayor volumen de publicación, lo que indica que los esfuerzos de I4OC no se han centrado solamente en los grandes actores del mercado editorial, sino que también se han dirigido y han tenido éxito entre editoriales de menor tamaño.
Fig 3. Incremento en el número de citas disponibles en índices de citas abiertos (COCI + NIH-OCC) entre 2019 y 2021. Producción propia.Pudiera parecer extraño que también se puedan encontrar un alto número de citas provenientes de documentos publicados por IEEE, a pesar de que esta editorial no comparte sus referencias públicamente en Crossref. La razón de esto es que en el pasado las listas de referencias en documentos publicados por esta editorial tenían asignada la categoría “limited” de Crossref, una opción intermedia (ni abiertas, ni cerradas) que las editoriales pueden elegir. Los metadatos que tienen asignada esta categoría solo están disponibles para miembros de CrossRef Metadata Plus, un servicio de pago que proporciona algunas ventajas adicionales sobre los servicios gratuitos ofrecidos por Crossref. Como miembro de este servicio, OpenCitations pudo obtener las listas de referencias de IEEE mientras estaban disponibles, e incluirlas en COCI. Más adelante, la editorial decidió cerrar completamente sus referencias, lo cual explica que en 2021 no se encontraran en COCI más citas provenientes de documentos publicados por IEEE.
En conclusión, la cobertura de los datos de citas disponibles bajo licencias CC0 desde fuentes abiertas es ahora comparable a la de las fuentes de suscripción como Web of Science y Scopus, lo que las convierte en alternativas viables para desarrollar servicios de información con datos e indicadores auditables y reproducibles.
La disponibilidad de metadatos académicos abiertos (y entre ellos los datos de citas abiertos) que no presentan limitaciones u obstáculos para su reutilización y redistribución tiene un gran potencial para beneficiar a toda la comunidad académica de una forma antes inédita. Gracias a Microsoft Academic, COCI, NIH-OCC, Internet Archive, y otras iniciativas, y a pesar de algunos percances sufridos por el camino, actualmente estamos siendo testigos de cómo las infraestructuras de metadatos abiertas están posibilitando el desarrollo de un ecosistema de nuevas herramientas de información científica que los modelos utilizados por los proveedores comerciales tradicionales no permitían.
Sin embargo, a pesar de que algunas de las iniciativas abiertas han recibido importantes subvenciones para seguir desarrollándose durante los próximos años, su continuidad a largo plazo no está asegurada por el momento. Esto supone un riesgo a la hora de desarrollar herramientas basadas en estas fuentes, tal y como nos ha enseñado el caso de Microsoft Academic. Ahora es por tanto el momento de trabajar juntos para desarrollar infraestructuras de metadatos de investigación abiertas, pero también sostenibles (Hendricks et al., 2021).
Las bibliotecas académicas podrían convertirse en importantes aliadas de las organizaciones que desarrollan infraestructuras abiertas, no solo mediante su apoyo económico sino también a través de colaboraciones. En España existe un claro antecedente: muchas bibliotecas de universidades públicas colaboran con servicios de información científica consolidados y de gran utilidad en el ámbito hispanohablante, como Dialnet. Este servicio ofrece una plataforma accesible de forma gratuita pero no distribuye sus metadatos bajo licencias abiertas (aunque una parte de sus registros están disponibles por OAI-PMH). Una posible vía de actuación por tanto sería buscar modelos en los que el fruto del trabajo colaborativo realizado por instituciones públicas para alimentar servicios de información científica quede disponible de manera que pueda ser reutilizado libremente por la comunidad académica al completo.
Referencias bibliográficas
Bilder, G., Lin, J., & Neylon, C. (2020). The Principles of Open Scholarly Infrastructure. https://doi.org/10.24343/C34W2H
Czygan, M., Holzmann, H., & Newbold, B. (2021). Refcat: The Internet Archive Scholar Citation Graph. arXiv:2110.06595 [cs]. http://arxiv.org/abs/2110.06595
Heibi, I., Peroni, S., & Shotton, D. (2019). Software review: COCI, the OpenCitations Index of Crossref open DOI-to-DOI citations. Scientometrics. https://doi.org/10.1007/s11192-019-03217-6
Hendricks, G., Kramer, B., Maccallum, C. J., Manghi, P., Neylon, C., Peroni, S., Shotton, D., Tay, A., & Waltman, L. (2021, octubre 27). Now is the time to work together toward open infrastructures for scholarly metadata. Impact of Social Sciences Blog. https://blogs.lse.ac.uk/impactofsocialsciences/2021/10/27/now-is-the-time-to-work-together-toward-open-infrastructures-for-scholarly-metadata/
Hutchins, B. I., Baker, K. L., Davis, M. T., Diwersy, M. A., Haque, E., Harriman, R. M., Hoppe, T. A., Leicht, S. A., Meyer, P., & Santangelo, G. M. (2019). The NIH Open Citation Collection: A public access, broad coverage resource. PLOS Biology, 17(10), e3000385. https://doi.org/10.1371/journal.pbio.3000385
Martín-Martín, A., Thelwall, M., Orduna-Malea, E., & Delgado López-Cózar, E. (2021). Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: A multidisciplinary comparison of coverage via citations. Scientometrics, 126(1), 871-906. https://doi.org/10.1007/s11192-020-03690-4
Peroni, S., & Shotton, D. (2020). OpenCitations, an infrastructure organization for open scholarship. Quantitative Science Studies, 1(1), 428-444. https://doi.org/10.1162/qss_a_00023
Tay, A., Martín-Martín, A., & Hug, S. E. (2021, mayo 27). Goodbye, Microsoft Academic – hello, open research infrastructure? Impact of Social Sciences Blog. https://blogs.lse.ac.uk/impactofsocialsciences/2021/05/27/goodbye-microsoft-academic-hello-open-research-infrastructure/
[1] Este texto es una versión ampliada y en castellano de un post publicado en el blog de OpenCitations durante la semana del Acceso Abierto de 2021. Agradezco a David Shotton y Silvio Peroni (directores de OpenCitations) sus comentarios sobre la versión original del texto, muchos de los cuales tienen su reflejo también en esta versión.
Publicado en THE Times Higher Education https://www.timeshighereducation.com/news/corrupting-chatgpt-use-polarises-peer-reviewers Quemadlo...