miércoles, 5 de mayo de 2021

La producción científica en el año de COVID, una actualización

 Publicado en The Scholarly Kitchen



Artículo invitado - La producción científica en el año de COVID, una actualización

Por CHRISTOS PETROU
23 de febrero de 2021


Nota del editor: El post de hoy es de Christos Petrou, fundador y analista jefe de Scholarly Intelligence. Christos es un antiguo analista del Grupo Web of Science en Clarivate Analytics y de la cartera de Acceso Abierto en Springer Nature. Genetista de formación, trabajó anteriormente en agricultura y como consultor para A.T. Kearney, y tiene un MBA de INSEAD.

En noviembre del año pasado, escribí sobre el crecimiento previsto del mercado de artículos de revistas en 2020. Aunque muchas de las conclusiones clave de ese artículo siguen siendo ciertas, su tamaño en algunos casos estaba sobre o subestimado. Si bien 2020 fue efectivamente un año récord para el crecimiento de las revistas académicas (8% de crecimiento anual [Year on Year - YoY] de los artículos frente a una tasa de crecimiento anual compuesta [Compounded Annual Growth Rate - CAGR] del 3% en los seis años anteriores), este crecimiento no alcanza mis expectativas originales de un crecimiento mínimo del 17%.

Ofrezco mis disculpas por presentar un análisis inexacto a los lectores y editores de este blog. Aquí muestro los resultados actualizados, explico el origen de las inexactitudes y analizo algunos de los retos que plantea el uso de bases de datos para dimensionar el mercado.


Revisión de los resultados

Una vez más, utilizo los datos de Dimensions y defino el mercado como las revistas de la lista ERA 2018 ( ERA 2018 list ), que fue ideada para las evaluaciones nacionales de investigación en Australia, incluye unas 25,000 revistas y tiene un alto solapamiento con los índices selectivos de la Web of Science de Clarivate.

El mercado creció un 8,1% o ~200k artículos en 2020. Este es el crecimiento más fuerte visto en los últimos años, tres veces más grande que el crecimiento absoluto anual promedio de 2013 a 2019.

Anteriormente sugerí que el crecimiento de las revistas de acceso totalmente abierto (Open Access - OA) era tan fuerte como el de las revistas híbridas y de suscripción en 2020. Esto es inexacto. Al igual que en años anteriores, las revistas de acceso totalmente abierto crecieron con más fuerza en términos relativos que las revistas híbridas y de suscripción. En concreto, las revistas totalmente OA de la lista de ERA 2018 crecieron notablemente en 2020, con un 19% interanual, en comparación con una CAGR del 10% en los años anteriores, y las revistas híbridas y de suscripción también superaron el rendimiento histórico (6% interanual frente al 2% de los años anteriores), pero no alcanzó mi estimación original de un crecimiento mínimo del 17%.






Figura 1. Crecimiento histórico y en 2020 por grupo de revistas (basado en datos de Dimensions)

Figura 2. Volumen de artículos (k) en 2019 y 2020 por grupo de revistas (basado en datos de Dimensions)


Como se ha señalado en el análisis anterior, la mayoría de las áreas de investigación parecen haber superado los niveles históricos de rendimiento. La investigación tecnológica se basó en el crecimiento acelerado impulsado por China en los últimos años. Las Ciencias Físicas estuvieron en línea con los resultados recientes. Las Ciencias Sociales y, especialmente, la Biomedicina tuvieron una elevada proporción de artículos COVID (definidos como artículos que mencionan COVID en su título o resumen), lo que impulsó su crecimiento adicional. Las Ciencias de la Vida crecieron con fuerza a pesar de la relativa ausencia de artículos COVID.

Artes y Humanidades destaca en la dirección opuesta: en 2020 parece haber disminuido un 5% para su menor producción de artículos desde 2014. No he podido confirmar este hallazgo en otras bases de datos, y podría ser un efecto de la utilización de las revistas del ERA 2018, que omiten algunos títulos de Artes y Humanidades. Sin embargo, Dimensions implica un crecimiento mínimo para esta área incluso sin el filtro de ERA 2018.




Figura 3. Crecimiento histórico y en 2020 por área de investigación de las revistas del ERA 2018 (los campos de investigación asignados por Dimensions a nivel de artículo según la clasificación de la ANZSRC; los códigos 01-05 se muestran aquí como Ciencias Físicas, 06-07 como Ciencias de la Vida, 08-10 como Tecnología, 11 como Biomedicina, 12-17 como Ciencias Sociales y 18-22 como Artes y Humanidades)

El crecimiento inflado en el post anterior era difícil de explicar. Ahora, el crecimiento anual reestimado del 8% tiene una explicación más sencilla: Los trabajos relacionados con COVID. Si no fuera por los artículos relacionados con COVID, el crecimiento en 2020 habría sido ligeramente inferior al 5%, lo que supondría un rendimiento fuerte pero poco destacable. En otras palabras, los investigadores fueron en conjunto tan prolíficos en 2020 como en los años "normales" y, además, fueron capaces de producir un gran volumen de artículos relacionados con COVID.

Qué falló en el análisis anterior

La explicación sencilla es que no entendí lo suficientemente bien el mecanismo de datación de artículos de Dimensions. En lo que respecta al filtrado y al análisis estándar, Dimensions recalificaba los artículos que se publicaban en línea cuando se asignaban a un volumen de revista con fecha de impresión. Esto significa que, por ejemplo, el filtrado para el año '2020' en noviembre pasado incluiría algunos artículos que eventualmente serían re-fechados en '2021'. El año '2020' aparecería inflado hasta que todos los artículos que debían tener una fecha de impresión la tuvieran.

Cuando realicé el análisis, las cifras de "2020" estaban infladas y también lo estaba el análisis resultante, especialmente en el caso de las revistas híbridas y de suscripción, en las que es más probable que los artículos tengan tanto una fecha en línea como una fecha de impresión.


Cómo dimensionar el mercado (aviso, se pone técnico)

Dimensions ha revisado su mecanismo de datación de artículos para el filtrado y el análisis estándar desde diciembre de 2020. Ya no dan prioridad a las fechas de impresión, sino que intentan identificar la fecha en la que la versión del registro estuvo disponible por primera vez (ambas fechas están disponibles para casos de uso más sofisticados). Han aplicado esto de forma retrospectiva a todos los artículos y, como resultado, (a) unos cuantos millones de artículos se han vuelto a fechar hacia atrás y (b) en adelante, una vez que un artículo se asigna a un año, es poco probable que se vuelva a fechar a un año futuro.

El mecanismo de fechado actualizado de Dimensions es una mejora bienvenida. Significa que es poco probable que los recuentos de artículos en curso estén inflados. Por ejemplo, mi análisis anterior habría arrojado resultados diferentes pero fiables desde el principio.

Otras bases de datos han adoptado diferentes mecanismos para tratar las fechas en línea y las fechas de impresión. Por ejemplo, la Web of Science (WoS). Al realizar una búsqueda básica o avanzada basada en la fecha, WoS asigna a ambos años los artículos que tienen una fecha en línea y una fecha de impresión en años diferentes. A continuación, el filtro de fechas de la página de resultados da prioridad a la fecha en línea y muestra los recuentos de artículos únicos.

Aquí la cosa se pone un poco más compleja. Cualquier revista que esté en transición de usar sólo fechas de impresión a usar tanto fechas de impresión como fechas en línea (llamado "acceso temprano" en este caso) mostrará recuentos de artículos inflados en la plataforma WoS para el año de transición. Si todas las revistas de una editorial hacen la transición al mismo tiempo, entonces la producción de artículos de la editorial estará inflada para el año de la transición. Y si un par de grandes editoriales realizan la transición al mismo tiempo, entonces la producción global de artículos aparecerá inflada para el año de la transición.

La inflación en el año de transición proviene de los artículos de "fecha temprana": el año de transición (t) se beneficia de los artículos de "fecha temprana" con fecha de impresión en el año siguiente (t+1) sin desprenderse de los artículos con fecha de impresión en el año de transición (t) y fecha de "acceso temprano" en el año anterior (t-1).

Según el post de Phil Davis, varias revistas y editoriales (Springer Nature, Wiley, etc.) han pasado por esta transición desde 2017, pero muchas otras no (Elsevier, OUP, CUP, etc.). Hasta que este proceso haya concluido para todas las editoriales, el dimensionamiento del mercado en WoS requerirá algún filtro creativo para crear la visión de la fecha de impresión del mundo y abordar la cuestión de la inflación.


****************************

No hay comentarios:

Publicar un comentario

Recompensas, incentivos y/o reconocimientos para los investigadores que practican la Ciencia Abierta

Publicado en blog  Universo abierto https://universoabierto.org/2019/10/14/recompensas-incentivos-y-o-reconocimientos-para-los-investigadore...