Boletín SciELO-México: OpenAlex: ya está aquí el sucesor de Microsoft Academic Graph con 200 millones de documentos científicos

viernes, 28 de enero de 2022

OpenAlex: ya está aquí el sucesor de Microsoft Academic Graph con 200 millones de documentos científicos

Publicado en Nature
https://www.nature.com/articles/d41586-022-00138-y

Se lanza un índice abierto masivo de documentos académicos

OpenAlex cataloga cientos de millones de documentos científicos y establece conexiones entre ellos.

Dalmeet Singh Chawla

Se ha lanzado un ambicioso índice gratuito de más de 200 millones de documentos científicos que cataloga las fuentes de publicación, la información de los autores y los temas de investigación.

El índice, llamado OpenAlex en honor a la antigua Biblioteca de Alejandría (Egipto), también pretende trazar conexiones entre estos puntos de información para crear una base de datos completa e interconectada del sistema de investigación mundial, dicen sus fundadores. La base de datos, que se puso en marcha el 3 de enero, sustituye a Microsoft Academic Graph (MAG), una alternativa gratuita a las plataformas por suscripción como Scopus, Dimensions y Web of Science que dejó de funcionar a finales de 2021.

"Se trata de reunir muchas bases de datos de forma inteligente", afirma Euan Adie, fundador de Overton, una empresa con sede en Londres que rastrea la investigación citada en documentos políticos. Overton había obtenido sus datos de varias fuentes, como MAG, ORCID, Crossref y directamente de los editores, pero ahora ha pasado a utilizar únicamente OpenAlex, con la esperanza de facilitar el proceso.

Mejora de la cobertura

La decisión de Microsoft de cerrar MAG (announced last May), anunciada el pasado mes de mayo, preocupó a algunos académicos y otras personas que utilizaban sus datos para realizar estudios y crear herramientas de investigación.

En respuesta al cierre de MAG, la empresa de servicios académicos sin ánimo de lucro OurResearch, de Vancouver (Canadá), creó OpenAlex, utilizando parte de una subvención de 4,5 millones de dólares de la organización benéfica londinense Arcadia Fund. Actualmente, el índice es accesible a través de una interfaz de programación de aplicaciones, o API, que puede realizar búsquedas complejas. Está previsto que en febrero se lance una interfaz de motor de búsqueda (search-engine interface) más sencilla.

OpenAlex extrae sus datos de los registros existentes de MAG y de otras fuentes, como los identificadores de Wikidata, ORCID, Crossref y ROR, dice Jason Priem, cofundador de OurResearch.

La herramienta también está integrada con la base de datos Unpaywall, que contiene más de 30 millones de artículos de acceso abierto que Priem y la cofundadora de OurResearch, Heather Piwowar, lanzaron en 2017 (launched in 2017). "Ahora tenemos una cobertura de acceso abierto mucho mejor que la que tenía MAG", dice Priem. "No solo podemos decirte dónde viven las copias de lectura libre de cualquier artículo en particular, sino que también podemos decirte la licencia y la versión de ese artículo".

Fácil de configurar

OpenAlex también es gratuito, gracias al patrocinio de Amazon Web Services, y no requiere registro ni información de acceso, lo que hace que el proceso sea más fácil de usar, dice Priem. Esto difiere de MAG, para el que los usuarios tenían que iniciar sesión en Azure, el sistema de alojamiento en la nube de Microsoft, y pagar una pequeña cuota para descargar su conjunto de datos. Priem dice que su empresa podría considerar la posibilidad de lanzar un nivel premium de pago de OpenAlex para los usuarios que quieran un acceso súper rápido, pero siempre habrá una versión actualizada y gratuita.

Está "escrito de tal manera que es muy fácil de usar", dice Adie. Añade que sólo tardó unos 20 minutos en empezar a utilizar OpenAlex, frente a los tres o cuatro días que tardaba con MAG. "El inconveniente es que Microsoft tenía mucha capacidad técnica que podía aplicar a Microsoft Academic. Así que tendremos que ver cómo le va a OurResearch sin eso", dice Adie.

Roar Bakken Stovner, que estudia los patrones de citación de los investigadores en la Universidad Metropolitana de Oslo, dice que le llevó unas dos horas empezar a trabajar con OpenAlex, frente a una semana con MAG. "Para alguien que tenga más conocimientos informáticos, MAG puede ser más fácil", dice. "Para los investigadores que quieran probar pequeños proyectos por su cuenta, OpenAlex será mucho más fácil para empezar".

Frode Opdahl, director ejecutivo de Keenious, una empresa de nueva creación con sede en Tromsø (Noruega), que escanea millones de documentos para sugerir referencias relevantes, dice que está satisfecho con la documentación publicada sobre OpenAlex. "Hace que sea mucho más fácil trabajar con él e implementarlo en nuestro producto", afirma.

****************************

24 January 2022

Massive open index of scholarly papers launches

OpenAlex catalogues hundreds of millions of scientific documents and charts connections between them.

Dalmeet Singh Chawla

An ambitious free index of more than 200 million scientific documents that catalogues publication sources, author information and research topics, has been launched.

The index, called OpenAlex after the ancient Library of Alexandria in Egypt, also aims to chart connections between these data points to create a comprehensive, interlinked database of the global research system, say its founders. The database, which launched on 3 January, is a replacement for Microsoft Academic Graph (MAG), a free alternative to subscription-based platforms such as Scopus, Dimensions and Web of Science that was discontinued at the end of 2021.

“It’s just pulling lots of databases together in a clever way,” says Euan Adie, founder of Overton, a London-based firm that tracks the research cited in policy documents. Overton had been getting its data from various sources, including MAG, ORCID, Crossref and directly from publishers, but has now switched to using only OpenAlex, in the hope of making the process easier.

Improved coverage

Microsoft’s move to close MAG, announced last May, worried some academics and others who used its data to conduct studies and build research tools.

In response to MAG’s closure, non-profit scholarly services firm OurResearch in Vancouver, Canada, created OpenAlex, using part of a US$4.5-million grant from London-based charity Arcadia Fund. The index is currently accessible through an application programming interface, or API, that can perform complex searches. A simpler search-engine interface is scheduled to launch in February.

OpenAlex draws its data from MAG’s existing records and from other sources including Wikidata identifiers, ORCID, Crossref and ROR, says Jason Priem, co-founder of OurResearch.

The tool is also integrated with the Unpaywall database, which contains more than 30 million open-access articles that Priem and OurResearch co-founder Heather Piwowar launched in 2017. “We now have much better coverage of open access than MAG ever did,” Priem says. “Not only can we tell you where the free-to-read copies of any particular article live, but we can also tell you the licence and the version of that article.”

Priem says that OpenAlex updates every fortnight by bringing in more data from its sources. The tool goes a step further towards openness than MAG did, because OpenAlex’s underlying code is freely available under a CC0 copyright licence for anyone to build on, says Priem. That means that if OpenAlex were to be discontinued, any researcher can pick up where Priem left off instead of having to rebuild the whole database from scratch.

Easy set-up

OpenAlex is also free to use, thanks to sponsorship from Amazon Web Services, and requires no registration or log-in information, making the process more user-friendly, says Priem. This differs from MAG, for which users had to log into Azure, Microsoft’s cloud-hosting system, and pay a small fee to download their data set. Priem says that his firm might consider rolling out a premium, pay-to-use tier of OpenAlex for users who want super-fast access, but a free up-to-date version will always be available.

It’s “written in such a way that’s very easy for somebody to pick up and use”, says Adie. He adds that it took him only about 20 minutes to get started on OpenAlex, compared with three to four days with MAG. “The downside is that Microsoft had a lot of technical capability that they could apply to Microsoft Academic. So we’ll have to see how OurResearch does without that,” Adie says.

Roar Bakken Stovner, who studies researchers’ citations patterns at Oslo Metropolitan University, says that it took him around two hours to start working with OpenAlex, compared with around a week with MAG. “For somebody who is more computer savvy, MAG might be easier,” he says. “For researchers who want to try small projects on their own, OpenAlex will be way easier to start with.”

Frode Opdahl, chief executive of Keenious, a start-up firm based in Tromsø, Norway, which scans millions of papers to suggest relevant references, says he’s pleased with the documentation published about OpenAlex. “It makes it a lot easier to work with and implement into our product,” he says.

doi: https://doi.org/10.1038/d41586-022-00138-y

**********

Boletín SciELO-México

viernes, 28 de enero de 2022

OpenAlex: ya está aquí el sucesor de Microsoft Academic Graph con 200 millones de documentos científicos

No hay comentarios:

Publicar un comentario

T-MEC digital: la revisión que expone la pugna tecnológica entre Washington y Pekín, con México como escenario clave

Denunciar abuso

Etiquetas