Publicado en THE Times Higher Education
https://www.timeshighereducation.com/blog/academic-publishers-and-ai-do-not-need-be-enemies
Las editoriales académicas y la IA no tienen por qué ser enemigas
Según David Clark, de Oxford University Press, las empresas de IA generativa deberían dejar de estafar a las editoriales y colaborar con ellas para enriquecer el saber académico.
4 de abril de 2024
David Clark
Twitter: @DavidClarkOUP
Miedo, desesperación, optimismo, ansiedad: durante gran parte del último año, se ha hecho referencia a todas estas emociones y más cuando se ha mencionado la IA generativa.
Sabemos que esta tecnología, impulsada por grandes modelos lingüísticos, dará forma a todo nuestro futuro, sobre todo como herramienta para el descubrimiento y la recuperación de conocimientos. Puede parecer que no está en nuestras manos, pero las editoriales académicas y los investigadores con los que colaboramos nos encontramos en una encrucijada: ¿nos resistimos o nos comprometemos?
A principios de este mes, la Publishers Association, la organización que agrupa a los editores del Reino Unido, escribió una carta a las empresas tecnológicas para expresar nuestra preocupación por el uso de obras protegidas por derechos de autor en la formación, el desarrollo y el funcionamiento de modelos de IA. En ella se subraya que «no autorizamos ni concedemos permiso para el uso de ninguna de sus obras protegidas por derechos de autor en relación con, sin limitación, la formación, el desarrollo o el funcionamiento de modelos de inteligencia artificial, incluidos los grandes modelos lingüísticos u otros productos de inteligencia artificial generativa». En resumidas cuentas, no estamos dispuestos a permitir que se utilicen las obras que hemos publicado, el trabajo de investigadores y autores de todo el mundo que se han esforzado mucho, a menos que se hayan acordado las licencias adecuadas.
Pero no se trata de resistirse a la IA generativa y a lo que puede ofrecer. Es una petición de compromiso, y de compromiso de buena fe.
La experiencia nos dice que no debemos quedarnos al margen en este momento. Del mismo modo que Google y otros motores de búsqueda se han convertido en la forma principal en que la mayoría de los académicos recuperan la literatura académica, y las editoriales académicas se han comprometido con ellos para que esto suceda, los grandes modelos lingüísticos crearán las herramientas que permitirán a los académicos y estudiantes acceder y comprender los últimos avances en la investigación.
Pero la forma en que permitimos que la IA dé forma al futuro de las comunicaciones académicas debe estar guiada por el conocimiento, la comprensión de las percepciones, las preocupaciones y las oportunidades potenciales para la comunidad académica. En Oxford University Press estamos realizando una encuesta entre los investigadores académicos para comprender mejor el impacto de la tecnología de IA en el proceso de investigación. Necesitamos conocer las experiencias de todo el espectro investigador, ya se trate de investigadores noveles o consolidados, de diferentes disciplinas y áreas temáticas, o de distintos países e idiomas. Comprender cómo se relacionan los estudiantes, investigadores y bibliotecarios con las tecnologías de IA generativa será fundamental para entender cómo debemos relacionarnos con estas tecnologías y con las empresas que las desarrollan.
Hay, por supuesto, buenas razones para preocuparse. Como se afirma en la carta de la Asociación de Editores, los editores de todo el sector son conscientes del uso de «enormes cantidades de obras protegidas por derechos de autor sin la autorización del titular de los derechos en el entrenamiento, desarrollo y funcionamiento de modelos de IA». El riesgo para los editores y, fundamentalmente, para los autores de la investigación es el poder potencial de las tecnologías de IA para absorber, retener y reutilizar el conocimiento. Frente a estos riesgos, los editores están equilibrando la necesidad de adaptarse -y rápidamente- a este nuevo mundo, con la necesidad de garantizar que el material publicado no se pase por alto como fuente crítica de conocimiento ni se tome simplemente sin la debida autorización, remuneración y atribución.
Los editores y autores académicos tienen la responsabilidad de desempeñar un papel activo en el cambio del paradigma del conocimiento y, al hacerlo, crear la oportunidad de preservar el ecosistema que sustenta el mundo académico y la propiedad intelectual que lo sostiene. Una de las principales oportunidades es garantizar que la IA generativa respete la autoría y la propiedad intelectual, descubra contenidos y remita a los usuarios a las fuentes originales o primarias, y no fomente el plagio intencionado o no.
La política recientemente propuesta para que las monografías estén disponibles gratuitamente bajo licencias de acceso abierto en un plazo de dos años a partir de su publicación, como parte de los requisitos del Marco de Excelencia en Investigación del Reino Unido, también plantea cuestiones críticas sobre la intersección de la IA y el acceso abierto para la comunidad académica. Poner los libros a disposición del acceso abierto bajo licencias Creative Commons Attribution (CC BY) entraña el riesgo de permitir usos comerciales generativos de IA de esas obras con escasas salvaguardias o recompensas para los autores.
No está claro, por ejemplo, cómo se puede atribuir adecuadamente a los autores su trabajo en un entorno de IA generativa. Abogamos firmemente por una relación de trabajo más amplia entre las empresas tecnológicas y los editores que se centre en los principios fundamentales de autorización y atribución, sea cual sea el modelo de publicación mediante el que se ponga a disposición la investigación.
Con el tiempo, surgirán nuevos usos de la IA generativa que impulsarán nuevas formas de utilizar los contenidos. Esto dará lugar a nuevos usos de la erudición y a la propia erudición, así como a nuevas oportunidades de financiación. Si las futuras tecnologías de IA se desarrollan en colaboración con editores, investigadores y autores, se obtendrán herramientas mejores, más sostenibles y menos sesgadas, que a su vez se utilizarán para mejorar los resultados de la investigación. Un resultado beneficioso para todos.
David Clark es director general de la División Académica de Oxford University Press.
**********************
Academic publishers and AI do not need to be enemiesGenerative AI firms should stop ripping off publishers and instead work with them to enrich scholarship, says Oxford University Press’ David ClarkApril 4, 2024
David Clark
Twitter: @DavidClarkOUP
Fear, despair, optimism, anxiety – for much of the last year, all these emotions and more have been referenced when generative AI has been mentioned.
We know that this technology, driven by large language models, will shape all our futures, not least as a tool for the discovery and retrieval of knowledge. This might feel like it is out of our hands but scholarly publishers, and the researchers we partner with, are at a crossroads – do we resist or do we engage?
Earlier this month, the Publishers Association, the member organisation for UK publishers, wrote a letter to technology companies to express our concerns about the use of copyrighted works in the training, development and operation of AI models. It underlined that we “do not outside of any agreed licensing arrangements to the contrary, authorise or otherwise grant permission for the use of any of their copyright-protected works in relation to, without limitation, the training, development or operation of AI models including large language models or other generative AI products”. The bottom line is that we are not willing to let the works we have published, the work of hard-working researchers and authors across the world, be used unless appropriate licences have been agreed.
But this is not about resisting generative AI and what it can offer. This is a request to engage, and to engage in good faith.
Experience tells us that we should not stand aside in this moment. Much as Google and other search engines have become the leading way in which most scholars retrieve academic literature, and academic publishers have engaged with them to make that happen, large language models will create the tools that enable scholars and students to access and understand the latest developments in research.
But how we allow AI to shape the future of scholarly communications must be insight-led, understanding the perceptions, concerns and potential opportunities for the scholarly community. At Oxford University Press, we are currently holding a survey of academic researchers to better understand the impacts of AI technology throughout the research process. We need to understand experiences across the research spectrum, be that early-career or established researchers, different disciplines and subject areas, or different countries and languages. Understanding how students, researchers and librarians engage with generative AI technologies will be critical to understanding how we should engage with these technologies and the companies developing them.
There are, of course, good reasons to be concerned. As stated in the Publishers Association’s letter, publishers across the industry are aware of the use of “vast amounts of copyright-protected works without the authorisation of the right holder in the training, development, and operation of AI models”. The risk for publishers and, fundamentally, for research authors is the potential power of AI technologies to absorb, retain and re-use knowledge. Against these risks, publishers are balancing the need to adapt – and quickly – to this new world, with the need to ensure that published material is neither overlooked as a critical source of knowledge nor simply taken without appropriate authorisation, remuneration and attribution.
Scholarly publishers and authors have a responsibility to play an active role in how the knowledge paradigm shifts and, in doing so, create the opportunity to preserve the ecosystem that supports academia and the intellectual property which sustains it. Chief among the opportunities is the chance to ensure that generative AI respects authorship and intellectual property, discovers content and refers users to the original or primary sources, and does not encourage intentional or unintentional plagiarism.
The recently proposed policy for monographs to be made freely available under open-access licences within two years of publication as part of the requirements for the UK’s Research Excellence Framework also raises critical questions about the intersection of AI and open access for the scholarly community. Making books available for open access under Creative Commons Attribution (CC BY) licences risks enabling commercial generative AI uses of those works with limited safeguards or recompense for authors.
It is unclear, for example, how authors can be properly attributed for their work within a generative AI environment. We advocate strongly for a broader working relationship between technology companies and publishers that centres on the core principles of authorisation and attribution, whatever the publishing model by which research is made available.
Over time, new uses of generative AI will emerge, driving new ways of using content. This will lead to new uses of scholarship and new scholarship itself, as well as new funding opportunities. If future AI technologies are developed working with publishers, researchers and authors, it will lead to better, more sustainable and less biased tools, which will in turn be used to create improved research outcomes. A winning outcome for all.
David Clark is managing director of Oxford University Press’ Academic Division.