Mostrando entradas con la etiqueta Libros. Mostrar todas las entradas

jueves, 13 de febrero de 2025

Cerficación de autoría humana no-IA para libros [ Authors Guild: certificación «Human Authored» ]

Publicado en blog Universo abierto
https://universoabierto.org/2025/02/03/la-authors-guild-lanza-la-certificacion-human-authored-para-preservar-la-autenticidad-en-la-literatura-en-un-mundo/

Authors Guild lanza la certificación «Human Authored» para preservar la autenticidad en la literatura en un mundo impulsado por la IA

Authors Guild. «Authors Guild Launches ‘Human Authored’ Certification to Preserve Authenticity in Literature.» Authors Guild, January 29, 2025. https://authorsguild.org/news/ag-launches-human-authored-certification-to-preserve-authenticity-in-literature/

El Authors Guild ha lanzado «Human Authored», una certificación oficial destinada a preservar la autenticidad en la literatura en un mundo saturado por la inteligencia artificial (IA). Con el creciente número de libros generados por IA que se parecen y a veces incluso leen como libros escritos por humanos, los lectores pueden no saber si lo que están leyendo fue creado por IA o por un autor humano. El Authors Guild sostiene que los lectores tienen derecho a saber si un texto fue escrito por IA o por un humano y que los autores deben poder distinguir su trabajo en mercados cada vez más llenos de contenido generado por IA.

La certificación «Human Authored» permitirá a los escritores y editores usar un sello para indicar que el texto de un libro fue escrito por un humano, incluso si se utilizó IA para herramientas menores como la corrección ortográfica o de gramática. Este sello será registrado en la Oficina de Patentes y Marcas de EE. UU. y estará respaldado por un sistema de registro que permitirá verificar el origen humano de un libro a través de una base de datos pública.

El proceso de certificación es sencillo pero riguroso: los autores deben registrarse en el portal, verificar la información de su libro, firmar un acuerdo de licencia y recibir un sello único que podrán utilizar en las portadas, lomos o materiales promocionales. La iniciativa no rechaza la tecnología, sino que busca crear transparencia y resaltar los elementos humanos en la narrativa, en un mercado cada vez más saturado de contenido generado por IA.

Actualmente, la certificación está disponible solo para miembros del Authors Guild y para libros de un solo autor, pero se expandirá en el futuro para incluir libros con varios autores y a escritores fuera de la organización.

martes, 21 de enero de 2025

¿Ladrón que roba a ladrón tiene 100 años de perdón? Meta de Zuckerberg se piratea los libros de LibGen

Publicado en The Guardian
https://www.theguardian.com/technology/2025/jan/10/mark-zuckerberg-meta-books-ai-models-sarah-silverman

Zuckerberg aprobó el uso de libros «pirateados» por Meta para entrenar modelos de IA, según sus autores

Sarah Silverman y otros denuncian ante los tribunales que el CEO aprobó el uso de datos a pesar de las advertencias.

Mark Zuckerberg aprobó el uso por parte de Meta de versiones «pirateadas» de libros protegidos por derechos de autor para entrenar los modelos de inteligencia artificial de la empresa, según alega un grupo de autores en una demanda presentada ante un tribunal estadounidense.

Citando comunicaciones internas de Meta, la demanda afirma que el director ejecutivo de la empresa de redes sociales respaldó el uso del conjunto de datos LibGen, un vasto archivo en línea de libros, a pesar de las advertencias dentro del equipo ejecutivo de IA de la empresa de que se trata de un conjunto de datos «que sabemos que es pirata».

El mensaje interno dice que el uso de una base de datos que contiene material pirateado podría debilitar las negociaciones del propietario de Facebook e Instagram con los reguladores, según la presentación. «La cobertura mediática que sugiere que hemos utilizado un conjunto de datos que sabemos que es pirata, como LibGen, puede debilitar nuestra posición negociadora con los reguladores».

El autor estadounidense Ta-Nehisi Coates, la cómica Sarah Silverman y los demás autores que demandan a Meta por infracción de derechos de autor hicieron las acusaciones en una presentación hecha pública el miércoles, ante un tribunal federal de California.

Los autores demandaron a Meta en 2023, alegando que la empresa de redes sociales utilizó indebidamente sus libros para entrenar a Llama, el gran modelo lingüístico que alimenta sus chatbots.

El conjunto de datos Library Genesis, o LibGen, es una «biblioteca en la sombra» originaria de Rusia que afirma contener millones de novelas, libros de no ficción y artículos de revistas científicas. El año pasado, un tribunal federal de Nueva York ordenó a los operadores anónimos de LibGen pagar a un grupo de editores 30 millones de dólares (24 millones de libras) en concepto de daños y perjuicios por infracción de derechos de autor.

El uso de contenidos protegidos por derechos de autor para entrenar modelos de IA se ha convertido en un campo de batalla legal en el desarrollo de herramientas de IA generativa como el chatbot ChatGPT, con profesionales creativos y editores advirtiendo de que utilizar su trabajo sin permiso pone en peligro sus medios de vida y modelos de negocio.

El expediente cita un memorando, que hace referencia a las iniciales de Mark Zuckerberg, en el que se señala que «después de la escalada a MZ», el equipo de IA de Meta «ha sido aprobado para utilizar LibGen».

Citando comunicaciones internas, el documento también afirma que los ingenieros de Meta hablaron de acceder a los datos de LibGen y revisarlos, pero dudaron en iniciar ese proceso porque «hacer torrenting», un término para compartir archivos entre iguales, desde «un portátil corporativo [propiedad de Meta] no parece correcto».

Un juez de distrito estadounidense, Vince Chhabria, desestimó el año pasado las demandas de que el texto generado por los modelos de IA de Meta infringía los derechos de autor de los autores y que Meta sustraía ilegalmente la información de gestión de derechos de autor (CMI) de sus libros, que se refiere a información sobre la obra que incluye el título, el nombre del autor y el propietario de los derechos de autor. Sin embargo, los demandantes obtuvieron permiso para modificar sus demandas.

Los escritores argumentaron esta semana que las pruebas reforzaban sus alegaciones de infracción y justificaban la reactivación de su caso CMI y la adición de una nueva alegación de fraude informático.

En una vista celebrada el jueves, Chhabria declaró que permitiría a los autores presentar una demanda modificada, pero se mostró escéptico sobre el fundamento de las demandas por fraude y CMI.

Se ha contactado con Meta para que haga comentarios.

**************************************

Zuckerberg approved Meta’s use of ‘pirated’ books to train AI models, authors claim

Sarah Silverman and others file court case claiming CEO approved use of dataset despite warnings

Mark Zuckerberg approved Meta’s use of “pirated” versions of copyright-protected books to train the company’s artificial intelligence models, a group of authors has alleged in a US court filing.

Citing internal Meta communications, the filing claims that the social network company’s chief executive backed the use of the LibGen dataset, a vast online archive of books, despite warnings within the company’s AI executive team that it is a dataset “we know to be pirated”.

The internal message says that using a database containing pirated material could weaken the Facebook and Instagram owner’s negotiations with regulators, according to the filing. “Media coverage suggesting we have used a dataset we know to be pirated, such as LibGen, may undermine our negotiating position with regulators.”

The US author Ta-Nehisi Coates, the comedian Sarah Silverman and the other authors suing Meta for copyright infringement made the accusations in a filing made public on Wednesday, in a California federal court.

The authors sued Meta in 2023, arguing that the social media company misused their books to train Llama, the large language model that powers its chatbots.

The Library Genesis, or LibGen, dataset is a “shadow library” that originated in Russia and claims to contain millions of novels, nonfiction books and science magazine articles. Last year a New York federal court ordered LibGen’s anonymous operators to pay a group of publishers $30m (£24m) in damages for copyright infringement.

Use of copyrighted content in training AI models has become a legal battleground in the development of generative AI tools such as the ChatGPT chatbot, with creative professionals and publishers warning that using their work without permission is endangering their livelihoods and business models.

The filing cites a memo, referring to Mark Zuckerberg’s initials, noting that “after escalation to MZ”, Meta’s AI team “has been approved to use LibGen”.

Quoting internal communications, the filing also says Meta engineers discussed accessing and reviewing LibGen data but hesitated on starting that process because “torrenting”, a term for peer-to-peer sharing of files, from “a [Meta-owned] corporate laptop doesn’t feel right”.

A US district judge, Vince Chhabria, last year dismissed claims that text generated by Meta’s AI models infringed the authors’ copyrights and that Meta unlawfully stripped their books’ copyright management information (CMI), which refers to information about the work including the title, name of the author and copyright owner. However, the plaintiffs were given permission to amend their claims.

The writers argued this week that the evidence bolstered their infringement claims and justified reviving their CMI case and adding a new computer fraud allegation.

Chhabria said during a hearing on Thursday that he would allow the writers to file an amended complaint but expressed scepticism about the merits of the fraud and CMI claims.

Meta has been contacted for comment.

//////////////////

jueves, 5 de diciembre de 2024

ARGENTINA: critican la censura de libros en la FIL-Guadalajara

Publicado en El País
https://elpais.com/mexico/2024-12-03/la-persecucion-a-cuatro-libros-en-argentina-abre-el-debate-sobre-la-censura-en-la-fil.html

Censura en Argentina, indignación en la FIL: la caza de brujas a cuatro libros, a debate en la gran feria

Un grupo de escritores opina sobre la persecución que sufren algunas obras en las escuelas de la provincia de Buenos Aires

GEORGINA ZEREGA
Guadalajara (México) - 03 DIC 2024
ACTUALIZADO: 03 DIC 2024

La persecución que sufre la literatura en Argentina ha encendido una mecha del debate en la Feria Internacional del Libro de Guadalajara. Una de las premiadas de este año, Gabriela Cabezón Cámara, que recibe este miércoles el Sor Juana Inés de la Cruz, es una de las cuatro autoras que resisten estos días los embates de los grupos conservadores en su país. Una fundación, secundada por el Gobierno de Javier Milei, busca que se retiren de las escuelas de la provincia de Buenos Aires los ejemplares de cuatro obras: Las aventuras de la China Iron, de Cabezón Cámara; Cometierra , de Dolores Reyes; Las primas, de la fallecida Aurora Venturini; y Si no fueras tan niña, de Sol Fantin.

Un grupo de escritores, que visita la mayor cita de la literatura en español, discute sobre los límites de la censura y las secuelas que deja esta en una democracia. Las cuatro autoras argentinas habían recibido ya el apoyo de la comunidad literaria nacional, que se reunió masivamente hace unos 10 días en defensa de los libros señalados y de las escritoras, que han sido víctimas de amenazas, insultos y acusaciones de “pedófilas” y “pornógrafas” por parte de los grupos conservadores. La opinión de los autores consultados por este periódico ha hilado en el mismo tono de apoyo y la posibilidad de que esas obras sean retiradas de las bibliotecas escolares ha saltado como una alerta del “autoritarismo” que acampa en Argentina y preocupa a la comunidad literaria internacional.

La escritora Jennifer Clement, antigua presidenta del Pen Internacional, expresa sorpresa por ver este tipo de disputas en un país que ha sido muy “abierto” a la literatura escrita por mujeres. “Lo que estamos viendo en Argentina es la estigmatización de estas autoras, el ataque del Gobierno sobre la libertad de expresión y una mira muy fuerte hacia la mujer”, comenta. La autora entiende, sin embargo, que se trata de una puntada más dentro de un “fenómeno mundial” de gobiernos de ultraderecha que practican la censura de libros, como el caso de Estados Unidos, que ha prohibido miles de títulos en bibliotecas públicas y académicas en el último año.

Para el escritor Sergio Ramírez, la censura es “la señal más pésima que hay de un gobierno que prescinde de las reglas del juego democrático”. El nicaragüense, que ha tenido que exiliarse en España después de una persecución brutal por parte del régimen de Daniel Ortega, distingue entre los gobernantes arbitrarios que están contra los libros pero que no perturban la estabilidad del país y los gobernantes que tienen una concepción “más ideológica del poder”, que convierten todo lo que no es el discurso oficial en algo subversivo, como el sexo. Este último es el caso de Argentina, dice.

Ramírez nombra al sexo en referencia a algunas escenas de los libros, que han sido las cuestionadas por los grupos conservadores. Cometierra es una novela que trata de una joven que traga tierra y puede visualizar a mujeres desaparecidas. Después de haber recibido reconocimiento internacional, ha sido víctima de una cruzada por un párrafo en el que describe una relación sexual consentida. Las primas, un éxito editorial que relata la vida de una familia disfuncional en voz de una joven con discapacidad, retrata escenas en las que un par de niñas son víctimas de abuso sexual. O el libro de Fantin, una docente que ha reconstruido en su obra los abusos que sufrió cuando era menor de edad, que fue señalado por la vicepresidenta, Victoria Villarruel, por exaltar la pedofilia y sexualizar a los niños. “¡Con nuestros niños no te metas!”, publicó en sus redes sociales.

Aroa Moreno Durán afirma que la persecución es parte de “esa batalla cultural que le interesa imponer a la derecha y a la extrema derecha, que tiene que ver con los derechos de las mujeres, la igualdad, la lucha contra la violencia de género y la diversidad”. Para la escritora española, la literatura tiene que cuestionar, incomodar y desafiar el orden establecido, “y creo que estos libros lo hacen, son libros que inducen a un pensamiento crítico”. La cacería sucede ahora porque hay una batalla “porque las mujeres no escriban, no cuenten la realidad que nos han perseguido durante siglos, que tiene que ver con la violencia, con mantenernos en la oscuridad, con mantenernos silenciadas y calladas”, dice la autora y periodista.

Lucía Lijtmaer, nacida en Argentina y crecida en España, señala que todas las obras perseguidas tienen un componente feminista “muy claro y evidente”. “Es un paso más sobre lo que se puede y lo que no se puede escribir. Sobre que las mujeres hemos ido demasiado lejos, no solo en la lucha por nuestros derechos, sino también en la literatura”, dice. La autora de Ofendiditos critica que se ha ya creado un “relato de pedofilia con respecto a las escritoras”, y que se les haya colgado “el peor fantasma que le puedes colgar a cualquier persona”, que es el de pedófilas. A las feministas se las acusaba antes de ser puritanas, ahora se las acusa de pornógrafas. “Lo que importa no es la verdad, lo que importa en los últimos tiempos es que se instale un discurso que parezca verdad”.

Al guatemalteco Arnoldo Gálvez le sorprende la contradicción entre el discurso libertario que ha tenido el Gobierno de Milei y la persecución de la literatura. “Estos poderes suelen ser bastante iletrados y no terminan de entender que los actos de censura terminan provocando una suerte de promoción y de posicionamiento de los libros”, comenta. “No es un consuelo, porque el costo que se paga en términos de libertades, de regresiones autoritarias, es muy alto”.

Nicolás Giacobone cree que la reacción que ha tenido el mundo literario ante lo sucedido en Argentina es porque “no se puede creer” que pase algo así. “Hay que estar atentos, está bien reaccionar, pero tengo la esperanza de que no sean más que palabras para generar reacciones, ruptura, y que no sea más que eso, que no llegue a ser una ley que implique censura sólida”. El argentino, guionista de la galardonada película Birdman, agrega: “Sucede porque evidentemente la política se dio cuenta de que le sirve para conectar con una sección de la sociedad que es mucho más grande de lo que pensábamos a lo que era”.

Clement teme que la consecuencia de esta persecución acabe siendo la autocensura, incluso de manera inconsciente. Lo que sucede en estas situaciones es que las escritoras mismas se empiezan a censurar y eso es terrible”, afirma. Moreno Durán no comparte esa idea. “Esto revela una ignorancia absoluta por parte de los políticos en el poder, porque la literatura es indestructible”, dice, “cuanto más censuren, lejos de conseguir que nos autocensuremos, nos encontraran en frente con la palabra y los libros como armas”

lunes, 2 de diciembre de 2024

U.S.A.: Isabel Allende, García Márquez, García Lorca y Poniatowska entran a la lista negra de libros censurados

Publicado en El País
mas-de-10000-libros-han-sido-prohibidos-en-bibliotecas-publicas-y-academicas-de-estados-unidos.html

Más de 10.000 libros han sido prohibidos en bibliotecas públicas y académicas de Estados Unidos

La cifra de títulos censurados se triplicó en tan solo un año desde los 3.500, según la investigación de la organización PEN América

José Luis Ávila

27 NOV 2024 - 22:00ACTUALIZADO:28 nov 2024

Las prohibiciones de libros están creciendo a niveles preocupantes. En el curso escolar 2023-2024, los casos pasaron de 3.362 a más de 10.000, según el reporte de PEN America, una organización que defiende los derechos humanos y la libertad de expresión con foco en el acceso a la literatura. A la cabeza de las restricciones se encuentran Florida y Iowa, con alrededor de 8.000 prohibiciones derivadas de leyes estatales. Distritos escolares de otros Estados también limitaron un mayor número de libros este año, como Elkhorn en Wisconsin, con un veto de 300 títulos en solo unos meses.

Las cifras presentadas en el estudio podrían ser inferiores a las reales porque prohibiciones de este tipo no suelen ser denunciadas. Tampoco se incluyen las numerosas denuncias de censura blanda, como las restricciones por motivos ideológicos en la compra de libros por parte de los centros escolares, la retirada de colecciones de las aulas y la cancelación de visitas de ciertos autores y otras actividades vinculadas con la promoción de la lectura.

“Siguiendo las tendencias de años anteriores, las prohibiciones de
este último año incluyen de forma abrumadora historias con personas
o personajes de color y personas LGBTQ+. También observamos cómo
los casos de prohibición de libros se dirigen cada vez más a historias
sobre mujeres y niñas que incluyen representaciones de violaciones
o abusos sexuales”, se puede leer en el informe de PEN America.

Como en los últimos años, hay dos factores claves detrás de este
movimiento: la legislación estatal y la influencia de grupos
conservadores. “Las campañas coordinadas de una minoría de grupos
y actores individuales ejercen una presión indebida sobre los consejos
escolares y los distritos, lo que se traduce en la toma de decisiones
excesivamente cautelosas con respecto a la accesibilidad de los
libros en las bibliotecas de las escuelas públicas. Los ataques a
la literatura en las escuelas persisten a pesar de la impopularidad
de estos grupos que defienden los derechos de los padres y de
las encuestas que muestran una amplia oposición a la prohibición
de libros”, sostiene la investigación.

Este 2024, la legislación estatal también ha sido especialmente decisiva
en esta problemática. La ley SF 496 de Iowa, que entró en vigor en
julio de 2023, prohíbe los libros con cualquier contenido relacionado
con el sexo, y posee disposiciones similares a la ley de Florida,
que impide decir la palabra “gay” en las aulas. En este sentido,
la ley HB 1069 de Florida creó un proceso estatutario para la
prohibición de libros, y demanda que cualquier libro impugnado
por conducta sexual sea retirado de la biblioteca durante el proceso
de revisión.

Utah también aprobó este año la ley de prohibición de libros
más extrema actualmente en vigor (la HB 29), que impone lo que
PEN America ha denominado una lista negra de libros en las
escuelas de todo el Estado, y Carolina del Sur votó a favor del
Reglamento 43-170 este verano, que veta los libros de contenido
sexual y otorga al consejo de educación estatal la facultad de
retirar títulos de escuelas y bibliotecas públicas. Por último,
Tennessee amplió la Ley de Materiales Adecuados a la Edad de 2022,
y pide el retiro de libros que contengan desnudos, exceso de violencia
o describan actos sexuales. Además, faculta a una comisión estatal
para evaluar determinados títulos cuestionados.

Autores en la lista negra

Los esfuerzos por suprimir el derecho a lectura sigue afectando a
un amplio rango de libros y autores. Desde novelas clásicas hasta
historias para jóvenes, el Índice de Prohibiciones de Libros Escolares
de PEN América incluye este año a libros como Raíces:
La saga de una familia americana, de Alex Haley;
Un árbol crece en Brooklyn, de Betty Smith; Reconstrucción negra
en América, 1860-1880 de W.E.B. DuBois; Muerte en el Nilo, de
Agatha Christie; La mujer del dios de la cocina, de Amy Tan;
Cómo las chicas García perdieron su acento, de Julia Álvarez;
Buscando a Junie Kim de Ellen Oh; Cuéntalo en la montaña,
de James Baldwin; El verano pródigo, de Barbara Kingsolver;
Puddin, de Julie Murphy; Blade Runner (Sueñan los androides
con ovejas eléctricas), de Philip K. Dick; y Cold Sassy Tree de
Olive Ann Burns.

Los escritores iberoamericanos tampoco se salvan. La casa de los
espíritus y Más allá del invierno de Isabel Allende; Crónica
de una muerte anunciada, El amor en los tiempos del cólera y
Cien años de Soledad de Gabriel García Márquez; La maravillosa
vida breve de Óscar Wao de Junot Díaz; La casa de Bernarda Alba
de Federico García Lorca, y Tinísima de Elena Poniatowska, están
vetados en condados de Florida como Orange y Escambia.

Muchos de los libros prohibidos durante este año escolar han
estado en el punto de mira desde el inicio del movimiento
de prohibición de libros en 2021, como El color púrpura, de Alice Walker;
Diecinueve minutos, de Jodi Picoult; y El ojo más azul
y Beloved, de Toni Morrison. Los catálogos de Sarah J. Maas,
Stephen King y Ellen Hopkins siguen bajo el efecto Letra escarlata
que se ha extendido por todo Estados Unidos. Incluso Wicked:
Memorias de una bruja mala
(Wicked: The Life and Times of the Wicked Witch of the West),
de Gregory Maguire, el libro que inspiró
la exitosa adaptación cinematográfica
actualmente en los cines, se salvó.
Ha sido prohibido en 32 distritos escolares de todo el país.

martes, 19 de noviembre de 2024

La editorial HarperCollins vende las obras de sus autores a empresa de IA

Publicado en blog Universo abierto
https://universoabierto.org/2024/11/19/harpercollins-confirma-que-tiene-un-acuerdo-para-vender-las-obras-de-sus-autores-a-una-empresa-de-ia/

HarperCollins confirma que tiene un acuerdo para vender las obras de sus autores a una empresa de IA

Cole ·, Samantha. 2024. «HarperCollins Confirms It Has a Deal to Sell Authors’ Work to AI Company». 404 Media. 18 de noviembre de 2024. https://www.404media.co/harpercollins-ai-deal/.

HarperCollins, una de las editoriales más grandes del mundo, ha confirmado un acuerdo con una empresa de tecnología de inteligencia artificial (IA) para permitir el uso limitado de ciertos títulos de no ficción de su catálogo para entrenar modelos de IA. La participación de los autores en este acuerdo es opcional; ellos pueden decidir si aceptan o rechazan la propuesta.

Según un portavoz de HarperCollins, este convenio busca mejorar la calidad y el rendimiento de los modelos de IA y cuenta con restricciones claras para respetar los derechos de los autores. La editorial enfatiza que su objetivo es proteger el valor inherente de las obras de sus autores y garantizar el flujo compartido de ingresos y regalías. Además, destaca su larga tradición de innovación y exploración de nuevos modelos de negocio.

El acuerdo contempla el pago de 2.500$ por título a los autores que opten por participar, una cantidad que no es negociable. Este ofrecimiento ha generado debate, especialmente en relación con el uso de materiales protegidos por derechos de autor en el entrenamiento de modelos de IA.

Daniel Kibblesmith, autor del libro infantil Santa’s Husband, compartió en la red social Bluesky un correo de su agente que describe la propuesta de HarperCollins. En el mensaje, su agente menciona las controversias alrededor del uso de materiales con derechos de autor para entrenar IA, destacando que muchas empresas lo hacen sin reconocer ni compensar a los creadores originales. También se alude al temor de que estos modelos puedan hacer obsoletos a los autores en el futuro.

Kibblesmith criticó la decisión de HarperCollins, calificándola como una búsqueda desesperada de ganancias a corto plazo. Señaló que este desarrollo podría dividir el mercado en dos tipos de lectores: aquellos que buscan una conexión humana auténtica a través de los libros y aquellos que prefieren contenido personalizado y generado por IA, diseñado para evitar cualquier desafío intelectual.

El uso de obras protegidas por derechos de autor para entrenar IA ha sido un tema polémico. Numerosas empresas han sido acusadas de aprovecharse de materiales sin compensar a sus creadores. Este acuerdo de HarperCollins es una de las primeras instancias donde una gran editorial propone explícitamente un trato transparente y compensatorio, aunque limitado, para el uso de este tipo de contenido.

En general, el tema pone de relieve las tensiones entre la innovación tecnológica y la preservación del valor del trabajo creativo humano, planteando preguntas sobre el futuro de los derechos de autor y la sostenibilidad de las profesiones creativas en la era de la IA.

viernes, 20 de septiembre de 2024

Las editoriales académicas y la IA no tienen por qué ser enemigas

Publicado en THE Times Higher Education
https://www.timeshighereducation.com/blog/academic-publishers-and-ai-do-not-need-be-enemies

Las editoriales académicas y la IA no tienen por qué ser enemigas

Según David Clark, de Oxford University Press, las empresas de IA generativa deberían dejar de estafar a las editoriales y colaborar con ellas para enriquecer el saber académico.

4 de abril de 2024

David Clark

Twitter: @DavidClarkOUP

Miedo, desesperación, optimismo, ansiedad: durante gran parte del último año, se ha hecho referencia a todas estas emociones y más cuando se ha mencionado la IA generativa.

Sabemos que esta tecnología, impulsada por grandes modelos lingüísticos, dará forma a todo nuestro futuro, sobre todo como herramienta para el descubrimiento y la recuperación de conocimientos. Puede parecer que no está en nuestras manos, pero las editoriales académicas y los investigadores con los que colaboramos nos encontramos en una encrucijada: ¿nos resistimos o nos comprometemos?

A principios de este mes, la Publishers Association, la organización que agrupa a los editores del Reino Unido, escribió una carta a las empresas tecnológicas para expresar nuestra preocupación por el uso de obras protegidas por derechos de autor en la formación, el desarrollo y el funcionamiento de modelos de IA. En ella se subraya que «no autorizamos ni concedemos permiso para el uso de ninguna de sus obras protegidas por derechos de autor en relación con, sin limitación, la formación, el desarrollo o el funcionamiento de modelos de inteligencia artificial, incluidos los grandes modelos lingüísticos u otros productos de inteligencia artificial generativa». En resumidas cuentas, no estamos dispuestos a permitir que se utilicen las obras que hemos publicado, el trabajo de investigadores y autores de todo el mundo que se han esforzado mucho, a menos que se hayan acordado las licencias adecuadas.

Pero no se trata de resistirse a la IA generativa y a lo que puede ofrecer. Es una petición de compromiso, y de compromiso de buena fe.

La experiencia nos dice que no debemos quedarnos al margen en este momento. Del mismo modo que Google y otros motores de búsqueda se han convertido en la forma principal en que la mayoría de los académicos recuperan la literatura académica, y las editoriales académicas se han comprometido con ellos para que esto suceda, los grandes modelos lingüísticos crearán las herramientas que permitirán a los académicos y estudiantes acceder y comprender los últimos avances en la investigación.

Pero la forma en que permitimos que la IA dé forma al futuro de las comunicaciones académicas debe estar guiada por el conocimiento, la comprensión de las percepciones, las preocupaciones y las oportunidades potenciales para la comunidad académica. En Oxford University Press estamos realizando una encuesta entre los investigadores académicos para comprender mejor el impacto de la tecnología de IA en el proceso de investigación. Necesitamos conocer las experiencias de todo el espectro investigador, ya se trate de investigadores noveles o consolidados, de diferentes disciplinas y áreas temáticas, o de distintos países e idiomas. Comprender cómo se relacionan los estudiantes, investigadores y bibliotecarios con las tecnologías de IA generativa será fundamental para entender cómo debemos relacionarnos con estas tecnologías y con las empresas que las desarrollan.

Hay, por supuesto, buenas razones para preocuparse. Como se afirma en la carta de la Asociación de Editores, los editores de todo el sector son conscientes del uso de «enormes cantidades de obras protegidas por derechos de autor sin la autorización del titular de los derechos en el entrenamiento, desarrollo y funcionamiento de modelos de IA». El riesgo para los editores y, fundamentalmente, para los autores de la investigación es el poder potencial de las tecnologías de IA para absorber, retener y reutilizar el conocimiento. Frente a estos riesgos, los editores están equilibrando la necesidad de adaptarse -y rápidamente- a este nuevo mundo, con la necesidad de garantizar que el material publicado no se pase por alto como fuente crítica de conocimiento ni se tome simplemente sin la debida autorización, remuneración y atribución.

Los editores y autores académicos tienen la responsabilidad de desempeñar un papel activo en el cambio del paradigma del conocimiento y, al hacerlo, crear la oportunidad de preservar el ecosistema que sustenta el mundo académico y la propiedad intelectual que lo sostiene. Una de las principales oportunidades es garantizar que la IA generativa respete la autoría y la propiedad intelectual, descubra contenidos y remita a los usuarios a las fuentes originales o primarias, y no fomente el plagio intencionado o no.

La política recientemente propuesta para que las monografías estén disponibles gratuitamente bajo licencias de acceso abierto en un plazo de dos años a partir de su publicación, como parte de los requisitos del Marco de Excelencia en Investigación del Reino Unido, también plantea cuestiones críticas sobre la intersección de la IA y el acceso abierto para la comunidad académica. Poner los libros a disposición del acceso abierto bajo licencias Creative Commons Attribution (CC BY) entraña el riesgo de permitir usos comerciales generativos de IA de esas obras con escasas salvaguardias o recompensas para los autores.

No está claro, por ejemplo, cómo se puede atribuir adecuadamente a los autores su trabajo en un entorno de IA generativa. Abogamos firmemente por una relación de trabajo más amplia entre las empresas tecnológicas y los editores que se centre en los principios fundamentales de autorización y atribución, sea cual sea el modelo de publicación mediante el que se ponga a disposición la investigación.

Con el tiempo, surgirán nuevos usos de la IA generativa que impulsarán nuevas formas de utilizar los contenidos. Esto dará lugar a nuevos usos de la erudición y a la propia erudición, así como a nuevas oportunidades de financiación. Si las futuras tecnologías de IA se desarrollan en colaboración con editores, investigadores y autores, se obtendrán herramientas mejores, más sostenibles y menos sesgadas, que a su vez se utilizarán para mejorar los resultados de la investigación. Un resultado beneficioso para todos.

David Clark es director general de la División Académica de Oxford University Press.

**********************

Academic publishers and AI do not need to be enemiesGenerative AI firms should stop ripping off publishers and instead work with them to enrich scholarship, says Oxford University Press’ David Clark

April 4, 2024

David Clark

Twitter: @DavidClarkOUP

Fear, despair, optimism, anxiety – for much of the last year, all these emotions and more have been referenced when generative AI has been mentioned.

We know that this technology, driven by large language models, will shape all our futures, not least as a tool for the discovery and retrieval of knowledge. This might feel like it is out of our hands but scholarly publishers, and the researchers we partner with, are at a crossroads – do we resist or do we engage?

Earlier this month, the Publishers Association, the member organisation for UK publishers, wrote a letter to technology companies to express our concerns about the use of copyrighted works in the training, development and operation of AI models. It underlined that we “do not outside of any agreed licensing arrangements to the contrary, authorise or otherwise grant permission for the use of any of their copyright-protected works in relation to, without limitation, the training, development or operation of AI models including large language models or other generative AI products”. The bottom line is that we are not willing to let the works we have published, the work of hard-working researchers and authors across the world, be used unless appropriate licences have been agreed.

But this is not about resisting generative AI and what it can offer. This is a request to engage, and to engage in good faith.

Experience tells us that we should not stand aside in this moment. Much as Google and other search engines have become the leading way in which most scholars retrieve academic literature, and academic publishers have engaged with them to make that happen, large language models will create the tools that enable scholars and students to access and understand the latest developments in research.

But how we allow AI to shape the future of scholarly communications must be insight-led, understanding the perceptions, concerns and potential opportunities for the scholarly community. At Oxford University Press, we are currently holding a survey of academic researchers to better understand the impacts of AI technology throughout the research process. We need to understand experiences across the research spectrum, be that early-career or established researchers, different disciplines and subject areas, or different countries and languages. Understanding how students, researchers and librarians engage with generative AI technologies will be critical to understanding how we should engage with these technologies and the companies developing them.

There are, of course, good reasons to be concerned. As stated in the Publishers Association’s letter, publishers across the industry are aware of the use of “vast amounts of copyright-protected works without the authorisation of the right holder in the training, development, and operation of AI models”. The risk for publishers and, fundamentally, for research authors is the potential power of AI technologies to absorb, retain and re-use knowledge. Against these risks, publishers are balancing the need to adapt – and quickly – to this new world, with the need to ensure that published material is neither overlooked as a critical source of knowledge nor simply taken without appropriate authorisation, remuneration and attribution.

Scholarly publishers and authors have a responsibility to play an active role in how the knowledge paradigm shifts and, in doing so, create the opportunity to preserve the ecosystem that supports academia and the intellectual property which sustains it. Chief among the opportunities is the chance to ensure that generative AI respects authorship and intellectual property, discovers content and refers users to the original or primary sources, and does not encourage intentional or unintentional plagiarism.

The recently proposed policy for monographs to be made freely available under open-access licences within two years of publication as part of the requirements for the UK’s Research Excellence Framework also raises critical questions about the intersection of AI and open access for the scholarly community. Making books available for open access under Creative Commons Attribution (CC BY) licences risks enabling commercial generative AI uses of those works with limited safeguards or recompense for authors.

It is unclear, for example, how authors can be properly attributed for their work within a generative AI environment. We advocate strongly for a broader working relationship between technology companies and publishers that centres on the core principles of authorisation and attribution, whatever the publishing model by which research is made available.

Over time, new uses of generative AI will emerge, driving new ways of using content. This will lead to new uses of scholarship and new scholarship itself, as well as new funding opportunities. If future AI technologies are developed working with publishers, researchers and authors, it will lead to better, more sustainable and less biased tools, which will in turn be used to create improved research outcomes. A winning outcome for all.

David Clark is managing director of Oxford University Press’ Academic Division.

Boletín SciELO-México

jueves, 13 de febrero de 2025

Cerficación de autoría humana no-IA para libros [ Authors Guild: certificación «Human Authored» ]

martes, 21 de enero de 2025

¿Ladrón que roba a ladrón tiene 100 años de perdón? Meta de Zuckerberg se piratea los libros de LibGen

Zuckerberg approved Meta’s use of ‘pirated’ books to train AI models, authors claim

jueves, 5 de diciembre de 2024

ARGENTINA: critican la censura de libros en la FIL-Guadalajara

lunes, 2 de diciembre de 2024

U.S.A.: Isabel Allende, García Márquez, García Lorca y Poniatowska entran a la lista negra de libros censurados

martes, 19 de noviembre de 2024

La editorial HarperCollins vende las obras de sus autores a empresa de IA

viernes, 20 de septiembre de 2024

Las editoriales académicas y la IA no tienen por qué ser enemigas

Admón. Trump desfondó al índice ERIC (el más importante en Educación) / Clarivate lo rescata a través de ProQuest

Denunciar abuso

Etiquetas