Mostrando entradas con la etiqueta OpenAI. Mostrar todas las entradas
Mostrando entradas con la etiqueta OpenAI. Mostrar todas las entradas

viernes, 12 de enero de 2024

OpenAI asegura que es imposible crear una Inteligencia Artificial como ChatGPT sin infringir 'los derechos de autor'

Publicado en elEconomista.es
https://www.eleconomista.es/tecnologia/noticias/12613903/01/24/openai-asegura-que-es-imposible-crear-una-inteligencia-artificial-como-chatgpt-sin-infringir-los-derechos-de-autor.html


OpenAI asegura que es imposible crear una Inteligencia Artificial como ChatGPT sin infringir 'los derechos de autor'

Artistas y autores de todo el mundo denuncian un "robo sistemático a escala masiva"
  • El "boom" de la IA ha sido tan grande y rápido que no estamos preparados para afrontar los problemas que surgen


8/01/2024 - 16:16

Tener que sacrificar algo para conseguir otra cosa es un principio que se puede aplicar a prácticamente cualquier aspecto de la vida, y es que como dice el dicho, quien algo quiere algo cuesta. En Inteligencia Artificial pasa lo mismo, o por lo menos eso es lo que aseguran desde la compañía líder de este sector, OpenAI.


La Inteligencia Artificial (IA) son programas informáticos que ejecutan operaciones y tareas comparables a las que realiza la mente humana en lo que se refiere al aprendizaje o uso de la lógica. Y al igual que una persona necesita ser formada y educada para poder hacer cualquier labor o acción, que va desde andar, leer, sumar hasta aprender a programar, las máquinas también lo necesitan.

De hecho, cada día que pasa la IA se hace más inteligente, ya que con el uso que hacen los usuarios de ella, sea para lo que sea, está aprendiendo y extendiendo sus conocimientos. Sin embargo, esta forma de aprender a chocado de frente con el principio de los derechos de autor, debido a que las compañías de IA no están dando el reconocimiento a los autores por entrenar a sus máquinas con sus obras, imágenes y demás archivos.

Fue el mes pasado cuando el New York Times denunció a OpenAI y a Microsoft por usar sus publicaciones para formar a ChatGPT, acusándoles de "uso ilícito" de su trabajo para crear sus productos. La compañía fundada por Sam Altman, no ha negado que usasen los artículos de este medio para entrenar a su IA, pero tal y como han alegado a la Comisión de Comunicaciones y Asuntos Digitales de la Cámara de los Loresde no hacerlo habría sido "imposible" crear una IA con el nivel que tiene ChatGPT.

"Dado que los derechos de autor cubren hoy prácticamente todo tipo de expresión humana -incluidas entradas de blog, fotografías, mensajes de foros, fragmentos de código de software y documentos gubernamentales-, sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor". defienden desde OpenAI.

La compañía aseguró que "limitar los datos de entrenamiento a libros y dibujos de dominio público creados hace más de un siglo podría dar lugar a un experimento interesante, pero no proporcionaría sistemas de IA que satisfagan las necesidades de los ciudadanos de hoy." defendiendo la necesidad de usar todos los contenidos disponibles sin importar a quién pertenecen.

OpenAI asegura que respeta "los derechos de los creadores y propietarios de contenidos", sin embargo cree que la ley de 'copyright' y derechos de autor no prohíbe "el entrenamiento", como se denomina la formación de la IA.

Con tantos y tan rápidos avances en IA, se están generando una cantidad de problemas al que ni compañías ni gobiernos están preparados o si quiera mentalizados para solucionar. OpenAI asegura que estos entrenamientos tan solo suponen un ejemplo entre mil otros, mientras que cada vez más autores, artistas y demás creadores denuncian que la IA se está apropiando de sus publicaciones y no están ganando nada a cambio, ejerciendo un "robo sistemático a escala masiva".

martes, 25 de abril de 2023

ALEMANIA se une a la lista de países contra ChatGPT

Publicado en Xataka
https://www.xataka.com/robotica-e-ia/sume-sigue-alemania-se-une-a-lista-paises-chatgpt-no-cumplir-proteccion-datos?utm_source=twitter&utm_medium=social&utm_campaign=botoneramobile_AMP



OpenAI tiene un problema en Europa: Alemania se une a la lista de países contra ChatGPT

ENRIQUE PÉREZ
@Lyzanor

OpenAI tiene un problema en Europa. Tras la decisión de Italia y España, ahora se une Alemania. El organismo regulador alemán ha decidido una investigación sobre OpenAI y ChatGPT, por una posible infracción del Reglamento General de Protección de Datos. Y el problema es que parece claro que OpenAI no está haciendo las cosas bien.

Alemania también quiere explicaciones. Ha sido Marit Hansen, comisaria del estado de Schleswig-Holstein, quien ha verbalizado la posición de Alemania: "queremos saber si se ha llevado a cabo una evaluación de impacto de la protección de datos y si los riesgos de protección de datos están bajo control".

De manera paralela, Hansen explica que Alemania ha pedido "información sobre cuestiones derivadas del Reglamento General Europeo de Protección de Datos" a OpenAI. Es decir, han solicitado respuesta ante múltiples cuestiones que siguen sin respuesta y que podrían ser indicio de una ilegalidad.

Sin bloqueo por el momento. Al contrario que en Italia, donde OpenAI decidió paralizar el servicio. En Alemania todavía sigue funcionando ChatGPT. Esta semana OpenAI ha recibido la notificación por parte de las autoridades alemanas y habrá que ver cuál es el paso que toma la compañía.

Se trata de un proceso equivalente al que tomó Francia, donde solicitó a OpenAI cinco peticiones.

Hasta el 11 de junio. Es la fecha marcada por Alemania. Hasta el 11 de junio, OpenAI tiene de margen para responder a las peticiones de la agencia alemana, donde ha solicitado que describa cómo se están utilizando los datos de los europeos y cómo pueden estos modificar sus datos en caso de que haya algún tipo de error.

Tenemos una fecha con más margen que en Italia, que ha dado hasta este 30 de abril. Si OpenAI responde, podrá volver a Italia. De lo contrario, quedará prohibida. Algo similar podría ocurrir en Alemania.

Ulrich Kelber, responsable de protección de datos de Alemania, ha explicado que un bloqueo a ChatHPT es muy posible.

Y falta la Unión Europea. Los distintos países están tomando la delantera a la hora de solicitar exigencias a OpenAI. No son los únicos, pues desde el 'European Data Protection Board' ya se está estudiando cuál es el paso a seguir.

Según explican distintos expertos a Xataka, lo más probable es que desde Europa se plantee otra fecha y múltiples exigencias, previsiblemente con varios niveles. Unos más urgentes de aplicación inmediata si quieren seguir funcionando y otros a aplicar con algo más de margen.

OpenAI tiene que mover ficha ya. Todas las miradas están puestas en OpenAI, de quienes se espera que hagan algún tipo de anuncio oficial próximamente. Se desconoce si llegará a tiempo al margen dado por Italia o si decidirán ver cuánto tiempo les permite la Unión Europea.

Lo que sí parece claro por la posición de las distintas agencias es que ChatGPT incumple el Reglamento General de Protección de Datos. En sus manos está remediarlo.

martes, 18 de abril de 2023

ChatGPT usa millones de textos que tienen copyright

Publicado en Xataka
https://www.xataka.com/robotica-e-ia/openai-ha-usado-millones-textos-para-entrenar-a-chatgpt-problema-que-muchos-ellos-tienen-copyright




OpenAI ha usado millones de textos para entrenar a ChatGPT. El problema es que muchos de ellos tienen copyright

14 Abril 2023
JAVIER PASTOR
@javipas


ChatGPT fue entrenado con una enorme cantidad de datos obtenidos de internet. No solo sitios web, sino artículos, libros, publicaciones en redes sociales o estudios académicos. El modelo de IA conversacional creado por OpenIA no tenía en cuenta la procedencia de los datos: solo veía el texto y aprendía patrones y relaciones entre palabras, frases o párrafos. ¿El problema? Que la inmensa mayoría de esos textos probablemente está protegidos por copyright. ¿Violan OpenAI y ChatGPT los derechos de autor?

¿Hubo copia de contenidos durante el entrenamiento? No hay información sobre si durante el proceso de entrenamiento, los textos usados por ChatGPT se copiaron o solo se referenciaron. Al preguntar a ChatGPT la respuesta es singular:

Durante el proceso de entrenamiento, se utiliza texto de diversas fuentes para entrenar el modelo ChatGPT. Es probable que el texto se copiara en una base de datos interna de OpenAI con el fin de entrenar el modelo. Sin embargo, el texto de entrenamiento se suele preprocesar para eliminar cualquier información sensible, como identificadores personales, texto protegido por derechos de autor, etc. Además, el texto también se utiliza para entrenar el modelo y no se almacena en una base de datos. El modelo utiliza el texto para aprender patrones y la estructura del lenguaje y, una vez terminado el entrenamiento, ya no necesita el texto.

A pesar de lo que indica ChatGPT, no es probable que se eliminara texto protegido por derechos de autor, ya que la mayor parte de su conjunto de entrenamiento es este tipo de contenido, como se puede comprobar al tratar de que ChatGPT imite cierto estilo o 

¿Es la salida de ChatGPT una obra derivada? Según la Ley de Propiedad Intelectual, la obra derivada puede ser una modificación, adaptación o transformación de una obra existente, donde se garantizan los derechos de autor de la obra originaria. Los expertos indican que todo el texto generado por ChatGPT podría considerarse como una obra derivada.

Uso justo. Otro de los conceptos que se manejan en este ámbito es si OpenAI hace un uso justo o legítimo (fair use). Aun suponiendo que durante el proceso de entrenamiento de ChatGPT se copió texto y que lo generado es una obra derivada de ese texto protegido por el copyright, ¿se podría considerar que ChatGPT hace un uso legítimo de esos contenidos? Teniendo en cuenta que este modelo mezcla contenidos de todo tipo de obras, parece que no hay aquí un uso injustificado. Podría haber, eso sí, escenarios en los que se pueden infringir los derechos de autor si por ejemplo le pidiéramos a un motor basado en ChatGPT que nos escribiese la próxima novela de Harry Potter como si fuera J. K. Rowling. En ese caso, si además el fin es comercial, podría haber violación de esos términos legales.

Ya ha habido demandas. La amenaza de demandas legales es evidente para OpenAIdesde que lanzaron este tipo de productos. De hecho la empresa ha sido demandada junto a Microsoft y GitHub por violar la ley del copyright en GitHub Copilot, y también lo fueron posteriormente Stable Diffusion y Midjourney. Tanto Copilot como esas plataformas fueron entrenadas con copias no autorizadas de código o imágenes.

Ni siquiera atribuyen. Según OpenAI, el sistema en el que se basa GitHub Copilot es Codex, que "fue entrenado con decenas de millones de repositorios públicos", incluyendo código del propio GitHub. El problema, como indican en OnMSFT, es que los repos que se utilizaron suelen usar una licencia que requiere atribución cuando se usa el código de esos repositorios. Según Microsoft este es un uso justo del código, pero para programadores como Matthew Butterick está "borrando tu comunidad Open-Source".

Y mucho menos pagar. Hay otro problema aquí, y es que por ejemplo algunos medios de comunicación como The Wall Street Journal o la CNN han exigido que ya que ChatGPT hace uso de sus contenidos como parte de su entrenamiento, OpenAI debe licenciar los derechos para hacerlo adecuadamente. O lo que es lo msmo, pagar.

Bing con ChatGPT al menos da referencias. El problema de Copilot afecta desde luego a Stable Diffusion, Midjourney o DALL-E 2 en el ámbito de las imágenes, y por eso se han impulsado también demandas como lade Getty. Entre las soluciones está la atribución, y aquí tenemos un buen ejemplo en Bing con ChatGPT, que cuando contesta a nuestras preguntas a menudo ofrece referencias de las fuentes en las que se basa, algo que ChatGPT no hace.

Antes fue el copyright, ahora la privacidad. A ChatGPT le están creciendo los enanos, sobre todo porque además de los potenciales problemas por esa forma indiscriminada de entrenar sus modelos, ahora se enfrenta a problemas por sus políticas de privacidad. En concreto, por la forma en la que recolecta datos de los usuarios y si eso puede estar violando el RGPD. Italia ya ha prohibido el uso de ChatGPT por esa razón —aunque ya ha explicado cómo puede levantar la prohibición—, y España y Europa están investigando precisamente si seguir ese ejemplo.


viernes, 27 de enero de 2023

En sólo 5 días, Chat GPT-3 consiguió un millón de usuarios

Publicado en La Jornada
https://www.jornada.com.mx/2023/01/27/economia/014n1eco


En sólo 5 días, Chat GPT-3 consiguió un millón de usuarios

La aplicación causa revuelo en las instituciones educativas de todo el mundo y obligará a cambiar la forma de las evaluaciones.

Julio Gutiérrez
 
Periódico La Jornada
Viernes 27 de enero de 2023, p. 14

Chat GPT-3, una plataforma de inteligencia artificial capaz de escribir artículos que parecen hechos por un humano, consiguió en cinco días un millón de usuarios registrados, algo que a otras grandes firmas tecnológicas les llevó más de dos años.

Según un informe publicado por el portal australiano Financial Review, a Netflix le tomó 40 meses alcanzar esa cifra; a Twitter, 24 meses; a Facebook, 10, y a Instagram, tres meses.

Generative Pre-trained Transformer 3, mejor conocido como Chat GPT-3, es una plataforma de inteligencia artificial que redacta textos. Funciona con un algoritmo de 175 mil millones de parámetros que tienen la capacidad de descifrar cuál sería la siguiente palabra a utilizar por una persona a la hora de escribir.

La plataforma ha llamado la atención en días recientes debido a que resulta casi imposible de descifrar si un texto, artículo o ensayo estudiantil ha sido escrito por una persona o por medio de esta aplicación.

El fenómeno ha llegado a tal grado que, por ejemplo, una investigación realizada por un profesor de la Universidad de Pensilvania, Estados Unidos, reveló que Chat GPT-3 aprobó un examen final de una maestría en administración de negocios con una puntuación de B.

La aplicación tiene una capacidad notable de aumentar algunas de las habilidades de los trabajadores, y específicamente de los empleados en los puestos que ocupan los graduados de la maestría, incluidos analistas, gerentes y consultores, dijo Christian Terwiesch, autor de la investigación y profesor de la universidad.

¿Cómo funciona?

Chat GPT-3 fue inventado por la firma OpenAI. Su primera versión fue lanzada en 2018 y tenía 117 millones de parámetros. La segunda en 2019 y contaba con 1.5 mil millones y esta última entrega se lanzó a inicios de este 2023.

Funciona mediante un algoritmo de aprendizaje que se basa en probabilidades, es decir, puede descifrar cuál será la siguiente palabra que alguien utilizaría en una oración. Toma una parte del lenguaje del usuario y lo transforma; por ejemplo, el usuario escribe “tengo ganas de tomar…” y la plataforma descifra qué sería lo siguiente a escribir según el contexto.

También predice el comienzo de una oración o la longitud que debería tener un texto o una frase solicitada. Los algoritmos recibieron un total de 570 gigas de información de texto.

Para utilizarlo, el usuario solamente debe crear una sesión en su plataforma y, literalmente, solicitar a la aplicación que escriba un texto sobre los dinosaurios.

El fenómeno es tan grande que Microsoft ha anunciado que hará una tercera inversión a OpenAI para continuar con el desarrollo, mientras empresas como Buzzfeed analizan la posibilidad de dejar de contratar redactores y utilizar GPT-3 para escribir sus artículos.

Aunque la innovación impresiona, analistas y profesores o catedráticos dudan de los beneficios que ésta pueda tener, ya que sería difícil descifrar si un alumno o algún trabajador escribió y adquirió los conocimientos necesarios.


Plan 2.0 para el acceso abierto: ¿un plan o una nueva ambigüedad?

Publicado en THE Times Higher Education https://www.timeshighereducation.com/news/plan-s-20-open-access-plan-bold-may-prove-ineffective   El...