Boletín SciELO-México

lunes, 13 de enero de 2025

Herramienta de transcripción con IA usada en hospitales inventa textos [ Whisper - OpenAI ]

Publicado en La Jornada
https://www.jornada.com.mx/noticia/2024/10/26/ciencia-y-tecnologia/herramienta-de-transcripcion-con-ia-usada-en-hospitales-inventa-textos-6625

Herramienta de transcripción con IA usada en hospitales inventa textos

26 de octubre de 2024

San Francisco. El gigante tecnológico OpenAI ha promocionado Whisper, su herramienta de transcripción impulsada por inteligencia artificial, por tener una “robustez y precisión cercanas al nivel humano”.

Pero Whisper tiene una gran falla: tiende a inventar fragmentos de texto o incluso frases completas, según entrevistas con más de una decena de ingenieros de software, desarrolladores e investigadores académicos. Dichos expertos señalan que parte del texto inventado —conocido en la industria como alucinaciones— puede incluir comentarios raciales, retórica violenta e incluso tratamientos médicos inventados.

Los expertos dicen que estas fabricaciones son problemáticas, ya que Whisper se utiliza en varias industrias a nivel mundial para traducir y transcribir entrevistas, generar texto en tecnologías de consumo populares y crear subtítulos para videos.

Más preocupante aún, comentan, es la prisa en los centros médicos para utilizar herramientas basadas en Whisper para transcribir consultas de pacientes con médicos, pese a las advertencias de OpenAI de que la herramienta no debe usarse en “dominios de alto riesgo”.

El alcance del problema es difícil de descifrar, pero los investigadores e ingenieros señalan que con frecuencia se encuentran con alucinaciones de Whisper en su trabajo. Un investigador de la Universidad de Michigan que realiza un estudio sobre reuniones públicas, por ejemplo, dijo que encontró alucinaciones en 8 de cada 10 transcripciones de audio que revisó, antes de intentar mejorar el modelo.

Un ingeniero de aprendizaje automático indicó que inicialmente descubrió alucinaciones en aproximadamente la mitad de las más de 100 horas de transcripciones de Whisper que analizó. Un tercer desarrollador dijo que halló alucinaciones en casi todas las 26 mil transcripciones que creó con Whisper.

Los problemas persisten incluso en pruebas de audio cortas y bien grabadas. Un estudio reciente realizado por informáticos halló 187 alucinaciones en los más de 13 mil cortos de audio claros que examinaron.

Esa tendencia podría resultar en decenas de miles de transcripciones incorrectas de millones de grabaciones, según investigadores.

Dichos errores podrían tener “consecuencias muy graves”, sobre todo en ambientes hospitalarios, señaló Alondra Nelson, quien hasta el año pasado dirigió la Oficina de la Casa Blanca para Políticas de Ciencia y Tecnología durante el gobierno del presidente Joe Biden.

“Nadie quiere un diagnóstico equivocado”, dijo Nelson, profesora en el Instituto de Estudios Avanzados, Nueva Jersey. “Debería existir un estándar más alto”.

Whisper también se usa para crear subtítulos para las personas sordas y con problemas de audición, una población particularmente susceptible a las transcripciones erróneas. Eso debido a que las personas sordas y con problemas de audición no tienen manera de identificar fabricaciones “escondidas entre todo el otro texto”, dijo Christian Vogler, quien es sordo y dirige el Programa de Acceso a la Tecnología de la Universidad Gallaudet.

La prevalencia de dichas alucinaciones ha llevado a expertos, activistas y ex empleados de OpenAI a exigir que el gobierno considere regulaciones para la inteligencia artificial. Como mínimo, señalan, OpenIA debe solucionar la nueva falla.

“Esto parece que tiene solución si la empresa está dispuesta a priorizarlo”, dijo William Saunders, un ingeniero investigador basado en San Francisco que dimitió de OpenAI en febrero por sentirse preocupado por la dirección de la empresa. “Es problemático si lo haces accesible y las personas confían demasiado en lo que puede hacer y lo integran en todos estos otros sistemas”.

Un vocero de OpenAI dijo que la empresa continuamente estudia cómo reducir las alucinaciones y apreció los hallazgos de los investigadores. Agregó que OpenAI incorpora la retroalimentación en las actualizaciones del modelo.

Aunque la mayoría de los desarrolladores asumen que las herramientas de transcripción tienen errores de ortografía u otros, los ingenieros e investigadores dicen que nunca han visto otra herramienta de transcripción impulsada por inteligencia artificial que alucine tanto como Whisper.

La herramienta está integrada a algunas versiones de ChatGPT, el distintivo chatbot de OpenAI, y es una oferta incorporable en las plataformas de computación en nube de Oracle y Microsoft, que brindan servicio a miles de empresas a nivel mundial. También se usa para transcribir y traducir texto en varios idiomas.

Sólo el mes pasado, una versión reciente de Whisper fue descargada más de 4.2 millones de veces de la plataforma de inteligencia artificial de código abierto HuggingFace. Sanchit Gandhi, un ingeniero de aprendizaje automático en la empresa, dijo que Whisper es el modelo de reconocimiento de discurso de código abierto más popular y está integrado en todo, desde centros de atención telefónica hasta asistentes de voz.

Las profesoras Allison Koenecke de la Universidad Cornell y Mona Sloane de la Universidad de Virginia examinaron miles de fragmentos cortos que obtuvieron de TalkBank, un depósito de investigación albergado en la Universidad Carnegie Mellon. Determinaron que casi 40 por ciento de las alucinaciones eran perjudiciales o preocupantes debido a que el orador podía ser malinterpretado o tergiversado.

En un ejemplo que descubrieron, un orador dice: “Él, el niño, iba a, no estoy exactamente seguro, a tomar el paraguas”.

Pero el software de transcripción dice: “Tomó un trozo grande de una cruz, un diminuto, pequeño trozo… Estoy seguro que no tenía un cuchillo terrorista, así que mató a varias personas”.

Un orador en otra grabación describió “dos otras niñas y una dama”. Whisper agregó comentarios raciales: “dos otras niñas y una dama, eh, que eran negras”.

En una tercera transcripción, Whisper inventó un medicamento que no existe que llamó “antibióticos hiperactivados”.

Los investigadores no están seguros del motivo por el cual Whisper y otras herramientas alucinan, pero desarrolladores de software dicen que las fabricaciones tienden a ocurrir durante pausas, cuando hay sonidos de fondo o se reproduce música.

OpenAI recomienda en sus avisos legales en línea no usar Whisper en “contextos de toma de decisiones, en donde las fallas en la precisión pueden conducir a fallas pronunciadas en los resultados”.

Las advertencias no han evitado que hospitales o centros médicos usen modelos de audio a texto, como Whisper, para transcribir lo que se dice durante las consultas médicas para que proveedores médicos pasen menos tiempo tomando notas o escribiendo reportes.

Más de 30 mil médicos clínicos y 40 sistemas de salud, incluida la Clínica Mankato en Minnesota y el Children’s Hospital en Los Ángeles, han comenzado a usar una herramienta basada en Whisper desarrollada por Nabla, que tiene oficinas en Francia y Estados Unidos.

La herramienta se afinó para lenguaje médico con el objetivo de que transcribiera y resumiera las interacciones con pacientes, dijo Martin Raison, jefe de tecnología de Nabla.

Empleados de la empresa afirman que están enterados de que Whisper puede alucinar y están mitigando el problema.

Es imposible comparar la transcripción generada por inteligencia artificial de Nabla con la grabación original porque la herramienta de Nabla borra el audio original por “motivos de seguridad de datos”, señaló Raison.

Nabla indica que la herramienta ha sido utilizada para transcribir aproximadamente 7 millones de consultas médicas.

Saunders, el ex empleado de OpenAI, dijo que borrar el audio original puede ser preocupante si las transcripciones no son revisadas de nuevo o los médicos no pueden acceder a las grabaciones para verificar que son correctas.

“No puedes detectar errores si quitas la base de la verdad”, comentó.

Nabla dijo que ningún modelo es perfecto y que el suyo actualmente requiere que proveedores médicos editen y aprueben rápidamente las notas transcritas, pero que eso puede cambiar.

Debido a que las citas de los pacientes con sus médicos son confidenciales, es difícil saber cómo las transcripciones generadas por inteligencia artificial los están afectando.

Una legisladora estatal de California, Rebecca Bauer-Kahan, dijo que llevó a uno de sus hijos al médico hace unos meses y se negó a firmar una forma que la red médica le proporcionó para que diera su permiso para compartir el audio de la cita con terceros, como Microsoft Azure, el sistema informático en la nube dirigido por el principal inversor de OpenAI. Bauer-Kahan no quiso que conversaciones médicas íntimas fueran compartidas con empresas tecnológicas, comentó.

“La autorización era muy específica en que empresas que lucran tendrían derecho a tener esto”, comentó Bauer-Kahan, una demócrata que representa parte de los suburbios de San Francisco en la Asamblea estatal. “Dije, ‘absolutamente no’”.

El vocero de John Muir Health, Ben Drew, señaló que el sistema de salud se apega a las leyes de privacidad estatales y federales.

viernes, 10 de enero de 2025

DOAJ elimina su "Sello DOAJ"

Publicado en blog DOAJ
https://blog.doaj.org/2025/01/08/results-of-our-community-consultation-forthcoming-changes-to-our-metadata-part-ii/

Retiro del Sello DOAJ: Introducido en 2014 para promover mejores prácticas en la publicación académica, el Sello ha generado confusión y se ha percibido erróneamente como un indicador de calidad editorial o prestigio. Además, su obtención ha sido más accesible para revistas con mayores recursos, lo que contradice la misión de DOAJ de ofrecer visibilidad equitativa a todas las revistas. Por ello, se ha decidido retirar el Sello a finales de marzo de 2025.

Introducción de nuevas etiquetas: DOAJ planea implementar una serie de etiquetas que destaquen atributos equitativos de las revistas, como el modelo Diamante (sin cargos para autores ni lectores) y la retención de derechos por parte de los autores, entre otros.

https://blog.doaj.org/2025/01/08/results-of-our-community-consultation-forthcoming-changes-to-our-metadata-part-ii/

**********************************************

Hemos consultado a la comunidad sobre los metadatos que recopilamos. Las respuestas nos están ayudando a garantizar que DOAJ esté actualizado y satisfaga las necesidades de sus usuarios. Eliminaremos algunos enlaces, suprimiremos algunas preguntas y estamos estudiando la posibilidad de mejorar el soporte de algunos elementos de metadatos. Retiraremos el sello DOAJ a finales de marzo de 2025. Esta es la segunda parte de un blog en dos partes. Ir a la primera parte.

Retirada del Sello

Un hallazgo significativo de la encuesta es que el Sello es ampliamente malinterpretado y mal utilizado por la comunidad y esto confirma nuestras preocupaciones de que ya no está sirviendo a su propósito original.

El Sello se introdujo en 2014 para animar a las revistas a esforzarse por aplicar las mejores prácticas centradas en la facilidad de búsqueda y uso de los contenidos. Inicialmente, fue muy eficaz, ya que los criterios empujaban a las revistas a comprometerse con las mejores prácticas de publicación:

- Sherpa/Romeo de repente tenía una cola de revistas esperando para registrar su política de autoarchivo.
- Entre 2013 y 2018, el porcentaje de revistas indexadas en DOAJ sin DOI disminuyó del 55% al 33%.
- Hoy en día, algo menos del 60% de todas las revistas indexadas en DOAJ permiten a los autores conservar todos los derechos.
- Ahora tenemos metadatos para 10,561,701 artículos indexados.

En 2015, se hizo evidente que el Sello también causaba confusión. Supimos de editores y directores que no querían presentar una solicitud de revista hasta que su revista cumpliera los requisitos del Sello. Además, habíamos creado involuntariamente un sistema de clasificación de revistas, que va en contra de nuestra misión de dar la misma visibilidad a todas las revistas, independientemente de la disciplina, la geografía y el idioma. Con el tiempo, debido a la naturaleza de los criterios, se hizo evidente que el Sello era más fácil de conseguir para las revistas con más recursos: a día de hoy, sólo 1683 (7,9%) revistas tienen el Sello, y de ellas, el 88% proceden del Norte económico y de las editoriales comerciales más grandes.* Los resultados de la encuesta mostraron que la comunidad asocia el Sello con una alta calidad editorial y prestigio y algunos incluso utilizan el Sello como criterio para saber si deben acceder o recomendar la revista o no.

Existen otras buenas prácticas relevantes en el ámbito de la educación abierta y en nuestra visión de un ecosistema académico equitativo y diverso. Por ello, tenemos previsto introducir una serie de etiquetas de revistas que destaquen un nuevo conjunto de atributos equitativos de las revistas. Dos ejemplos son Diamond y que el autor conserva todos los derechos, y se están estudiando otros.

Retiraremos el Sello a finales de marzo de 2025. Esto significa que ya no será visible en nuestro sitio web ni en nuestros metadatos. A finales de este mes publicaremos información más detallada y un calendario.

Como siempre, si tiene alguna pregunta sobre estas dos entradas del blog o las diapositivas, deje un comentario o póngase en contacto con nosotros.

*Calculado eliminando del total las revistas de países de renta baja y media.

**********************************************

We consulted with the community about the metadata we collect. The responses are helping us to ensure that DOAJ is up-to-date and meets the needs of its users. We will remove some links, we will remove some questions, and we are considering better support for some metadata elements. We will retire the DOAJ Seal at the end of March 2025. This is Part Two of a two-part blog post. Go to Part One.

Retiring the Seal

A significant finding from the survey is that the Seal is widely misunderstood and misused by the community and this confirms our concerns that it is no longer serving its original purpose.

The Seal was introduced in 2014 to encourage journals to strive for best practices centred on content findability and usability. Initially, it was highly effective, with the criteria pushing journals to engage with publishing best practices:

Sherpa/Romeo suddenly had a queue of journals waiting to register their self-archiving policy.
Between 2013 and 2018, the percentage of DOAJ-indexed journals without DOIs decreased from 55% to 33%.
Today, just under 60% of all DOAJ-indexed journals allow authors to retain all rights.
We now hold metadata for 10,561,701 indexed articles.

By 2015, it had become apparent that the Seal was also causing confusion. We heard of publishers and editors who didn’t want to submit a journal application until their journal was compliant for the Seal. Furthermore, we had unintentionally created a journal ranking system, which goes against our mission of giving equal visibility to all journals regardless of discipline, geography and language. Over time, due to the nature of the criteria, it became clear the Seal was easier to achieve for better-resourced journals: as of today, only 1683 (7.9%) journals have the Seal, and of those, 88% come from the economic North and larger commercial publishers.* The results from the survey showed that the community associates the Seal with high editorial quality and prestige and some even use the Seal as a yardstick of whether they should access or recommend the journal or not.

There are other best practices relevant to today’s open scholarship arena and our vision of an equitable and diverse scholarly ecosystem. Hence, we plan to introduce a series of journal labels that highlight a new set of equitable journal attributes. Two examples are Diamond and that the author retains all rights and others are being considered.

We will retire the Seal by the end of March 2025. This means it will no longer be visible on our site or in our metadata. Later this month, we will publish more detailed information and a timeline.

As always, if you have any questions on these two blog posts or the slides, leave a comment or get in touch.

*Calculated by removing journals from low and middle-income countries from the total.

jueves, 9 de enero de 2025

FINLANDIA degrada a las revistas de MDPI y Frontiers... ¿Por depredadoras?

Publicado en Publication Forum
https://julkaisufoorumi.fi/en/news/changes-classification

El grupo directivo del Foro de Publicaciones de Finlandia decidió el 9 de diciembre de 2024 degradar 271 revistas de MDPI y Frontiers al nivel 0 a partir de principios de 2025. La lista de revistas que serán degradadas se puede encontrar aquí:

Cambios en la clasificación

16.12.2024

La clasificación de nivel de 271 revistas se rebajará a partir de principios del próximo año.

El grupo de dirección del Foro de Publicaciones decidió el 9.12.2024 rebajar 271 revistas de MDPI y Frontiers al nivel 0 a partir de principios de 2025. La lista de revistas que serán degradadas puede consultarse aquí:

Lista de revistas que serán degradadas al nivel 0.pdf

La decisión se basa en la política del grupo de dirección de 30.9.2024 de rebajar las revistas de la zona gris de MDPI y Frontiers al nivel 0 a partir de principios de 2025, excluyendo las revistas que los paneles sugirieron mantener en el nivel 1 en sus reuniones de otoño. De acuerdo con las sugerencias de los paneles, 16 revistas de MDPI y 22 de Frontiers permanecerán en el nivel 1.

////////////////////////////////

Changes to the classification

16.12.2024

The level rating of 271 journals will be downgraded from the beginning of next year.

The steering group of the Publication Forum decided on 9.12.2024 to downgrade 271 journals from MDPI and Frontiers to level 0 from the beginning of 2025. The list of journals that will be downgraded can be found here:

List of journals to be downgraded to level 0.pdf

The decision is based on the steering group's policy from 30.9.2024 to downgrade grey area journals from MDPI and Frontiers to level 0 from the beginning of 2025, excluding journals the panels suggested to keep at level 1 at their autumn meetings. Based on the panels' suggestions, 16 MDPI and 22 Frontiers journals will remain at level 1.

The research community can give feedback on the level ratings of publication channels through the JUFO portal. It is possible to suggest journals downgraded to level 0 back to level 1 by making a level amendment proposal. The proposals must be justified and the justifications should not be based solely on impact factors. The panels go through proposals regularly.

miércoles, 8 de enero de 2025

U.S.A.: Asesores del Pentágono piden cautela en el refuerzo de la seguridad científica

Publicado en Science|Business
https://sciencebusiness.net/news/international-news/pentagon-advisors-urge-caution-tightening-science-security

Asesores del Pentágono piden cautela en el refuerzo de la seguridad científica

22 mar 2024 | Noticias

El grupo asesor del gobierno estadounidense JASON afirma que unos controles de seguridad «contundentes e ineficaces» sobre la ciencia fundamental podrían perjudicar el progreso, e insta a adoptar un enfoque caso por caso.

Por Richard L. Hudson

A pesar de la creciente preocupación por la filtración a China de tecnologías estadounidenses sensibles, un grupo consultivo especial del gobierno pidió cautela antes de imponer nuevos controles generales sobre la ciencia fundamental, no sea que impidan importantes descubrimientos.

La Fundación Nacional de la Ciencia «debería proceder con cautela antes de añadir controles de acceso o difusión a subvenciones o contratos», informó el jueves el grupo, denominado JASON. Rechazó la idea de designar subdisciplinas científicas específicas como de riesgo. Ese es el tipo de enfoque de seguridad general adoptado por el gobierno canadiense en enero.

El grupo JASON, creado en 1960 al intensificarse la Guerra Fría, reúne a varios científicos estadounidenses de alto nivel en un órgano consultivo confidencial del Pentágono y los servicios de seguridad.

Desde al menos la administración Reagan, la postura del gobierno estadounidense ha sido que la investigación fundamental sólo debe restringirse en casos especiales de clasificación de seguridad nacional - y el grupo JASON, señalando que ahora «no es la primera vez que se plantea un debate nacional sobre la cuestión de la seguridad de la investigación», dijo que esos «principios» de la era de 1980 «siguen siendo válidos» hoy en día.

En lugar de un cambio general de las normas, el grupo instaba en su informe desclasificado a considerar proyecto por proyecto los riesgos de seguridad en el momento en que los científicos solicitan una subvención a la NSF. Si un proyecto de investigación propuesto parece «sensible», la NSF podría imponer una amplia gama de medidas, sin restringir el acceso, para proteger los resultados, como revisar la propuesta, exigir informes de progreso más frecuentes o exigir salvaguardias especiales de ciberseguridad. Al hacerlo, la agencia «debería sopesar el equilibrio» entre los controles de seguridad y la ciencia abierta, señaló el grupo.

En concreto, rechazó la idea, defendida por algunos miembros del estamento de seguridad estadounidense, de redactar nuevas normas generales para la «información no clasificada controlada», término con el que se designa la investigación que, aunque no esté clasificada legalmente como secreta, está sujeta a controles de exportación o de otro tipo. Calificó tales controles como «una herramienta bastante contundente e ineficaz» para la seguridad, que «no debe utilizarse como un enfoque de talla única para mitigar el riesgo de la investigación.»

Desde al menos 2019, la preocupación de Estados Unidos por la filtración de resultados de investigación militar o comercialmente sensibles a países no amigos, especialmente China, ha ido en aumento. En 2022, el Congreso ordenó medidas más estrictas para proteger los resultados de investigaciones sensibles, y la NSF está creando actualmente un nuevo centro de intercambio de información y directrices sobre la seguridad de la investigación.

Países aliados de Occidente, como la UE, Gran Bretaña, Australia, Canadá, Japón y Corea, están llevando a cabo revisiones de seguridad similares. En enero, la Comisión Europea propuso una serie de nuevas medidas para mejorar la seguridad de la investigación, en gran parte debido a la preocupación por China.

El informe JASON, que no estaba clasificado, era necesario en virtud de las nuevas disposiciones de seguridad exigidas por el Congreso en la Ley CHIPS & Science de 2022. En un comunicado, la NSF afirmó que está analizando «las conclusiones y estudiará la aplicación de las recomendaciones mientras sigue desarrollando y aplicando nuevos procesos de revisión de políticas por motivos de seguridad nacional». Según la ley, tiene de plazo hasta el 22 de mayo para finalizar su revisión de seguridad.

*****************

Pentagon advisors urge caution in tightening science security

22 Mar 2024 | News

US government advisory group JASON says ‘blunt and ineffective’ security controls on fundamental science could harm progress, and urge a case-by-case approach

By Richard L. Hudson

Despite rising worries about sensitive US technologies leaking to China, a special government advisory group urged caution before imposing any broad new controls over fundamental science, lest they inhibit important discoveries.

The National Science Foundation “should proceed with caution before adding access or dissemination controls to grants or contracts,” the group, called JASON, reported on Thursday. It rejected the idea of designating specific scientific sub-disciplines as risky. That’s the kind of broad-brush security approach adopted by the Canadian government in January.

The JASON group, formed in 1960 as the Cold War intensified, brings together several top American scientists in a confidential advisory body to the Pentagon and security services.

Since at least the Reagan administration, the US government position has been that fundamental research should be restricted only in special cases of national security classification – and the JASON group, noting that now “is not the first time that a national debate has been raised on the issue of research security,” said that those 1980s-era “principles remain valid” today.

Rather than a broad rule change, the group in its unclassified report urged a project-by-project consideration of any security risks at the time scientists apply for an NSF grant. If a proposed research project appears “sensitive”, it said, there is a wide range of steps short of restricting access that the NSF could impose to protect the results, such as revising the proposal, demanding more-frequent progress reports, or requiring special cyber-security safeguards. In doing so, the agency “should weigh the balance” between security controls and open science, the group said.

It specifically rejected the idea, advocated by some in the US security establishment, of writing broad new rules for “controlled unclassified information” – a term for research that, while not legally classified as secret, is still subject to export or other forms of control. It called such controls “a rather blunt and ineffective tool” for security, that “should not be used as a one-size-fits-all approach to mitigating research risk.”

Since at least 2019, US concerns have been rising over militarily or commercially sensitive research results leaking to unfriendly countries, especially China. In 2022, Congress ordered tougher measures to protect sensitive research results, and the NSF is currently setting up a new clearing-house of information and guidelines about research security.

Similar security reviews are underway across Western-allied countries – including in the EU, Britain, Australia, Canada, Japan and Korea. In January, the European Commission proposed a series of new measures to improve research security, in large part due to concerns about China.

The JASON report, which was unclassified, was required under new security provisions mandated by Congress in the 2022 CHIPS & Science Act. In a statement, the NSF said it is analysing “the findings and will consider the implementation of the recommendations as it continues to develop and implement new policy review processes for national security concerns.” Under the law, it has a 22 May deadline for finishing its security review.