Mostrando entradas con la etiqueta Empresas privadas. Mostrar todas las entradas
Mostrando entradas con la etiqueta Empresas privadas. Mostrar todas las entradas

lunes, 13 de marzo de 2023

ChatGPT vs Google: ¿El fin de la barra de búsqueda?

Publicado en Letras Libres
https://letraslibres.com/ciencia-y-tecnologia/future-tense-futuro-barra-busqueda-chatgpt/



¿El fin de la barra de búsqueda?

Industrias enteras dependen de la manera en que Google gestiona las búsquedas y la publicidad en línea. Chatbots como Chat GPT podrían cambiar eso, y alterar de paso el modo en que estructuramos el conocimiento humano.


Por Ed Finn
10 marzo 2023

Como buen niño de los 80, puedo dividir claramente mi vida en Antes de Google y Después de Google. Con el inicio del milenio, internet dejó de ser una maraña de listas incompletas de cosas extrañas para convertirse en una muy útil base de datos de investigación. Desde entonces, buscar en Google ha sido una de las únicas constantes tecnológicas de mi vida adulta, que ha persistido a pesar del auge de los teléfonos inteligentes, las redes sociales, los servicios de streaming, e incluso la entrega de burritos con drones (por cierto, ¿qué pasó con eso?).

En todo este tiempo, nadie ha sido capaz de desafiar el papel de Google como guardián de la abundancia digital. Más de 90% de los usuarios de internet de todo el mundo utilizan Google para comprar, navegar y satisfacer su curiosidad sobre prácticamente todo. Los anuncios que Google a partir de esta actividad (y en otros sitios web) han alimentado una máquina de dinero que generó más de un cuarto de billón de dólares en ventas el año pasado.

Google empezó como una especie de creador de mapas de internet, pero gracias a su éxito se convirtió gradualmente en el arquitecto de la World Wide Web. Hoy, industrias enteras, desde el comercio minorista hasta los seguros de automóvil, dependen de la manera en que Google gestiona los resultados de las búsquedas y la publicidad en línea. La frontera electrónica se hizo cada vez más corporativa, organizada de acuerdo con la tiranía del clic: ¿cuántos usuarios hacen clic en tu anuncio, en tu titular, en tu video? Esa cifra determina cuánto dinero se puede ganar en internet (y explica la alucinante cantidad de artículos escritos con el propósito específico de aparecer cuando tecleas, por ejemplo, “¿A qué hora empiezan los Oscares?”)

La economía basada en los clics ha hecho que el mundo sea más eficiente en algunos aspectos, pero ha convertido esta milagrosa base de datos de información global en una frenética subasta en la que todos los sitios web buscan subir a lo más alto en los resultados de búsqueda, conseguir el mayor número de clics y retener el mayor número de ojos. Cada página web que cargas es un poco más lenta gracias a las subastas para determinar qué anuncios se verán. Un sinfín de periodistas profesionales libraron batallas perdidas contra las mezquinas métricas de clics y porcentajes de descarga de páginas, y luego se adaptaron a ellas, convirtiendo la “optimización de motores de búsqueda” en una de las habilidades periodísticas más preciadas. YouTube y las redes sociales persiguen los clics con tal empeño que, sin darse cuenta, crean algoritmos que enganchan a los usuarios con contenidos cada vez más lascivos y radicales. Google ha construido un internet en el que ganan los que más clics hacen, y Google desempeña un papel clave en el recuento de esos clics.

¿Y si todo esto cambia?

La llegada de ChatGPT de OpenAI a finales de 2022 hizo temblar las salas de juntas de las grandes empresas de tecnología. Microsoft, rival de Google, no tardó en utilizar su participación en OpenAI para crear una versión beta de algo nuevo: un agente conectado a Bing, el motor de búsqueda de Microsoft, que puede conversar. Google conectó su propio chatbot de nueva generación, Bard, a su principal producto de búsqueda. Estamos en los primeros tiempos de todo eso, y se nota: la nueva y parlanchina Bing de Microsoft hace poco asustó a un periodista del New York Times con su megalomanía y sus insinuaciones amorosas. Bard, por su parte, cometió un error fáctico en su demo de lanzamiento, haciendo que las acciones de la empresa matriz Alphabet cayeran en picada.

La rapidez con la que Google ha introducido una herramienta de inteligencia artificial a medio cocer en su mayor fuente de ingresos, a pesar de la amenaza que Bard podría representar para el modelo de negocio, indica la seriedad con la que nuestro guardián de toda la información del mundo se está tomando el momento. (Tras la publicación de este artículo, un portavoz de Google se puso en contacto para aclarar que la empresa no tiene intención de sustituir Search por Bard y que Bard, como chat, es distinta de otras grandes herramientas de inteligencia artificial basadas en modelos lingüísticos que se presentaron al mismo tiempo, incluida una que funciona con Search para extraer información de toda la web. El portavoz dijo que Bard no estaba “cambiando la dirección” de Search y reiteró que ninguna de las dos herramientas se ha lanzado públicamente).

¿Qué podría significar sustituir la economía del clic y su piedra angular, la barra de búsqueda, por algo parecido a una conversación? Esto es lo que ofrecen Bard y  Bing con ChatGPT: la posibilidad de hacer preguntas más humanas (¿cuál es el mejor sitio para comer un burrito por aquí y qué drones recomendarías para transportarlo?), y mantener conversaciones con un sistema que retiene el contexto. (Aunque cabe destacar que, en un intento por frenar algunos de los comportamientos más precipitados de su chatbot, Microsoft limitó recientemente a los usuarios a hacer cinco preguntas por sesión). En lugar de ofrecerte un menú de enlaces (y anuncios), tu interlocutor/mayordomo informativo va al grano, quizás ofreciendo algunas notas a pie de página para que sigas leyendo. Si se lo pides, hasta te ofrecerá sus respuestas con voz de pirata o en rimas.

Antes de que apareciera Google Search y devorara la industria del acceso a la información digital, este tipo de síntesis era lo que todo el mundo pensaba que sería nuestro futuro digital. Los primeros visionarios, como Vannevar Bush, previeron el océano de información en el que nadamos e imaginaron sistemas que nos permitirían seguir a “pioneros” y sintetizadores. Los escritores de ciencia ficción de los años 80 y 90 imaginaron obras de inteligencia artificial que actuaban como bibliotecarios (y a veces se les llamaba así), como el educado subsistema de Snow Crash, del autor Neal Stephenson, capaz de resumir libros, correlacionar información y mantener largas conversaciones con humanos. DARPA, el ala de investigación del ejército estadounidense, invirtió millones en un proyecto llamado Personal Assistant that Learns-PAL (Asistente Personal que Aprende) para construir algo similar en la vida real para los mandos militares. Con el tiempo, esa investigación dio lugar a Siri y, con ella, al sueño de una computadora con la que se pudiera hablar de verdad.

Una interfaz basada en conversación supondría un cambio radical respecto a la forma en que hemos aprendido a trabajar en sistemas basados en palabras clave, como Google. Cuando tengo una pregunta complicada que hacer en internet, a menudo tengo que hacer cierto tipo de esfuerzo en mi consulta, tratando de imaginar posibles escenarios en los que alguien podría haberla respondido y que podrían ser muy diferentes de mi contexto. La lista de resultados de búsqueda que aparece, con enlaces patrocinados en la parte superior, me ofrece opciones sobre qué pista seguir o a qué autoridad creer. Todo internauta aprende rápidamente a evaluar la credibilidad y utilidad de un enlace en función de su URL y de cómo aparece en la búsqueda de Google.

Sustituir esa consulta por una conversación representa una transformación a lo que Google lleva tiempo llamando la “búsqueda del conocimiento” de sus usuarios. La clásica barra de búsqueda se esfuerza por ser omnipresente, esencial y casi invisible. Pero estos nuevos chatbots no se apartan del camino. Se adelantan, dan la mano, presentan personalidad y afecto en sus interacciones con los usuarios. Ofrecen síntesis, extrapolación y refinamiento repetido, mediante preguntas de seguimiento y diálogo. Ofrecen la ilusión de un criterio.

En lugar de una lista de posibles fuentes, tenemos una sola voz. Cuando los usuarios interactúan con Bing (R.I.P. Sydney) o Bard, los sitios subyacentes se esconden como notas a pie de página o se ocultan por completo. No muestran sus cálculos. Es tentador para todos los que alguna vez hemos murmurado con frustración “dime ya la respuesta” cuando la búsqueda de Google no da resultados. Pero también es preocupante. Dejando a un lado problemas bien documentados que tienen estos sistemas, como equivocarse, inventar cosas y asustar a la gente, la ilusión de una respuesta única y coherente puede ser peligrosa cuando la naturaleza de la verdad es complicada y controvertida.

La diferencia entre una pregunta y una consulta a una base de datos tiene enormes implicaciones para la forma en que nos relacionamos con el extenso universo del conocimiento humano y entre nosotros mismos. Una lista de resultados de búsqueda, por muy elaborada y manipulada que esté, sigue recordándonos que puede haber respuestas contradictorias a nuestra pregunta. Una interfaz conversacional con una inteligencia artificial encantadora y simplista oculta toda esa confusión. Estos sistemas podrían convertirse en otra capa de ofuscación entre nosotros y la fuente del conocimiento humano. Otra caja negra, pero que habla, cuenta chistes y puede escribir un soneto si se lo ordenan. Irónicamente, OpenAI está intentando resolver el persistente problema de que estos sistemas “alucinen” con información falsa enseñándoles a validar sus resultados mediante un motor de búsqueda.

Pero va a ser mucho más difícil vender clics desde un bot. ¿Qué ocurrirá con la economía del clic si una inteligencia artificial se convierte en un extraño mutante de un portavoz y una bola mágica, o algo así como un avatar de la suma total del conocimiento humano? Recursos ricos en información, como periódicos y foros de debate, podrían encontrarse con que estos sistemas recojan su material y lo reformulen de forma tan elocuente que nadie se moleste en navegar hasta la página original. Parece una invitación para deslizarse aún más en el sospechoso camino en el que los creadores de contenidos dependen de los gigantes tecnológicos para que les ofrezcan una parte de los ingresos, sin que haya forma de verificar sus cifras de manera independiente.

La cuestión de cuál podría ser el modelo de negocio para estos nuevos guardianes, y más aún para los proveedores repentinamente invisibles de esa información a través de internet, nos lleva a una cuestión más profunda: estamos hablando de poner a un nuevo arquitecto a cargo de Internet.

Los motores de búsqueda se basan en los hipervínculos, esas conexiones explícitas entre palabras y páginas que son legibles y programables por los humanos. Desde los albores de la enciclopedia moderna, se podría argumentar que toda la estructura del conocimiento humano empírico se construye a partir de las piezas clave de las notas a pie de página y las referencias cruzadas.

Esto contrasta con grandes modelos lingüísticos como ChatGPT: sistemas de aprendizaje automático que, por su diseño, identifican relaciones complejas entre palabras y frasesm basándose en probabilidades, lo que lleva a que algunas personas los llamen “loros estocásticos“. Ningún ser humano, ni siquiera los ingenieros que los construyeron, puede entender cómo funcionan esas asociaciones entre miles o millones de variables ni, lo que es más importante, por qué hacen determinadas asociaciones. Y eso dificulta mucho la corrección de errores o la prevención de daños sin recurrir a filtros y censuras torpes. Pasar de los vínculos a las relaciones probabilísticas es como pasar de la física newtoniana a la rareza cuántica, o de la verdad a algo que solo suena verdadero. ¿Cómo lo sabes? Porque te lo dijo el chatbot. ~



Este artículo es publicado gracias a una colaboración de Letras Libres con Future Tense, un proyecto de Slate, New America, y Arizona State University.

miércoles, 9 de junio de 2021

Ciencia abierta: Si no lo paga nadie, ¿quién lo paga? Las Infraestructuras de la Ciencia Abierta ciencia abierta

Publicado en Blok de Bid
http://www.ub.edu/blokdebid/es/node/1127


Si no lo paga nadie, ¿quién lo paga? Las Infraestructuras de la Ciencia Abierta

Lluís Anglada
Director del Àrea de Ciència Oberta
Consorci de Serveis Universitaris de Catalunya (CSUC)
 

Ficarra, Victoria; Fosci, Mattia; Chiarelli, Andrea; Kramer, Bianca; Proudman, Vanessa (2020). Scoping the Open Science Infrastructure landscape in Europe. [Apeldoorn]: SPARC Europe. Disponible en: <http://doi.org/10.5281/zenodo.4153809>. [Consulta: 30/05/2021]. 

En las últimas décadas, la ciencia ha pasado de ser una actividad modestamente retribuida a movilizar una cantidad considerable de recursos económicos.1 Esto ha atraído –lógicamente– a la empresa privada, lo que no sería malo en sí mismo si no fuera que se cree que la ciencia debería estar autogobernada y desarrollarse, exclusivamente, por criterios científicos.

La Ciencia Abierta es un movimiento que cree que la investigación mejora si hay un acceso libre a los resultados científicos, más colaboración entre investigadores y un acercamiento a la sociedad de la que surge y a quien regresa. ¿Esto es compatible con el hecho de que las herramientas e infraestructuras científicas –cada vez más complejas– sean gestionadas por empresas privadas?

La apertura e interoperabilidades de los datos, el software de código libre y la voluntad de no depender de empresas han permitido hoy que haya muchas infraestructuras sobre las que se sustenta la investigación que hayan sido creadas por entidades públicas o sin ánimo de lucro. ¿Cuáles? Pues, por ejemplo Crossref, DOAJ o repositorios cooperativos como TDX o institucionales.2 El espacio europeo de investigación que debe ser la EOSC tiene que ser un ecosistema de infraestructuras interconectadas y gobernadas por los investigadores.

El informe que reseñamos define las Infraestructuras para la Ciencia Abierta (OSI) como el conjunto de servicios, protocolos, estándares y software que el ecosistema de investigación necesita para operar a lo largo de todo el ciclo de la investigación. Lo edita SPARC Europe y ha sido financiado por las Open Society Foundations y la Invest in Open Infrastructure. El objetivo del informe es entender mejor cómo operan las OSI de cara a facilitar su viabilidad y permanencia. Las autoras señalan, en la introducción, que un estudio anterior de SPARC Europe señalaba que algunas OSI estaban en peligro de desaparecer por falta de financiación o con peligro de ser compradas por empresas privadas.3

El informe está elaborado a partir de las respuestas de diferentes OSI europeas a un extenso y completo cuestionario4 que recibió respuestas de 120 proyectos o servicios diferentes de 28 países. Al igual que muchos estudios, este puede leerse de forma extensa o concentrada. El resumen ejecutivo (p. 3-6) y las conclusiones (p. 50-52) proporcionan la información substancial de la investigación realizada, mientras que la mayor parte del informe (p. 6-50) da explicaciones extensas y gráficas de los diferentes apartados. Veamos las partes del informe y los principales resultados.

La primera parte del estudio se centra en la caracterización de las OSI europeas, y las principales conclusiones son que: 

  • Su motivación principal es la de favorecer los objetivos de la Ciencia Abierta y, más concretamente, el acceso abierto al conocimiento (acceso abierto a los artículos científicos, datos abiertos y software de código libre). 
     
  • Los servicios de las OSI se dirigen mayoritariamente a los investigadores, pero también de forma importante a las bibliotecas. En un 95 % de los casos las OSI proporcionan más de un servicio dentro del ciclo de investigación.
     
  • Las actividades más comunes son el servicio de alojamiento y acceso de contenidos y la promoción de identificadores. El contenido más común de estos servicios son las revistas y los datos.

La segunda parte está dedicada a la tecnología, concretamente a la gestión técnica de las OSI, a su integración con otros sistemas, al cumplimiento de los principios FAIR... Entre otros resultados, hay estos:

  • La mayoría se integran con servicios externos como ORCID, Crossref o DOAJ.
     
  • Más de la mitad utilizan de forma exclusiva o parcial software de código libre. 
     
  • La mayoría de OSI tienen una estrategia para cumplir los principios FAIR, y los requerimientos de la EOSC y del Plan S y los de COAR (SPARC).

La última parte se centra en temas de gobernabilidad. Entre los datos que se dan yo destaco los siguientes:

  • Las OSI que han contestado tienen mayoritariamente una misión clara, planes de trabajo y estatutos. Suelen tener también comités de dirección y comisiones asesoras.
     
  • Una parte importante (un tercio) inicia los ejercicios económicos sin tener un presupuesto aprobado; estos, en 22 casos, son inferiores a los 50.000 € / año, y para la mitad de los servicios el presupuesto anual es inferior al medio millón de euros.
     
  • Los servicios tienen mayoritariamente entre dos y cinco personas FTE (full-time equivalents). Las fuentes de ingresos principales son ayudas del gobierno y cuotas de miembros.

Las conclusiones de este estudio repiten en buena parte el resumen ejecutivo. Por mi parte, unas reflexiones finales: una, referente a las instituciones, y la segunda, a las OSI. 

La construcción de un ecosistema interconectado de diferentes componentes requiere que haya servicios comunes, es decir, que son para todos sin que sean de nadie, y estas infraestructuras hay que pagarlas. Pueden hacerlo las administraciones o las instituciones, pero hay que hacerlo. La gran debilidad de las OSI es su sostenibilidad económica. A las instituciones les cuesta mucho hacer aportaciones a iniciativas cooperativas, mientras que, al mismo tiempo, aceptan como inevitable pagar las facturas de los proveedores de software o de revistas. 

El objetivo de las OSI no es ser un contrapoder de las empresas, sino servir a la ciencia mejor que ellas. Esto tiene sus requerimientos que se llaman eficacia, innovación, buen gobierno... Cuanto más se concrete la interoperabilidad del espacio de investigación, cuanto más maduro esté este ecosistema, las exigencias sobre las OSI crecerán y los voluntarismos ya no valdrán. Las infraestructuras que servirán a (toda) la investigación deberán ser de confianza, y esto probablemente requiera que las diferentes iniciativas se concentren en pocas cosas y, en muchos casos, que se fusionen entre sí.

1 Pueden verse las inversiones anuales por países y regiones en esta página de la Unesco
2 La relación de entidades que han contestado el cuestionario en que se basa este estudio permite hacerse una idea de su número y variedad. Véase el Apéndice A.
3 Fosci, Mattia; Richens, Emma; Johnson, Rob (2019). Insights into European research funder open policies and practices
4 Lo certifico dado que lo rellené para MDC, RACO y TDX. Véase Proudman, Vanessa; Mounier, Pierre; Kramer, Bianca; Bosman, Jeroen (2020). Survey instruments: for the scoping the Open Science Infrastructure landscape in Euro
pe study.

Plan 2.0 para el acceso abierto: ¿un plan o una nueva ambigüedad?

Publicado en THE Times Higher Education https://www.timeshighereducation.com/news/plan-s-20-open-access-plan-bold-may-prove-ineffective   El...