Mostrando entradas con la etiqueta Datos. Mostrar todas las entradas
Mostrando entradas con la etiqueta Datos. Mostrar todas las entradas

viernes, 25 de noviembre de 2022

Datasets de: La producción científica publicada en revistas latinoamericanas indexadas en SciELO y Redalyc

Disponible en Repositorio Institucional CONICET Digital
https://ri.conicet.gov.ar/handle/11336/175850


La producción científica publicada en revistas latinoamericanas indexadas en SciELO y Redalyc


Publicador: Consejo Nacional de Investigaciones Científicas y Técnicas
Fecha de depósito: 01/11/2022
Fecha de recolección: 29/05/2019-01/08/2021
Clasificación temática:

 
Resumen
La base de datos del proyecto OLIVA reúne y consolida un conjunto de datos de revistas y documentos publicados entre 1909 y 2019 en revistas de América Latina y el Caribe indexadas en las plataformas SciELO y Redalyc. Los datos a nivel de documento fueron recopilados entre mayo y junio de 2019, sometidos a un proceso de detección de solapamientos de revistas comunes. Además, se hizo una colecta primaria de los metadatos de cada revista incluida en la base de datos en el mes de mayo de 2021. El resultado de este proceso es la base de datos OLIVA 1.0, compuesta por (1) los metadatos de las revistas al momento de la recopilación, incluyendo: título, ISSN, URL, país de publicación, fecha de creación, área disciplinar, institución editora e información sobre cobro de APC, suscripciones e indexación en bases de datos; y (2) los datos de los documentos publicados en las revistas indexadas en SciELO y Redalyc, incluyendo: tipo de documento, año de publicación, revista, idioma, cantidad de autores/as y país de afiliación de los/as autores/as. Como complemento se analizó la colaboración intra-nacional para el caso de las revistas editadas en Brasil. Se incluye entonces en este dataset un tercer elemento (3): los datos de la colección SciELO Brasil con información de los documentos con afiliación institucional por país y estado dentro de Brasil. El proyecto OLIVA contó con la colaboración activa del Consejo Latinoamericano de Ciencias Sociales (CLACSO), Redalyc y SciELO. Este dataset y las tres bases de datos que lo componen fueron analizados por el área de propiedad intelectual de la UNCuyo (EXP E_CUY 8805/2022) y el CONICET (IF-2022-112581453-APN-GVT#CONICET). Cita recomendada para este conjunto de datos: Gallardo, O., Salatino, M., Packer, A. L. & Beigel, F. (2022). La producción científica publicada en revistas latinoamericanas indexadas en SciELO y Redalyc. OLIVA (Observatorio Latinoamericano de Indicadores de Evaluación) [Data file].

Información Técnica
El dataset OLIVA 1.0 está conformado por dos conjuntos de datos relacionados, pero relativamente independientes. (1) Los metadatos de 1.720 revistas que fueron relevadas directa y empíricamente a través del sitio web de cada revista en mayo de 2021, incluyendo título, fecha de creación, disciplina, sitio web, gestión editorial, APC, institución editora. (2) Datos básicos de los documentos publicados por revistas indexadas en SciELO y Redalyc seleccionados con fines estadísticos y (3) los datos de la colección SciELO Brasil con información de la afiliación institucional de los/as autores por país y estados dentro de Brasil (Ver datos recopilados). En el marco del Proyecto UNCuyo-SIIP TIPO 4 F/038 cada institución colaboradora proveyó una tabla de datos que fueron sometidas a un proceso de revisión y detección de solapamientos de revistas comunes para construir un corpus completo de las revistas indexadas en ambos sistemas, sin las repeticiones mencionadas. El proceso de consolidación de los documentos y de las revistas comunes a ambos sistemas de indexación se hizo a través de un procedimiento artesanal y no automatizado. Se identificaron en primer lugar las revistas indexadas únicamente en SciELO o en Redalyc, y se incluyeron los datos de estos documentos – incluyendo artículos, reseñas, editoriales – tanto de revistas activas al momento de captura de los datos, como de aquellas que habían estado indexadas en algún período anterior y seguían disponibles en la base de datos. En cuanto a las revistas solapadas entre ambas bases de datos se analizó la consistencia y completitud de los datos de cada revista y se resolvió, para cada caso, mantener aquellas que presentaban una más amplia cobertura temporal y mayor cantidad de documentos. En esta etapa que denominamos OLIVA 1.0 se trabajó únicamente con las revistas editadas en América Latina y el Caribe. Este conjunto de datos no incluye información sobre afiliación institucional de los autores, título de los documentos, ni se extrajeron datos de citaciones por estar fuera de los objetivos del proyecto. No se utilizó el dato de la disciplina de cada documento por tratarse de una proyección de la disciplina atribuida a la revista por cada base indexadora. El análisis disciplinar sólo se llevó adelante a nivel de revistas. Para esto, no se tomó el dato de disciplina de las bases indexadoras, sino que se clasificó revista por revista a partir de la sección “Acerca de” o “Presentación” declarado en el sitio web. Se utilizó la clasificación de disciplinas de OCDE-Frascati, a la que se sumaron dos categorías de agrupamiento: Multidisciplinaria (que apuntan a revistas de más de una disciplina) y Multidisciplinaria CSH (dentro de las Multidisciplinarias, aquellas que incluyen ambos campos de Ciencias Sociales y Humanidades). Tampoco se tomó el dato de institución editora de las revistas de las fuentes enviadas por SciELO y Redalyc sino que se realizó una descripción propia en base a las instituciones observadas en el sitio web de la revista. Sólo algunas pocas revistas que no disponían de sitio web propio fueron relevadas en el sitio web de la base indexadora. Por otra parte, la información sobre la afiliación de autores/as de Brasil en artículos de revistas del mismo país e indexadas en SciELO, fue provista por SciELO en mayo de 2021. La clasificación disciplinar disponible en estos datos es la utilizada por SciELO y no equivale a la del resto de tablas presentadas.


Datos de los documentos de las revistas SciELO y REDALYC 2019_CECIC_OLIVA1_DOCS_v1_17-07-2022.xlsx
188.6Mb Descarga

Datos documentos SciELO Brasil, con afiliación de autor por país y Estado 021_CECIC_OLIVA1_SCIELO_BRASIL_ESTADOS_v1.csv
5.202Mb Descarga

Datos de las revistas SciELO y REDALYC
2021_CECIC_OLIVA1_REVISTAS.csv
439.4Kb Descarga

README con la descripción detallada del dataset
CECIC_OLIVA1_v1_0__README.pdf
184.6Kb  Descarga

jueves, 3 de noviembre de 2022

Mercados y plataformas de datos: una visión desde América Latina

Publicado en Blok de Bid

Mercados y plataformas de datos: una visión desde América Latina


Mié, 02/11/2022 

David Rodríguez Mateos
Departamento de Comunicación
Universidad Carlos III de Madrid

Da Silva, Filipe; Núñez, Georgina. La era de las plataformas digitales y el desarrollo de los mercados de datos en un contexto de libre competencia (2021). Santiago: Comisión Económica para América Latina y el Caribe (CEPAL). 51 p. Disponible en: <https://repositorio.cepal.org/bitstream/handle/11362/47540/1/S2100764_es.pdf>. [Consulta: 24/10/2022].

La recopilación y el uso de datos masivos constituye uno de los sectores más complejos, más rentables y con mayores perspectivas de desarrollo en este siglo. Son, por lo tanto, numerosos los análisis que tratan de describir sus principales hitos, así como los interrogantes y retos que continuamente surgen a cada paso.

En esta línea se incluye el informe La era de las plataformas digitales y el desarrollo de los mercados de datos en un contexto de libre competencia, una mirada diferente más allá de otras perspectivas dominantes, ya sean eurocéntricas, anglosajonas o asiáticas. El informe está editado por la CEPAL, comisión regional de las Naciones Unidas para el desarrollo económico de América Latina. Resulta, pues, lógico que su enfoque sea principalmente económico, es decir, que se centre en las implicaciones comerciales o industriales de las herramientas descritas, sin entrar en detalles tecnológicos ni sobre cómo se gestionan los contenidos en las mismas.

La primera mitad del informe está enfocado sobre las plataformas digitales, definidas como una arquitectura o ecosistema de intercambio de datos para crear valor entre todos sus integrantes, ya sean creadores, comercializadores o usuarios de esos datos. Todas las interacciones, en cualquier sentido, generan continuamente datos que pueden tener nuevos valores para cualquiera de los implicados en su intercambio. El amplio catálogo de esas interacciones, no obstante, puede ser agrupado en seis categorías básicas: mercados digitales, buscadores, repositorios, plataformas de comunicación, comunidades y sistemas de pago.

La mayoría del trabajo está enfocado sobre una de estas categorías, los mercados de datos. El informe incluye un capítulo específico que define los mercados de datos y sus características; presenta algún ejemplo completo de sectores donde se han desarrollado; y señala algunos requisitos necesarios para su desarrollo en América Latina: la necesidad de desarrollar iniciativas nacionales o internacionales que los favorezcan, pero también de establecer regulaciones específicas.

Como ejemplos que puedan influir para el desarrollo de estas iniciativas o de posibles regulaciones, se mencionan a modo de ejemplo casos externos, como las iniciativas de la Unión Europea, pero también los trabajos en países de la propia región. Entre estos, destaca el ejemplo de Colombia, así como menciones a países como Chile, México y Perú.

En cuanto a las regulaciones, el informe se centra, sobre todo, en la necesidad de acuerdos transnacionales en los que participan los países de la región para facilitar el flujo de datos. Es el caso del MDR, dentro de la Alianza del Pacífico, que engloba a los cuatro países citados. Pero también presenta ejemplos entre estos países y otros ajenos a la región, como el DEPA, en el que participa Chile con Nueva Zelanda y Singapur; o el T-MEC, entre México, Estados Unidos y Canadá. 

El texto incluye algunas explicaciones detalladas sobre sectores que se han datificado notablemente, incluyendo aquellos surgidos expresamente a partir de la digitalización masiva de datos, como las fintech; y asimismo, en otras áreas más tradicionales que se han adelantado en esa explotación de sus datos, como la agricultura en Brasil, o la industria automotriz en general, de especial importancia en ese país, Argentina o México.

En conjunto, el informe ofrece un notable esfuerzo de síntesis sobre estos complejos temas que, por otra parte, se mantienen en continua evolución. A cambio, adolece en algunos casos de una edición que podría ser mejorada, tanto en lo formal como en la conexión entre algunas de las secciones de su contenido; presenta alguna inconcreción en varias definiciones propuestas, y el desarrollo de algunas secciones es vago en comparación con otras similares.

El mayor interés del informe es su recopilación y resumen de contenidos y casos sobre el tema, tanto a nivel local como internacional. Su perspectiva regional puede resultar de gran interés a instituciones y empresas de países como España, que comparten una lengua común.  

lunes, 18 de julio de 2022

USA almacena más del 92% de los datos del mundo occidental. Crece la necesidad de la soberanía digital

Publicado en europapress

https://www.europapress.es/portaltic/sector/noticia-soberania-digital-conseguir-aplique-entorno-cloud-20220712104902.html?fbclid=IwAR0h60CLY6lVPIAIlpHWgv4dE7zbtbqnleUQufTYaQ1galZS9HufIZ0UeGM&s=08


Qué es la soberanía digital y cómo conseguir que se aplique en un entorno 'cloud'

MADRID, 12 Jul. (Portaltic/EP) - Más del 92 por ciento de todos los datos del mundo occidental se almacenan en servidores propiedad de empresas con sede en Estados Unidos, según datos del Foro Económico Mundial. A medida que estos datos siguen creciendo de forma exponencial y las organizaciones modernas dependen cada vez más de las plataformas digitales, crece la necesidad de la soberanía digital en todas las naciones, según los expertos. 



miércoles, 16 de febrero de 2022

FRANCIA sigue los pasos de AUSTRIA: declara ilegal a Google Analytics

 Google Analytics ahora ilegal también en Francia, es posible que pronto sea ilegal en España y otros países Europeos.


12 de febrero de 2022


Buenos días,

La Agencia de Protección de Datos de Francia (CNIL) ha declarado ilegal el uso de Google Analytics. La decisión es consecuencia de la resolución del TJUE en julio de 2020 que invalidó el conocido como ‘Privacy Shield’, que permitía transferir los datos personales a los Estados Unidos. Tras la sentencia, cuya doctrina se conoce como ‘Schrems II’, la transferencia de datos como los utilizados en Google Analytics es ilegal y por ende, las distintas agencias de protección de datos están tomando esta decisión.

El primer país en bloquear Google Analytics fue Austria en enero. Pero sabíamos que se extendería a más países, pues la sentencia del Tribunal Superior de Justicia de la UE es extensible a distintos países y a distintas empresas.

Francia se une a Austria y puede ir a más. El TJUE declaró que la transferencia de datos a EE.UU incumplía el Reglamento General de Protección de Datos. La consecuencia directa es que el ‘Privacy Shield’, un acuerdo entre la Unión Europea y los Estados Unidos, terminó. Desde entonces, esta transferencia de datos se considera ilegal, a falta de una nueva ley que recoja este uso. Austria tomó el primer paso y ahora ha sido Francia, pero las distintas agencias nacionales pueden tomar una postura similar. Por su parte, CNIL ha ordenado a empresas y operadores que dejen de utilizar Google Analytics.

La AEPD no se ha pronunciado al respecto, como tampoco lo ha hecho el Comité Europeo de Protección de Datos (EDPB)


Hugo Agud - Orex Digital 

domingo, 31 de octubre de 2021

Países sin desarrollo tecnológico pueden convertirse en colonias de datos: Yuval Harari

Publicado en Milenio
https://www.milenio.com/negocios/yuval-noah-paises-desarrollo-tecnologico-colonias-datos


Países sin desarrollo tecnológico pueden convertirse en colonias de datos: Yuval Harari

El historiador y filósofo israelí afirmó que las naciones que desarrollen la inteligencia artificial dominarán la economía a escala global y advirtió sobre una nueva guerra fría pero digital.

Sebastián Díaz Mora
Ciudad de México / 30.10.2021 02:08:22

La economía digital representa una seria amenaza para países como México (en donde no hay desarrollo de tecnologías de la información), debido a que existe el riesgo de que se conviertan en “colonias de datos” de los futuros “imperios” de la Inteligencia Artificial (IA), aseguró el historiador y filósofo israelí Yuval Noah Harari.

En el foro virtual “¿Qué futuro estamos esperando?”, organizado por Sura Asset Management, Noah Harari advirtió que es latente el riesgo de que todo el poder y las ganancias de la economía digital se concentren en un grupo reducido de países.

Naciones como China y Estados Unidos, que son las que albergan a las grandes empresas de tecnología —Facebookahora denominada MetaAmazonAlphabetAlibaba Tencent—, serán los poderes dominantes, afirmó el autor de Sapiens (2011).

“Unas cuantas compañías y gobiernos que están cultivando los datos del mundo, pueden transformar al resto del mundo en colonias de datos”, recalcó Harari.

Recordó que en los siglos XIX y XX, las colonias únicamente proveían materias primas a potencias como Gran Bretaña y Estados Unidos, mientras que la riqueza que se generaba gracias a tecnologías producidas con esos insumos se quedaban en los países industrializados.

Es muy probable, dijo, que esto vuelva a ocurrir en la economía digital, solo que en el siglo XXI los insumos que los países colonizados exportarán hacia los imperios serán datos, pues éstos son “la materia prima para la industria de la IA”.

Un país de América Latina como Bolivia, ejemplificó, en el que se usan plataformas tecnológicas chinas y estadounidenses, se convertirá en un proveedor de datos para los gobiernos y las compañías tecnológicas de esos países. De esta forma, abundó, el país latinoamericano alimentará el desarrollo de la IA en esas naciones, pero las ganancias y el poder generados gracias a los datos no serán redistribuidos de regreso hacia Bolivia. 

“Datos de Bolivia pueden enriquecer una corporación china, mientras Bolivia se quedará pobre”, sentenció

Sin embargo, enfatizó que este escenario solo es una posibilidad más no una profecía e incluso esbozó la que puede ser una posible solución. 

Sugirió que desde ahora países en América Latina y otras partes del mundo le hagan frente a las grandes firmas tecnológicas, así como a las naciones que las albergan para evitar la concentración del desarrollo. 

Pese a que no explicó a detalle qué tipo de acciones pueden tomar, subrayó que cualquier esfuerzo que estos países realicen en este sentido, deberán hacerlo en equipo, pues por sí solos no tienen la capacidad de hacerle frente a una empresa del tamaño de Facebook o a un gobierno como el de China. 

“Si muchos de estos países actúan en bloque, tienen una oportunidad de hacerse de un futuro diferente para ellos mismos y para la región”, afirmó el autor de Homo Deus (2015)

Una guerra digital global 

 Noah Harari puntualizó que estamos al borde de lo que llamó “una guerra digital global”, en las que hay dos bandos en contienda: por un lado, una alianza de Estados Unidos y los gigantes tecnológicos estadunidenses como Google, Facebook, Amazon y Microsoft, y en el otro lado están China y las compañías como Baidu, Alibaba y Wally. 

“Esta lucha titánica está dividiendo cada vez más el mundo. En la Guerra Fría, en el siglo XX, sostuvimos una cortina de acero (...) Ahora somos testigos de una cortina de silicón que está dividiendo al mundo y está fabricada por códigos”, finalizó.

lunes, 10 de mayo de 2021

Datos biométricos y capitalismo de vigilancia

Publicado en La Jornada
https://www.jornada.com.mx/2021/05/08/opinion/017a1eco


Datos biométricos y capitalismo de vigilancia

Silvia Ribeiro*

La reciente creación de un Padrón Nacional de Usuarios e Telefonía Móvil, que obliga al registro de los datos biométricos de todos los usuarios, ha abierto un debate necesario sobre sus impactos potenciales. No obstante, faltan elementos de contexto fundamentales.

La conversión de nuestras características personales y de identificación a datos digitales, son un componente clave del capitalismo actual, llamado atinadamente capitalismo de vigilancia por Shoshana Zuboff. Los datos biométricos, especialmente rasgos faciales e iris, no sólo identifican a una persona, también son de enorme relevancia para interpretar emociones, lo cual es esencial para la lucrativa industria de venta de futuros conductuales, o sea, la apuesta y manipulación de nuestras conductas para empujarnos a hacer lo que deseen las empresas / gobiernos que lo paguen. Además, son fundamentales para el reconocimiento facial desde cámaras de vigilancia, incluso en aglomeraciones, sea con fines de control, represión o comerciales.

Todo se hace más grave porque el volumen de datos que implica este tipo de registro en poblaciones enteras sólo se puede almacenar y manejar en enormes nubes de computación, un sector brutalmente concentrado en pocas empresas. Más de la mitad del mercado global lo tienen las estadunidenses Amazon AWS, Google Cloud, Microsoft Azure e IBM, seguidas de la china Alibaba. También Oracle y Dell tienen porcentajes significativos. Las tres primeras, junto a Apple y Facebook, controlan, además, más de la mitad del mercado global de plataformas electrónicas, y junto a las chinas Alibaba y Tencent, más de dos tercios. Aunque las grandes empresas telefónicas colecten los datos –y los puedan usar para sus negocios– la mayoría, como Telcel y Telmex, contratan servicios de las anteriores.

Peor aún, varios niveles de gobierno, desde el federal a estados y municipios, albergan los datos electrónicos de parte o todas sus actividades –incluso registros de población o sectores de ésta (como estudiantes, pacientes, derechohabientes de diversos sistemas)– en esas mismas nubes, conectadas a sus plataformas. Dirán que hay regulaciones sobre acceso de éstas a los datos que almacenan, gestionan y/o dan servicio, pero además de muy insuficientes, no pueden controlar realmente lo que hacen estas gigantes. Hay ejemplos de abuso con impactos tremendos, como el de Cambridge Analytica que resultó en la elección de Trump, Macri, Bolsonaro y otros.

Esta nueva forma de organización capitalista se basa en la digitalización en todos los rubros industriales, junto a la plataformización electrónica de relaciones sociales, transacciones de comercio, financieras, compras domésticas y otras. También la instalación de mecanismos cada vez más avanzados de vigilancia dentro y fuera de los hogares, para avanzar en la conexión de todos los aparatos, para conocer –y sugerir, persuadir, empujar– nuestras conductas.

Todo ello ha causado múltiples impactos sociales, económicos, políticos, ambientales, laborales, en la salud; la mayoría negativos. Con la pandemia, la invasión electrónica de nuestra vida y trabajo se expandió enormemente e incorporó masivamente aspectos esenciales como educación, atención de la salud y reuniones de todo tipo.

Aunque la vigilancia con fines de control y represión por parte de gobiernos y autoridades es un efecto extraordinariamente magnificado y facilitado en esta nueva era capitalista, el interés principal de las empresas es la vigilancia de nuestra vida cotidiana para poder influir y manipular nuestras elecciones de consumo, políticas, sociales y educativas.

La extracción y almacenamiento de datos de las personas (además de ciudades, ecosistemas, territorios) que son cruzados con otros registros, manejados e interpretados con algoritmos de inteligencia artificial son una de las principales fuentes de ganancia de las gigantes tecnológicas. Es tan cuantiosa que nueve de las 10 mayores empresas con más alto valor bursátil son tecnológicas, varias con valor de mercado mayor que todo el PIB de México.

Ese lucro se basó en la primera generación de extracción y explotación de nuestros datos.

El siguiente paso fue no sólo vender datos agrupados por segmentos de interés para los anuncios de las empresas, sino vender la predicción y la modificación de las conductas de esos grupos. Para ello, la cantidad y calidad de datos que se puedan agregar y cruzar entre sí –como ubicación geográfica, educación, nivel de ingresos, preferencias de consumo, estado de salud, etcétera, son fundamentales. Por ello han crecido vertiginosamente las industrias de biometría y reconocimiento facial, porque permiten vigilar, interpretar y manipular mejor las emociones, un producto de alto valor para las empresas.

Pese a la alta penetración de esta realidad, la discusión social de los impactos del capitalismo de vigilancia es muy limitada, pero hay un debate importante desde organizaciones y activistas de base (https://tinyurl.com/vwmf4wzb).

Las regulaciones nacionales e internacionales necesarias para controlar y/o prohibir estas actividades, cuestionar los monopolios, etcétera, son ridículamente insuficientes o no existen. Refieren, además, a opciones y derechos individuales, cuando se trata de una explotación global y poblacional a la que necesitamos responder con debates y derechos colectivos. En este difícil contexto, hacer obligatoria la entrega de nuestros datos biométricos –sueño de las gigantes tecnológicas– es una pésima idea.

Investigadora del Grupo ETC

ESPAÑA: profesores de la Complutense llevan más de 300 firmas al Rectorado para que corte relaciones con empresas y academias cercanas a ISRAEL

Publicado en El País https://elpais.com/espana/madrid/2024-05-10/los-maestros-de-la-complutense-llevan-mas-de-300-firmas-al-rectorado-para-...