Unos refugiados somalíes construyeron el oído electrónico del Pentágono… sin querer
Contratados por una empresa australiana, ayudaron de forma inconsciente a mejorar sistemas de detección

Sala de control de la fuerza aérea estadounidense. | US Air Force
Ismail huyó de Somalia cuando era un niño. Acabó en Kakuma, un campo de refugiados en el noroeste de Kenia, tan remoto que su nombre significa en suajili «ningún lugar». Allí encontró trabajo. Su tarea era transcribir archivos de voz en lengua somalí para una empresa tecnológica australiana llamada Appen. Lo que nadie le dijo es que parte de ese trabajo podría haber ido a parar al ejército de Estados Unidos, el mismo que lleva décadas interviniendo en el conflicto del que él tuvo que escapar.
La historia la ha destapado una investigación con acceso a contratos de defensa adjudicados a la compañía Appen entre 2005 y 2020, por valor de unos 15 millones de euros al cambio. Entre ellos figura uno relacionado con el RC-135 Rivet Joint, uno de los aviones de vigilancia electrónica más capaces del arsenal estadounidense. El cliente final era Big Safari, una unidad secreta de la US Air Force cuya misión es modernizar los sistemas tecnológicos de las aeronaves de reconocimiento.
El RC-135 Rivet Joint es un aparato bien conocido, al que se le han renovado sus capacidades en fechas recientes. Sus primeras misiones datan de la guerra de Vietnam, pero de manera cíclica el aparato es vaciado y reequipado para estar a la última en tecnología. Puede interceptar comunicaciones a casi 250 kilómetros, localizar y posicionar radares enemigos y capturar señales en un abanico de frecuencias que nunca se han hecho públicas. Ha sobrevolado la frontera occidental de Rusia, las aguas próximas a China y el Mediterráneo oriental. Su currículo es extenso, y no solo lo tienen en propiedad los estadounidenses, sino también la Royal Air Force británica, la RAF.

En octubre de 2023, uno de sus pájaros de metal patrulló el Mediterráneo durante los días posteriores al ataque de Hamás contra Israel. La RAF realizó misiones de vigilancia casi diarias sobre Gaza hasta el acuerdo de alto el fuego. Un portavoz del Ministerio de Defensa de Downing Street aclaró que sus actividades solo estaban relacionadas con la localización de rehenes. Cómo Israel utilizó la inteligencia recopilada por esos aviones sigue siendo, como casi todo el programa Rivet Joint, un misterio sin respuesta.
Pero lo que mueve estos aparatos no es solo la cascada de dispositivos electrónicos embarcados. También es la capacidad de procesar lo que captan. Por eso, a bordo viajan lingüistas militares especializados, a los que se añaden analistas en tierra. Para que los sistemas interpreten conversaciones en idiomas de bajo perfil como el somalí, dialectos regionales u otras lenguas sin apenas huella digital, alguien tiene que haber construido antes los patrones de datos que enseñan a las máquinas a reconocer esos sonidos. Ahí es donde entran en escena Appen y, de su mano, Ismail y cientos de trabajadores como él.
Appen fue fundada en Sídney en 1996, mucho antes de que existieran Siri, Google Translate o ChatGPT. Esta empresa ya construía los cimientos lingüísticos sobre los que se levantarían esos sistemas, con un modelo sencillo: reclutar trabajadores por todo el mundo para que etiqueten datos, transcriban audio y validen respuestas. Declara tener cientos de miles de colaboradores que dominan más de 500 idiomas. El trabajo suele estar mal pagado, y la información sobre el destino final es prácticamente nula.
El somalí es una muestra de lo que se denomina «idioma de bajos recursos»: no hay suficientes datos digitalizados para entrenar modelos de reconocimiento de voz. Eso lo hace valioso para quien necesite analizar comunicaciones en esa lengua, y difícil de obtener por vías convencionales. La solución de Appen fue reclutar hablantes nativos en Kenia, donde reside una diáspora somalí de casi tres millones de personas, más de 300.000 de ellas en campamentos de refugiados.

Según testigos, los empleadores solían ser reservados sobre el objetivo final. A los contratados solo les daban pautas para realizar las tareas, pero no sabían hacia dónde o a qué conducían estos datos. En el campamento se hacían preguntas con frecuencia; preguntas sin respuesta. El contenido transcrito tampoco ofrecía pistas y podía ser una grabación en el mercado, sobre problemas de seguridad en la ciudad o sobre una reunión de una empresa desconocida. Nada que permitiera construir un contexto.
Entre 2015 y 2017, Appen trabajó en tres subcontratos para suministrar archivos lingüísticos a un proyecto denominado Tactical Language Interpreter. El único rastro público aparece, con un presupuesto asignado de 287.500 dólares, en un boletín para veteranos. En la documentación se describe como una herramienta para «optimizar el procesamiento de datos de voz». No se sabe si esos datos llegaron a instalarse en los Rivet Joint, si sirvieron para entrenar a su tripulación o para probar una capacidad en desarrollo.
Oscurantismo como norma general
Cuando los periodistas del Bureau of Investigative Journalism solicitaron información a varias unidades militares, la mayoría no respondieron. Hubo una que sí: devolvió 720 páginas tachadas casi en su totalidad. Big Safari, por su parte, opera con un hermetismo que roza lo litúrgico. Fundada en 1952, su especialidad es modificar aeronaves en plazos que la burocracia convencional no puede alcanzar y, con ello, sus tácticas. Para mantenerse en ventaja, los sistemas necesitan actualizarse sin pausa. Y para actualizarse, necesitan datos en idiomas que pocos hablan y menos aún han digitalizado.
Esa es la razón por la que Kenia se convirtió en un nodo clave del engranaje. Reclutar en Somalia era complicado por las sanciones internacionales, pero pescar en Kenia, el vecino de al lado, era más fácil. Y dentro de Kenia, los campamentos de refugiados eran el lugar donde más somalíparlantes nativos se concentraban, dispuestos a trabajar a cambio de un sueldo exiguo.
Y también en tu casa…
Pero el fenómeno no se limita al ámbito militar, y adquiere un tinte aún más siniestro cuando estas técnicas se aplican a ámbitos que nada tienen que ver con la seguridad. El mismo modelo de trabajo invisible que optimiza sistemas de inteligencia también alimenta hoy la inteligencia artificial comercial que millones de personas utilizan a diario. Otra investigación reciente del diario sueco Goteborg-Posten ha revelado que trabajadores en Kenia analizan imágenes captadas por las gafas inteligentes Meta Ray-Ban para ayudar a entrenar los sistemas de visión artificial de la compañía.
El proceso es similar al que siguieron los lingüistas improvisados de Kakuma: subcontratistas tecnológicos reclutan a trabajadores para revisar fotografías y vídeos con el fin de enseñar a los algoritmos a reconocer objetos cotidianos, escenas urbanas o acciones humanas. El material procede de usuarios que utilizan las gafas conectadas a la infraestructura de inteligencia artificial de Meta. Lo que muchos desconocen es que parte de esas imágenes termina siendo revisada por personas situadas a miles de kilómetros.
Según testimonios recogidos por investigadores, estos anotadores de datos pueden observar escenas captadas por las cámaras de las gafas mientras sus propietarios realizan tareas diarias. En ocasiones aparecen tarjetas bancarias, interiores de viviendas, conversaciones o momentos personales que los usuarios jamás imaginarían compartidos con terceros. El objetivo declarado es mejorar la capacidad de la inteligencia artificial para interpretar el mundo visual, pero el proceso expone fragmentos de la vida privada de millones de personas.
El paralelismo con el caso de los refugiados somalíes resulta inevitable. Tanto en el entrenamiento de sistemas militares como en el de plataformas comerciales de inteligencia artificial, el trabajo humano sigue siendo imprescindible. Detrás de los algoritmos que parecen comprender idiomas o reconocer objetos existe una red global de trabajadores invisibles que etiquetan datos, transcriben conversaciones o analizan imágenes. Sin ellos, las máquinas simplemente no aprenderían a ver ni a escuchar.
Sospechas ‘a posteriori’
La opacidad es una característica de este modelo de negocio. La sensación general de los participantes es que hacen algo incluso positivo, que ayuda a mejorar un sistema, un proceso o una maquinaria que ayudaría a la gente. Desconocen que pueden estar participando en una guerra en cualquier lugar del mundo. Descubrir que pueden estar poniendo a otras personas en peligro puede pesar en las conciencias durante años.
Muy a su pesar, hay quien denomina a estos trabajadores los albañiles invisibles del futuro de la tecnología. La compañía Appen, por su parte, no da explicaciones. En su último informe anual celebra la diversidad de su fuerza laboral y la amplitud de su cobertura lingüística. No menciona contratos de defensa.
Ismail, según recoge el Bureau of Investigative Journalism, abandonó Kakuma y hoy vive en otro lugar. Desconoce si su trabajo acabó en manos del ejército que operaba en su país de origen y probablemente nunca lo sabrá. Esa incertidumbre es la verdadera naturaleza del negocio: funciona porque nadie sabe del todo cómo funciona.
