Un análisis pericial advierte de que los audios de Koldo impiden verificar la voz de Cerdán
El informe concluye que la señal es tan baja que se pierde información acústica y los resultados no son concluyentes

Koldo García y el ex secretario de Organización del PSOE Santos Cerdán. | Ilustración de Alejandra Svriz
La mala calidad de los audios de Koldo García impide verificar la voz de Santos Cerdán de forma contundente. Un análisis pericial elaborado por DTec Biometría al que ha tenido acceso THE OBJECTIVE de forma extractada señala que los metadatos no admiten dudas de que se trata de una de las personas que aparece. Sin embargo, en los pasajes donde habla el ex secretario de Organización del PSOE la señal es tan baja que se pierde información acústica y los resultados no son concluyentes. El dirigente navarro y el exministro José Luis Ábalos cuestionan la veracidad de las grabaciones, a las que los investigadores y el juez del Tribunal Supremo Leopoldo Puente otorgan total credibilidad.
DTec Biometría ha analizado una grabación efectuada a las 12.08 horas del 22 de abril de 2019 en la que aparecen Koldo García y Cerdán. La exploración, que conoce la Guardia Civil, realiza un estudio espectral de los audios para determinar su calidad objetiva y cómo se puede apreciar subjetivamente los segmentos en los que interviene el ex secretario de Organización del PSOE, en prisión preventiva desde el pasado 30 de junio.
En los espectrogramas se aprecia que en el caso de Koldo García hay bastante información, hasta los 8 kilohercios (kHz), mientras que en los de Cerdán «hay mucha pérdida de información con una relación señal/ruido (SNR) muy baja» y apenas supera los 4 kHz. Los técnicos también han realizado un análisis con un software especial denominado TruePersona capaz de detectar en tiempo real si la voz pertenece a un ser humano o está desarrollada con inteligencia artificial (IA).
La estrategia de Cerdán
Para que una voz sea considerada humana la puntuación TrueScore debe superar el umbral del 50%. Cuanto más alto es el valor, mayor seguridad en el resultado. El análisis de DTec Biometría sostiene que los segmentos en los que interviene Koldo García oscila en valores de TrueScore entre 56 y 84%, dependiendo de la calidad de los diferentes pasajes de la grabación. «Se trata sin duda de una voz humana», concluye la pericial. Las dudas surgen al analizar la voz de Cerdán.
Los segmentos en los que interviene el ex secretario de Organización del PSOE arrojan valores de TruScore entre el 36 y el 50%. Muchas partes en las que habla Cerdán están por debajo del umbral del 50% y solo en algunos momentos lo supera, por lo que «debido a la mala calidad detectada en el audio, los resultados no son concluyentes». Una situación que podría dar alas a la estrategia procesal de los investigados de impugnar la autenticidad de las grabaciones realizadas por Koldo García.

Las defensas de Cerdán y Ábalos llegaron a sugerir que las voces se habían generado a través de IA, algo que los expertos de DTec Biometría rechazan: «Por nuestra experiencia, todo apunta a que la voz es humana y las puntuaciones son inferiores debido a la baja SNR». Los peritos también han sometido el audio a un análisis biométrico con un software de voz denominado BioVox.
El procedimiento ha sido extraer intervenciones claras y verificadas de Koldo García y el ex secretario de Organización del PSOE para generar sus firmas de voz de referencia indubitada. Los resultados obtenidos son muy similares a los que arrojó TruScore. Los segmentos en los que aparece el antiguo asesor ministerial oscila en valores entre el 50 y el 56%, mientras que en los que interviene Cerdán no alcanza el 30%. Eso supone que los resultados, en este caso, tampoco sean concluyentes.
Registro en la casa de Koldo
La investigación acumula más de 15 horas de conversaciones entre Koldo García, Ábalos y Cerdán. Las grabaciones suponen la base del último informe de la Unidad Central Operativa (UCO) de la Guardia Civil. Los audios se encontraron en el registro de la vivienda del exasesor ministerial en febrero del año pasado. Los agentes intervinieron 23 teléfonos móviles y una grabadora digital. Siete de las ocho grabaciones estaban en tres de esos terminales.
El acta de registro detalla la fecha y la hora en que se realizaron las grabaciones gracias a los metadatos de los archivos. Los dispositivos intervenidos a Koldo García fueron clonados por la UCO con Cellebrite. El Ministerio del Interior adjudicó el pasado 9 de julio un nuevo contrato de 2,15 millones de euros al software israelí que utilizan los Cuerpos y Fuerzas de Seguridad.
En el caso de las grabaciones de Koldo García, los agentes lograron una copia exacta del contenido. Estas disponen de un código alfanumérico llamado hash que cambia si se modifica, algo que descartan los investigadores. Gracias a Cellebrite han podido certificar que los audios en los que aparecen Ábalos y Cerdán son reales. En uno de ellos el exministro y su asesor llegan a hablar de que han recibido 620.000 euros y de que aún se les adeudan otros 450.000 euros.
Ábalos y Cerdán han puesto en tela de juicio la autenticidad de las grabaciones afirmando que algunas de ellas pueden estar manipuladas. Han asegurado que no reconocen en esas voces y sugerido que pudieron haberse creado mediante IA. De seguir en esa línea de cuestionamiento a la identidad de las voces, la cuestión tendría que resolverse mediante un informe forense como el que ya ha practicado DTec Biometría. El objetivo de los investigados es tumbar los audios como prueba.
Descarta el uso de IA
No solo la UCO; el juez que investiga el presunto cobro de mordidas a cambio de amaños en adjudicaciones de obras públicas también descarta la tesis de los investigados. Puente subrayó en el auto con el que mandó a prisión a Cerdán de que no existe ningún indicio de que los audios hubiesen sido editados «omitiendo, alterando o manipulando el curso natural de la conversación». En su opinión, esa cuestión sería «fácilmente acreditable» por los expertos.
«Parece difícilmente concebible, atendiendo además a la relativamente mala calidad del sonido, que las grabaciones no se hubieran producido en realidad y que resultaran consecuencia de una artificiosa manipulación» mediante «procedimientos vinculados al uso de la inteligencia artificial u otro equivalentes», resalta el magistrado. Puente concluye que no existe ningún elemento «con mínima seriedad» que permita concluir que las grabaciones han sido «manipuladas, alteradas o simuladas».