La prensa española veta el acceso de la IA para evitar que se entrene con sus noticias
La mitad de los grandes grupos de comunicación nacionales levanta barreras a Claude, ChatGPT y Gemini

Imagen virtual de la IA.
Casi la mitad de los portales web de medios de comunicación españoles ha puesto freno a la recopilación masiva de datos por parte de plataformas de inteligencia artificial (IA) como Claude, Gemini y ChatGPT. En concreto, un 46% de los casi 150 portales analizados por la consultora de marketing e IA Vipnet360 impone algún tipo de restricción de acceso a sus contenidos mediante la configuración de sus archivos técnicos. El 52% restante mantiene la vía libre para la entrada de estos sistemas.
La auditoría hecha por Vipnet360 se realizó a través de la herramienta especializada AIBrandPulse360, que tomó como referencia una muestra transversal de portales de información generalista, económica, deportiva, regional, televisión, radio y cabeceras sectoriales. La investigación analizó las restricciones establecidas frente a diez rastreadores de las principales corporaciones del sector, distinguiendo entre bots orientados al entrenamiento de modelos y aquellos diseñados para la búsqueda en tiempo real.
El estudio revela que las barreras aplicadas por los editores españoles no son absolutas, sino que responden a una estrategia de bloqueos selectivos. Esta discriminación se fundamenta tanto en la identidad de la empresa tecnológica que opera el bot como en la finalidad específica del rastreo. La hostilidad de los medios es notablemente superior hacia aquellos algoritmos cuya función exclusiva es absorber contenidos para nutrir el entrenamiento de futuros modelos de lenguaje. Sin embargo, los denominados ‘bots de agente’ —herramientas que solo acceden a una dirección web cuando un usuario lo solicita explícitamente desde un chat— registran un índice de bloqueo tres veces menor, situándose en un 10,6% frente al 37,2% de los bots de entrenamiento.
Claude es el más rechazado
En el análisis individual, ClaudeBot, desarrollado por Anthropic, se sitúa como el rastreador más rechazado por el ecosistema de medios, al verse vetado en el 45,9% de las webs de información. Le siguen de cerca GPTBot, la herramienta de OpenAI (ChatGPT), con un 43,2% de bloqueos, y PerplexityBot, con un 32,2%. En una posición más favorable se encuentra Google-Extended, el bot vinculado a los modelos generativos de Google —como Gemini—, que solo experimenta restricciones en el 27,4% de los portales.
El perfil editorial del medio de comunicación influye de manera crucial en su política de apertura o restricción hacia la inteligencia artificial. En el grupo del 52% que permite el acceso a los diez rastreadores analizados, conviven actores institucionales y corporativos de gran envergadura. Este es el caso de las grandes cadenas nacionales de televisión (RTVE, Antena 3, La Sexta, Telecinco y Cuatro), las principales agencias de noticias del país (Efe y Europa Press), y un consolidado segmento de publicaciones digitales especializadas en tecnología, entre las que destacan Xataka, Hipertextual y Computerhoy.
La prensa local es la más restrictiva
La prensa local y regional destaca como el bloque sectorial más restrictivo con la IA que recolecta datos. Estas cabeceras bloquean un promedio de 3,75 bots de los diez analizados, y entre el 49% y el 78% de sus portales impide activamente el paso a, como mínimo, un rastreador por compañía. Una tendencia similar se observa en la prensa deportiva, con una media de 3,67 restricciones, y en los portales dedicados al turismo, que registran un índice de 3,33 bloqueos en promedio, arrastrados por políticas drásticas como el veto total detectado en el portal Preferente.
Grupos de comunicación como Vocento (con una media de 5,8 bloqueos en 14 cabeceras), Unidad Editorial (5,8 bloqueos en 4 cabeceras) y Prensa Ibérica (5,6 bloqueos de promedio en 15 cabeceras) encabezan los índices de hermetismo digital. Estos números contrastan con la postura de PRISA o el Grupo Joly, que registran un promedio significativamente menor, fijado en 3,0 bloqueos. Los medios nativos independientes se mantienen como los más permeables, con una tasa de restricción de apenas un 1,1.
