Así funciona el gran bazar de los microgéneros en Netflix
Los algoritmos de Netflix trazan el comportamiento de los usuarios, pero necesitan apoyarse en el trabajo de los etiquetadores que describen el contenido de las obras (sexo, guerra, crimen) y sus efectos sobre el espectador (miedo, motivación, paz)
Cuando al entrar en Netflix encontramos que se nos sugieren tres franjas, una para «Comedias tronchantes de inspectores de policía», otra para «Dramas románticos británicos basados en libros» y una tercera de «Dramas sensuales de temática LGBT», nos podemos hacer muchas preguntas, no solo sobre los algoritmos de recomendación de contenidos, sino sobre quién y cómo le pone nombre a las cosas.
Netflix no es un catálogo de películas sino, usando el término de Robert J. Glushko en su libro The discipline of organizing, un «sistema de organización». Y la vida en sociedad está hecha justo de eso, de cosas que organizamos que forman entornos que entendemos y a los que es necesario poner nombres.
Amarrar un significado en construcción con una palabra acertada es una obra mágica, una ingeniería del lenguaje, un arte menor. Pero, volviendo a los rótulos que identifican a las líneas de películas que nos sugiere Netflix, ¿a qué se le está poniendo nombre?
Netflix está proponiendo nombres para «colecciones de recursos», agrupaciones de contenidos que guardan una serie de afinidades temáticas, estructurales, de estilo o de producción. Lo que entendemos a simple vista como «géneros audiovisuales». Está, al mismo tiempo, construyendo un vocabulario controlado o una clasificación de géneros e indizando, categorizando recursos al asignarles esos géneros a unas obras. Sin embargo, la idea convencional de género o clasificación, cuando pasa por la batidora termonuclear del Big Data y el consumo digital hiperpersonalizado, se convierte en un Gremlin que ha comido después de medianoche.
Drama y acción no se llaman así en la plataforma
Los géneros como drama, acción, cine de terror, que en cualquier monografía sobre cine podemos ver extendidos y detallados, se convierten en Netflix en una montaña de hasta 79.000 pies de altura, según el instrumento de excavación y medida que usemos) que la compañía denomina microgéneros o altgenres. En una exploración podemos extraer más de 20.000 microgéneros, junto con la lista de las películas que aparecen recomendadas para un usuario concreto de la plataforma.
Sobre el sistema de recomendación de Netflix se ha escrito mucho, y es seguramente una de sus fórmulas mágicas para hacer funcionar su invento, pero vamos a plantearnos preguntas sobre el etiquetado, sobre el nombre de las cosas.
Existen muchas técnicas para hacer agrupaciones –análisis de diferentes grupos por similitud, clustering en inglés– a partir de colecciones extensas de recursos usando los datos disponibles sobre ellos: datos propios, datos de uso o sus relaciones.
La inteligencia artificial y sus decisiones
Aplicando cualquier modelo de agrupamiento podemos obtener grupos significativos que nos presentan afinidades que a simple vista no eran fáciles de prever. Pero estos conjuntos, desde el punto de vista de la comunicación cultural, adolecen del clásico problema de algunos casos de aplicación de la inteligencia artificial, es difícil explicitar la motivación de las decisiones y el por qué de su elección.
Cuando Amazon nos hace recomendaciones y nos dice que «otras personas también compraron» tal o cual cosa, no nos explica qué nos gusta y por qué. Cuando Google nos recomienda contenido al buscar, no pone en palabras lo que nos interesa, no nos etiqueta, mientras que cuando Netflix nos coloca un rótulo como «Dramas motivadores basados en libros» nos recomienda y al mismo tiempo nos explica la razón por la que nos va a gustar, pone en palabras el gusto (el género, el patrón) con el que podemos reconocernos en la propuesta, e incluso pretende explicarnos nuestro comportamiento como consumidores.
Las consecuencias de las clasificaciones
Toda clasificación tiene sus consecuencias, como explican Geoffrey Bowker y Susan Leigh Star, puesto que es una infraestructura construida socialmente: crea un espacio para lo posible y unas relaciones entre las cosas. Y Netflix lo hace sin complejos, entendiendo, con toda lógica, que para poder conectar altos volúmenes de contenido con altísimos volúmenes de usuarios poseídos de un incansable deseo de consumo, hace falta disparar muchas flechas en muchas direcciones diferentes, y que las grandes etiquetas tradicionales como drama o comedia no se pueden lanzar en una flecha, sino con una catapulta.
En la punta de la flecha solo cabe una pequeña tira de papel enrollada, un microgénero, una descripción directa para asignar sentido a una agrupación de contenido y acertar al usuario en el corazón y pasarle su veneno. El gran contenido necesita minimetadatos, muy detallados y muy granulares.
Y aquí la plataforma digital ha tomado la larga experiencia de clasificación en bibliotecas, con sus ideas de precoordinación, precisión, neutralidad y ordenación del conocimiento, y las ha llevado a otro nivel. Monumentales sistemas que listan términos apropiados para temas y subdivisiones de materias por géneros, como la Lista de Encabezamientos de Materias de la Library of Congress, han sido invadidos por cuerpos mutantes, juguetones y desvergonzados, que se atreven a llamar a ciertas películas «Lacrimógenas genuinas».
Los algoritmos de la plataforma trazan el comportamiento de los usuarios, pero necesitan apoyarse en el trabajo de los etiquetadores que describen aspectos relevantes del contenido de las obras (sexo, guerra, crimen) y de sus efectos sobre el espectador (miedo, motivación, paz). Y, además, proponen nombres para los microgéneros, transgrediendo sin complejos toda la literatura sobre organización del conocimiento: clasificación, categorización, encabezamientos de materias, etc.
Y es aquí donde las grandes bases de datos y plataformas de contenidos han quebrado la teoría clásica sobre cómo organizar información que se ha aplicado en bibliotecas y archivos, entidades con quienes comparte el reto de dar acceso a un catálogo o un fondo amplio de recursos, cuyo valor se le supone pero ha de ser puesto en movimiento para que se haga real.
Podríamos llamar a todo esto big content, contenido no solo en grandes cantidades, sino sometido a grandes cantidades de uso. Big ya lo hemos asumido como pareja de baile del termino «datos» en la expresión Big data.
Big es masivo, más que grande, enorme, de un tamaño inabarcable. Y para que el contenido masivo sea abarcable necesita mejores metadatos, descripciones más profundas que permitan el acceso intelectual a través de una red muy densa de vías de entrada: películas ambientadas en la revolución francesa, libros en los que la esposa adúltera sea castigada por la sociedad, novelas de ciencia ficción en las que haya contacto con alienígenas, cuadros en los que aparezcan perros, películas con actrices que hayan rodado películas con James Dean…
Enriquecer, luego filtrar
A todo esto, la teoría actual sobre bibliotecas digitales lo llama «enriquecer, luego filtrar»: son necesarios muchos datos descriptivos de partida que puedan ser enriquecidos posteriormente por diversos grupos de interés para, desde ellos, producir el filtrado que necesitemos para posibilitar la experiencia de uso.
Porque la sociedad de la información ubicua y masiva tiene un problema de filtrado, presente en cada una de sus facetas: el cine, la búsqueda, la investigación, la participación ciudadana, las citas en línea… Para todo aquello que podemos tratar como un contenido, la curación o curaduría trata de intervenir en esas geometrías irregulares y fluctuantes de la recomendación, el descubrimiento y la valoración de información relevante para el individuo y para el colectivo.
Los motores de recomendación son un mecanismo tan necesario como los motores de indización. La nueva arquitectura de la realidad –los microgéneros de Netflix, las búsqueda de Google, el catálogo infinito de Amazon– convierte en arqueología a aquellos sistemas que, de buena fe, ofrecen un catálogo pequeño, sin recomendaciones, sin búsqueda inteligente, cuidado a mano como un mural escolar, con pocas etiquetas…
¿Puede un pequeño catálogo de libros electrónicos como el servicio eBiblio de las bibliotecas públicas españolas vivir alejado de sistemas de descubrimiento y recomendación de obras? ¿Puede un servicio basado en un catálogo no ser como Netflix?
La película Anna Karenina, de 2012, está asignada a 53 microgéneros en Netflix; a 2 géneros y 67 palabras clave en la web de calificación de películas IMbd; a 7 géneros o agrupaciones en Filmaffinity y solo al género «Dramas románticos cinematográficos» en el catálogo de la Biblioteca Nacional. ¿Cuántas etiquetas son suficientes? Pues se necesitan muchas sobre muchas cosas y usadas mucho y de mil maneras.
Este artículo fue publicado originalmente en The Conversation. Lea el original.