Mediante un post en la red social X (antigua Twitter), DeepMind, subsidiaria de Google dedicada al desarrollo de soluciones de inteligencia artificial, ha anunciado que libera, en código abierto, el sistema de marca de agua y reconocimiento de contenidos generados por inteligencias artificiales SynthID. De esta forma, dicho sistema podrá ser integrado en soluciones de IA generativa, ayudando a que estos sean identificados.
Esta herramienta introduce una marca de agua digital en los contenidos generados mediante sistemas de IA, ya sean estos textos, imágenes, vídeo o audio. Dicha marca es imperceptible a los ojos humanos, pero identificable mediante sistemas informáticos. En estos momentos, SynthID se encuentra en versión beta, y DeepMind continúa evolucionándola.
La apertura de su código fuente permitirá no solamente adicionar el mismo tipo de marcaje a otros modelos de lenguaje, sinó que también permitirá que terceras partes desarrollen nuevas soluciones a partir de él, modificándolo.
Google ya utiliza este sistema en sus servicios y aplicaciones de inteligencia artificial, cómo las distintas versiones de Gemini.
El objetivo último de SynthID es poder identificar las fake news generadas mediante sistemas de IA y que se postean día sí, día también, en las redes sociales, intoxicando la información que recibimos. También para prevenir el uso ilícito de las herramientas de generación de texto mediante IA en entornos educativos, como institutos y universidades, y en entornos laborales.
Según indican desde la misma DeepMind, la marca de agua digital que SynthID introduce en los contenidos, soporta ediciones y cambios tales cómo la reordenación, la adición de ‘ruido’ digital, la compresión, el recorte (por ejemplo, en las imágenes, seleccionando solamente una parte de estas), o la aplicación de filtros.
Para ello, en el caso de las imágenes, SynthID genera una marca de agua embebida directamente en los píxeles que conforman la imagen, mientras que para el vídeo se marca cada frame que conforma el metraje; para el audio se convierte la señal en un espectrograma (representación visual del sonido) en el que se marca de la misma forma que una imagen y, luego, se reconvierte a un sonido; finalmente, para el caso de los contenidos de texto, utiliza sinónimos que no varían en absoluto el significado global del texto ni su calidad, pero que pueden ser detectados por el sistema de identificación.
Pese a que su sistema da ciertas garantías para el reconocimiento de los contenidos, especialmente en todo lo que no sea texto, en este último caso puede dar tanto falsos positivos como no reconocer textos que, tras ser generados mediante IA, son modificados manualmente, ya que pueden romper los patrones utilizando otra IA distinta para reescribir dichos textos, o bien traducirlos.