En un comunicado publicado recientemente, la Wikipedia prohibe el uso de modelos de lenguaje grandes (LLM por sus siglas en inglés) en la redacción de artículos o partes de estos en la enciclopedia libre, aunque permite dos excepciones: en primer lugar, su empleo para sugerir correcciones básicas a los contenidos redactados por un humano, aunque no admite la adición directa de dichas correcciones en dichos contenidos, sinó su uso por parte de la persona para mejorar manualmente dichos contenidos.
La segunda excepción que se permite para el uso de IA generativa en la Wikipedia consiste en la realización de traducciones idiomáticas, aunque la publicación del artículo final debe seguir estrictamente los criterios de traducción asistida por LLM marcados por la misma organización.
Adicionalmente, desde la entidad se advierte de que si se halla algún texto que parece redactado por IA, el autor deberá demostrar más allá de la duda y de la mera coincidencia de estilos de redacción, que el texto es original suyo, y no redactado de forma automática.
En otro documento sobre los riesgos de la redacción mediante inteligencia artificial, la Wikipedia cita que los LLM presentan riesgos sistémicos al redactar información factual, debidos a su diseño y a la naturaleza de su entrenamiento, resultando estadísticamente inevitable que inventen datos, un fenómeno conocido como alucinación, además de llegar a conclusiones que carecen de fuentes comprobables o aceptar premisas absurdas en las peticiones de los usuarios.
A pesar de estos fallos, los textos producidos suelen mostrar un tono de seguridad y plausibilidad que dificulta la detección de errores por parte de los revisores humanos. Siguiendo con el razonamiento de Wikipedia, este problema se agrava cuando se trata de temas complejos o poco conocidos.
Los problemas de verificabilidad y derechos de autor en los textos que producen los modelos de lenguaje se deben a que tienen la capacidad de incluir fragmentos literales de contenido protegido o constituir obras derivadas.
Además, algo que preocupa a la organización de la Wikipedia es que el estado legal del material con el que han sido entrenados estos modelos no está del todo claro, lo que complica su uso en plataformas que requieren licencias libres.
Por todo esto, los textos creados mediante inteligencia artificial no son considerados por la Wikipedia como fuentes fidedignas y, por lo tanto, prohibidos.