Norkel Muy curioso el asunto, esos filtros actúan después de que plasme la IA el texto "prohibido" o ni siquiera se llega a plasmar?
Pues no lo sé seguro, a ver si @QuentinTarantiros lo sabe.
En respuestas escritas parece que es cuando empiezan a escribir. Las IAs funcionan con redes neuronales, que resumiendo son movidas matemáticas con datos gigantescos y nadie (y me refiero a nadie, ni los creadores) saben bien como funcionan. Así que es como un filtro que se pone "a posterior" y cuando "se da cuenta" de la treta se cancela.
Por ejemplo, con las IA Chinas si preguntas si Taiwán es un país te capará la respuesta y te dirá que no puede hablar de ello. Pero si le preguntas que te hable de una foto famosa de un hombre sujetando bolsas, empezará a pensar y a escribir... hasta darse cuenta que esa es el hombre del tanque, de la plaza de Tiananmen, y cerrar la respuesta.
En Occidente pasa igual, pero con las neuras usanas: Si le preguntas como insultar a un negro, te mandará a la mierda. Si le preguntas como se llamba el gato de Lovecraft, empezará a escribir y le dará una neura al darse cuenta que es Nigger-man.
Todo ésto lo puedes comprobar tú, no me invento nada. O igual lo han actualizado.
Y hay formas de saltártelo claro. Siendo ingenioso.
Lo que me lleva a que todo éste post es una trampa para poneros uno de mis memes favoritos: