Cómo funciona un detector de IA (perplejidad y burstiness explicados)

Un detector de IA funciona analizando patrones estadísticos en el texto: mide la perplejidad (qué tan predecible es el lenguaje) y la burstiness (la variabilidad en cómo se expresan las ideas). Los modelos de IA tienden a generar texto más uniforme y predecible que los humanos, y estos detectores explotan esa diferencia. Pero aquí viene lo importante: no son infalibles, generan falsos positivos constantemente y sus limitaciones son mayores de lo que la mayoría cree.

Qué son la perplejidad y la burstiness

La perplejidad es una métrica que mide cuánta "sorpresa" hay en cada palabra. Imagina que estás leyendo un texto y prediciendo la siguiente palabra. Si aciertas fácilmente porque todo es predecible, la perplejidad es baja. Si te sorprende constantemente porque el autor elige palabras inesperadas, la perplejidad es alta.

Los humanos escribimos con perplejidad variada. A veces somos predecibles (al escribir instrucciones, por ejemplo), y a veces saltamos a referencias inesperadas o utilizamos vocabulario que rompe el patrón. Un modelo de IA, entrenado para maximizar la probabilidad estadística, tiende a elegir siempre la opción más segura, más probable. Resultado: texto más plano, más uniforme, perplejidad más baja.

La burstiness está relacionada pero va más allá. Es la variabilidad en esa perplejidad a lo largo del texto. Los humanos tenemos "ráfagas" de escritura más arriesgada seguidas de párrafos más controlados. Podemos ser creativos una frase y luego pragmáticos la siguiente. Los modelos de lenguaje tienden a mantener un nivel de perplejidad muy constante, como si toda la textura del lenguaje fuera del mismo grosor.

Pongamos un ejemplo real: si escribo "El gato saltó por la ventana", es predecible. Pero si escribo "El murciélago se adentró en la geometría fractal del atardecer", es inesperado. Un humano que escribe sobre gatos puede hacer ambas cosas en el mismo párrafo. Un modelo de IA suele mantener un nivel intermedio, evitando extremos.

Cómo los detectores miden estas métricas

Los detectores de IA modernos analizan secuencias de texto y calculan, para cada palabra, cuál es la probabilidad que un modelo de lenguaje le asignaría. Si la probabilidad es muy alta (palabra muy predecible), contribuye a una perplejidad baja. Luego observan cómo varía esa perplejidad entre frases y párrafos.

Algunos detectores utilizan modelos de lenguaje específicamente entrenados como "clasificadores". Se les da ejemplos masivos de texto humano y texto generado por IA, y aprenden a encontrar diferencias más sutiles que solo la perplejidad. Otros utilizan enfoques estadísticos puros, sin redes neuronales.

El problema: estos detectores se entrenan con textos generados por un modelo específico (ChatGPT, Claude, Gemini, etc.). Si el texto viene de un modelo diferente, o si ha sido editado después, el detector pierde precisión. Es como entrenar a un perro a identificar el olor de un criminal específico y luego esperar que reconozca a todos los criminales del mundo.

Por qué fallan y dan falsos positivos

Los detectores fallan por varias razones fundamentales.

Primero, la diferencia entre humano e IA se reduce cada día. Conforme los modelos mejoran, generan texto más variable, más impredecible, más similar al humano. Un texto generado por el modelo más avanzado de hoy es más "humano" que el de hace dos años.

Segundo, los humanos escribimos de muchas formas. Un ingeniero técnico escribe de manera muy diferente a un novelista. Un adolescente en redes sociales escribe diferente a un abogado. El detector entrenado con un corpus general puede confundir escritura consistente o formal de un humano con escritura de IA.

Tercero, el texto editado es casi imposible de detectar. Si coges un párrafo generado por IA y lo editas, cambias palabras, añades una anécdota personal, lo reescribes parcialmente, el detector ya no reconoce el patrón que buscaba. El texto pierde la "firma estadística" de la IA.

Cuarto, los modelos más nuevos están entrenados con datos que incluyen texto generado por IA. Esto significa que su salida natural es "más humana" de lo que esperaba el detector, que se entrenem con datos anteriores.

Por eso los falsos positivos son tan comunes. Un informe técnico bien estructurado, un email formal, un resumen académico redactado por un humano que se esfuerza por ser claro y preciso... puede obtener una puntuación alta de "probable IA" simplemente porque prioriza la claridad sobre la variabilidad.

Qué modelos intentan detectar los detectores

La mayoría de detectores modernos se entrenan primariamente con textos de:

ChatGPT (todas las versiones: 3.5, 4, 4o)
Claude (Opus, Sonnet, Haiku)
Gemini (Google)
LLaMA (Meta)
Cohere

Pero es un esfuerzo en perseguir un objetivo que se mueve. Cada nuevo lanzamiento requiere reentrenamiento. Un detector de hace seis meses probablemente no identifica bien los textos generados por modelos de hace un mes.

Además, muchos detectores no contemplan los fine-tuned models (modelos específicamente ajustados para un dominio o cliente). Si entrenamos un modelo privado con corpus muy específicos, los detectores públicos apenas lo reconocen.

La honestidad sobre la fiabilidad

Son fiables los detectores de IA es una pregunta que responde claramente: no son tan fiables como vende el marketing. Su precisión típica está entre 65-85% en el mejor de los casos, y baja significativamente con textos editados o con modelos que no fueron parte de su entrenamiento.

Un detector que te da "87% de probabilidad de IA" no significa que hay 87% de posibilidades de que sea IA. No funciona así. Significa que el algoritmo ha encontrado ciertos patrones que considera similares a la IA, pero eso no es una probabilidad en el sentido clásico. Puede estar completamente equivocado.

Cuándo los detectores funcionan mejor (y cuándo fallan)

Los detectores funcionan relativamente bien cuando:

El texto es muy largo (1000+ palabras). Eso les da más superficie estadística.
El texto es genérico y no requiere conocimiento específico. Un resumen de Wikipedia generado por IA es más reconocible.
El texto es completamente generado sin edición manual posterior.
Es uno de los modelos grandes entrenados en el detector.

Fallan especialmente con:

Textos cortos (menos de 300 palabras). No hay suficientes datos estadísticos.
Textos altamente especializados (papers científicos, código, poesía). El detector no tiene baseline humano comparable.
Cualquier texto que haya sido editado, aunque sea parcialmente.
Escritura de humanos que naturalmente es muy consistente o formal.

Qué significa esto para ti

Si estás preocupado por si tu texto ha sido generado por IA, la respuesta es simple: un detector nunca debería ser la única prueba. Es contexto. Si alguien te acusa de usar IA basándose solo en un detector, especialmente sin revisar el texto manualmente, esa acusación es débil.

Inversamente, si generaste un texto con IA, no confíes en que un detector lo identifique. Especialmente si después lo has editado y reescrito. Es probable que pase desapercibido.

El enfoque correcto es editar y humanizar el contenido generado. Cómo humanizar un texto de IA no es solo sobre evitar detectores: es sobre darle voz propia, hacerlo genuino, añadirle perspectiva y ejemplos que solo tú puedes aportar.

Si necesitas verificar si un texto tiene características de IA, prueba con detector de IA gratis pero tómalo como información complementaria, no como veredicto final.

Preguntas frecuentes

¿Puede un detector detectar texto 100% humanizado? No. Si el texto ha sido suficientemente reescrito por un humano, el detector perderá precisión. Cada cambio manual rompe los patrones estadísticos que busca.

¿Detectan todos los detectores lo mismo? No. Cada uno utiliza algoritmos diferentes, modelos de entrenamiento diferentes y conjuntos de datos diferentes. Un texto puede ser "IA" en un detector y "humano" en otro. Es común ver resultados contradictorios.

¿Sirven los detectores para académicos? Con mucho cuidado. Una universidad que condena a un estudiante basándose solo en un detector sin análisis manual está cometiendo un error. Los falsos positivos son demasiado comunes y las consecuencias demasiado graves.

¿Qué pasa con el texto generado por GPT-5 o modelos futuros? Los detectores entrenadosoy hoy serán obsoletos. Ningún detector actual está preparado para modelos que no existían cuando se entrenó.

¿Debo usar un detector para saber si mi contenido parece IA? Es útil como indicador, pero no como sentencia. Mejor estrategia: edita tu contenido, añade ejemplos personales, reescribe secciones con tu voz, verifica que realmente transmita lo que querías decir. Ese proceso natural de humanización es más confiable que cualquier detector.