Se puede detectar el texto de ChatGPT, Gemini y Claude?

La respuesta corta es sí, pero no de la forma que probablemente esperas. Los detectores de IA pueden identificar texto generado por ChatGPT, Gemini, Claude y otros modelos, pero tienen limitaciones importantes: funcionan mejor con textos más largos, dan falsos positivos, y un texto editado correctamente puede pasar desapercibido. No existe un método 100% fiable.

Desde que ChatGPT explotó en popularidad hace poco más de un año, la pregunta ha saltado de los laboratorios de investigación a los pasillos de universidades y redacciones: ¿cómo se detecta si alguien simplemente copió y pegó un texto generado por IA? La respuesta es más matizada de lo que parece.

Cómo funcionan realmente los detectores

Los detectores modernos de IA no analizan "vibraciones" ni intentan leer la intención del autor. Funcionan de forma mucho más técnica. La mayoría usa aprendizaje automático entrenado en millones de ejemplos de texto humano y texto generado por modelos específicos.

Estos sistemas buscan patrones estadísticos característicos de la IA: secuencias de palabras que los modelos de lenguaje favorecen, niveles de entropía (previsibilidad) específicos, o distribuciones de probabilidades que difieren del texto escrito por personas. Es decir, intentan captar eso que hace que el texto "suene" como IA, aunque no siempre lo explicitamos.

El problema es que estos patrones varían según el modelo utilizado y, más importante aún, dependen mucho del contexto. Un texto largo sobre un tema técnico es más fácil de detectar que un párrafo corto. Un tweet podría pasar por completamente humano. Un ensayo editado y reescrito pierde la mayoría de sus características de IA.

Detectar ChatGPT: la tarea más común

ChatGPT es el modelo más popular, así que también es el más estudiado. Hay detectores especializados que buscan patrones típicos de GPT-3.5 y GPT-4. Lo interesante es que estos modelos tienen características lingüísticas bastante reconocibles.

Por ejemplo, GPT tiende a ser más formal y estructurado. Suele usar un registro consistente, transiciones suaves y vocabulario variado. Esto que suena positivo para un lector humano es justamente lo que hace que se detecte: la falta de las pequeñas inconsistencias, los lapsos y los cambios de tono que caracterizan la escritura natural.

Hay herramientas específicas como Originality AI o Copyleaks que afirman tener tasas de precisión altas para detectar ChatGPT. Pero aquí viene el matiz importante: esas tasas se calculan en condiciones controladas. En la práctica real, con textos reales, una persona que se esfuerza un poco por editar y personalizar el contenido puede reducir significativamente las probabilidades de detección.

Gemini, Claude y otros modelos

Google Gemini y Anthropic Claude generan texto con características ligeramente diferentes. Claude, por ejemplo, tiende a ser más conversacional e inclusivo con su audiencia. Gemini tiene su propio patrón de distribución de palabras y estructuras sintácticas.

Algunos detectores funcionan generalmente bien contra todos los modelos, mientras que otros están entrenados específicamente en uno o dos. Esto significa que un detector de IA ChatGPT podría fallar detectando texto de Claude, o viceversa. El panorama es fragmentado.

Además, con la evolución constante de estos modelos —nuevas versiones cada pocos meses— los detectores quedan obsoletos rápidamente. Un detector entrenado hace seis meses puede estar ya desactualizado frente a las versiones más recientes.

Por qué los detectores fallan (y no es por culpa tuya)

La razón fundamental es que no existe una frontera clara entre el texto humano y el generado por IA. Hay humanos que escriben de forma muy estructurada y uniforme. Hay IA que, después de varias iteraciones de ajuste, puede sonar muy natural. Las distribuciones estadísticas se solapan.

Los falsos positivos —marcar como IA un texto completamente humano— son más comunes de lo que te gustaría. Un académico escribiendo un artículo técnico, un redactor muy disciplinado, o simplemente alguien escribiendo con cuidado puede activar las alarmas sin justificación.

Los falsos negativos también existen. Un usuario que toma el texto de ChatGPT, lo edita, añade sus propias experiencias, lo personaliza y lo reescribe parcialmente puede conseguir que pase todos los detectores. Esto no es un defecto de los detectores; es un reflejo de que el problema en sí es ambiguo.

Cómo humanizar texto de ChatGPT reduce detectabilidad

Si tu preocupación es que texto escrito con ayuda de IA pueda ser detectado, la solución no es confiar en que los detectores fallen. Es mejorar el contenido. Al humanizar texto de ChatGPT introduces variabilidad natural, cambios de tono, ejemplos específicos del mundo real y una voz propia. Esto hace dos cosas a la vez: el texto es más valioso para tus lectores, y automáticamente se vuelve más resistente a la detección.

Cuando editas un texto generado por IA, lo cortas, lo expandes, añades anécdotas o datos propios, introduces preguntas retóricas e interrumpes la uniformidad estadística del modelo original. Es un trabajo honesto que mejora el resultado.

El contexto importa: dónde se detecta más

Los detectores son mucho más precisos en ciertos contextos. En universidades, muchas plataformas de detección académica (como Turnitin con su módulo específico) tienen acceso a modelos más avanzados y a grandes volúmenes de texto para comparación. Aquí la tasa de detección es mayor.

En redes sociales, un tweet o un hilo que mezcla IA con reflexión personal es prácticamente imposible de detectar de forma fiable.

Para contenido web, un artículo de blog completamente generado por IA es detectble, pero uno editado y adaptado es mucho menos probable que lo sea.

Preguntas frecuentes

¿Existe un detector de IA 100% fiable? No. Ningún detector actual tiene precisión del 100%. Todos tienen limitaciones y están sujetos a falsos positivos y falsos negativos. Los que afirman tener 100% de precisión están mintiendo.

¿Qué pasa si edito un texto de ChatGPT antes de publicarlo? Mejora significativamente. Al añadir tu voz, cambiar frases, añadir ejemplos específicos o ajustar el tono, reduces drásticamente el riesgo de detección. Además, el contenido es mejor.

¿Es ilegal usar ChatGPT para escribir, aunque lo edite después? Depende del contexto. En la educación, muchas instituciones lo prohíben. En empresa, no. En contenido web, es completamente legal siempre que el contenido sea útil y no engañes al lector sobre su origen.

¿Funcionan mejor los detectores con textos largos o cortos? Con textos largos. Cuantas más palabras tengas, más patrones estadísticos se pueden analizar. Un párrafo de dos frases es muy difícil de clasificar de forma fiable.

¿Detectan todos los detectores igual? No. Cada detector tiene diferentes niveles de precisión según el modelo de IA, el tipo de contenido y la longitud del texto. Algunos funcionan mejor con ChatGPT, otros con Claude o Gemini.

Si necesitas entender mejor cómo funcionan estas herramientas antes de confiar en ellas, te recomiendo leer sobre cómo funcionan los detectores. Y si lo que te importa es que tu contenido sea publicable sin preocupaciones, la mejor inversión es en edición y humanización.

Prueba nuestro detector de IA para analizar tus textos y ver qué tan cercano están de parecer completamente humanos. No es una bola de cristal, pero sí te da datos reales sobre cómo te ve una máquina.