Cómo funciona la marca de agua ChatGPT y por qué podría ser superada

ChatGPT de OpenAI ha introducido una forma de crear contenido automáticamente, pero los planes para introducir una función de marca de agua para una detección más fácil están poniendo nerviosas a algunas personas. Así es como funciona la marca de agua ChatGPT y por qué puede haber una manera de vencerla.

ChatGPT es una herramienta increíble que los editores en línea, los afiliados y los SEO adoran y temen.

A algunos especialistas en marketing les encanta porque están descubriendo nuevas formas de usarlo para generar resúmenes de contenido, reseñas y artículos complejos.

Los editores en línea temen la posibilidad de que el contenido de la IA inunde los resultados de búsqueda, suplantando los artículos de expertos escritos por humanos.

Por lo tanto, la noticia de una función de marca de agua que desbloquea la detección de contenido creado por ChatGPT también se espera con ansiedad y esperanza.

Marca de agua criptográfica

Una marca de agua es una marca semitransparente (un logotipo o texto) que se incrusta en una imagen. La marca de agua indica quién es el autor original de la obra.

Se ve mucho en fotografías y cada vez más en videos.

La marca de agua de texto en ChatGPT implica criptografía en forma de incrustación de un patrón de palabras, letras y puntuación en forma de código secreto.

Scott Aaronson y la marca de agua ChatGPT

OpenAI contrató a un científico informático influyente llamado Scott Aaronson en junio de 2022 para trabajar en seguridad y alineación de IA.

La seguridad de la IA es un área de investigación que se ocupa de estudiar las formas en que la IA podría dañar a los humanos y crear formas de prevenir este tipo de interrupción negativa.

La revista científica Distill, con autores afiliados a OpenAI, define la seguridad de la IA de la siguiente manera:

“El objetivo a largo plazo de la seguridad de la inteligencia artificial (IA) es garantizar que los sistemas avanzados de IA estén alineados de manera confiable con los valores humanos, que hagan de manera confiable las cosas que la gente quiere que hagan”.

La alineación de la IA es el área de la inteligencia artificial que tiene como objetivo garantizar que la IA esté alineada con los objetivos previstos.

Un grand modèle de langage (LLM) comme ChatGPT peut être utilisé d’une manière qui peut aller à l’encontre des objectifs de l’alignement de l’IA tels que définis par OpenAI, qui est de créer une IA qui profite à l ‘humanidad.

En consecuencia, el motivo de la marca de agua es evitar el mal uso de la IA de una manera que perjudique a la humanidad.

Aaronson explicó el motivo de la marca de agua de salida de ChatGPT:

“Podría ser útil para prevenir el plagio académico, obviamente, pero también, por ejemplo, la generación masiva de propaganda…”

¿Cómo funciona la marca de agua de ChatGPT?

La marca de agua ChatGPT es un sistema que incorpora un modelo estadístico, un código, en la elección de palabras e incluso signos de puntuación.

El contenido creado por IA se genera con un patrón bastante predecible de elección de palabras.

Las palabras escritas por humanos e IA siguen un patrón estadístico.

Cambiar el patrón de las palabras utilizadas en el contenido generado es una forma de «marcar con agua» el texto para permitir que un sistema detecte fácilmente si fue producto de un generador de texto de IA.

El truco que hace que la marca de agua del contenido de la IA sea indetectable es que la palabra distribución todavía tiene una apariencia aleatoria similar al texto normal generado por la IA.

Esto se denomina distribución pseudoaleatoria de palabras.

Pseudo-aleatorio es una serie estadísticamente aleatoria de palabras o números que en realidad no son aleatorios.

La marca de agua ChatGPT no se usa actualmente. Sin embargo, Scott Aaronson de OpenAI ha declarado públicamente que esto estaba planeado.

Actualmente, ChatGPT está en versión preliminar, lo que permite que OpenAI descubra la «desalineación» a través del uso en el mundo real.

Se puede suponer que la marca de agua se puede introducir en una versión final de ChatGPT o antes.

Scott Aaronson escribió sobre cómo funciona la marca de agua:

«Hasta ahora, mi principal proyecto ha sido una herramienta para la marca de agua estadística en los resultados de un modelo de texto como GPT.

Básicamente, cada vez que GPT genera texto largo, queremos que haya una señal secreta imperceptible en sus elecciones de palabras, que puede usar para demostrar más tarde que sí, es de GPT.

Aaronson explicó con más detalle cómo funciona la marca de agua de ChatGPT. Pero primero, es importante entender el concepto de tokenización.

La tokenización es un paso que ocurre en el procesamiento del lenguaje natural donde la máquina toma palabras de un documento y las divide en unidades semánticas como palabras y oraciones.

La tokenización transforma el texto en una forma estructurada que se puede usar en el aprendizaje automático.

El proceso de generación de texto es la máquina que adivina qué token viene a continuación en función del token anterior.

Esto se hace con una función matemática que determina la probabilidad de cuál será el siguiente token, lo que se denomina distribución de probabilidad.

La siguiente palabra se predice pero es aleatoria.

La marca de agua en sí es lo que Aaron describe como pseudoaleatorio, en el sentido de que existe una razón matemática para que una palabra o un signo de puntuación en particular esté allí, pero sigue siendo estadísticamente aleatorio.

Aquí está la explicación técnica de la marca de agua GPT:

«Para GPT, cada entrada y salida es una cadena de tokens, que pueden ser palabras pero también signos de puntuación, partes de palabras o más; hay alrededor de 100 000 tokens en total.

En esencia, GPT genera constantemente una distribución de probabilidad en el siguiente token que se generará, en función de la cadena de tokens anteriores.

Una vez que la red neuronal ha generado la distribución, el servidor OpenAI luego muestrea un token basado en esa distribución o una versión modificada de la distribución, basada en un parámetro llamado «temperatura».

Sin embargo, siempre que la temperatura no sea cero, generalmente habrá cierta aleatoriedad al elegir el siguiente token: puede ejecutar una y otra vez con el mismo mensaje y obtener una finalización diferente (es decir, una cadena de tokens de salida) cada vez . .

Entonces, para hacer una marca de agua, en lugar de seleccionar el siguiente token al azar, la idea será seleccionarlo pseudoaleatoriamente, utilizando una función criptográfica pseudoaleatoria, cuya clave solo conoce OpenAI.

La marca de agua parece completamente natural para quienes leen el texto porque la elección de las palabras imita la aleatoriedad de todas las demás palabras.

Pero esta aleatoriedad contiene un sesgo que solo puede ser detectado por alguien que tenga la clave para decodificarlo.

Aquí está la explicación técnica:

«Para ilustrar, en el caso especial en el que GPT tenía un montón de tokens posibles que consideraba igualmente probables, simplemente podía elegir el token que maximizaba g. La elección parecería uniformemente aleatoria para alguien que no conocía la clave, pero alguien One quien conocía la clave podría luego agregar g sobre todos los n-gramas y ver que era anormalmente grande.

Watermark es una solución centrada en la privacidad

He visto hilos en las redes sociales donde algunas personas sugirieron que OpenAI podría mantener un registro de cada resultado que genera y usarlo para la detección.

Scott Aaronson confirma que OpenAI podría hacer esto, pero hay un problema de privacidad. La posible excepción es la situación de aplicación de la ley, sobre la que no dio más detalles.

Cómo detectar la marca de agua ChatGPT o GPT

Algo interesante que aún no parece muy conocido es que Scott Aaronson señaló que hay una manera de vencer la marca de agua.

no dijo que era posible para vencer la marca de agua, dijo que puede para ser derrotado.

«Ahora todo esto se puede superar con suficiente esfuerzo.

Por ejemplo, si usó otra IA para parafrasear la salida de GPT, bueno, no podremos detectar eso. »

Parece que la marca de agua puede ser derrotada, al menos a partir de noviembre, cuando se hicieron las declaraciones anteriores.

No hay indicios de que la marca de agua esté actualmente en uso. Pero cuando entre en servicio, es posible que no se sepa si esa laguna se ha cerrado.

Cita

Lea la publicación de blog de Scott Aaronson aquí.

Imagen destacada de Shutterstock/RealPeopleStudio

window.addEventListener( 'load2', function() {

if( sopp != 'yes' && addtl_consent != '1~' && !ss_u ){

!function(f,b,e,v,n,t,s) {if(f.fbq)return;n=f.fbq=function(){n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}; if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version='2.0'; n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0]; s.parentNode.insertBefore(t,s)}(window,document,'script', 'https://connect.facebook.net/en_US/fbevents.js');

if( typeof sopp !== "undefined" && sopp === 'yes' ){ fbq('dataProcessingOptions', ['LDU'], 1, 1000); }else{ fbq('dataProcessingOptions', []); }

fbq('init', '1321385257908563');

fbq('track', 'PageView');

fbq('trackSingle', '1321385257908563', 'ViewContent', { content_name: 'chatgpt-watermark', content_category: 'news seo' }); } });

La entrada Cómo funciona la marca de agua ChatGPT y por qué podría ser superada se publicó primero en Seo Con SEM.

source https://seoconsem.es/2022/12/30/como-funciona-la-marca-de-agua-chatgpt-y-por-que-podria-ser-superada/

Buscar este blog

Moborobo