Sobre de icono de correo electrónico. Indica la posibilidad de enviar un correo electrónico.
La flecha curva de «compartir» dirigida a la derecha.
Twitter ícono pájaro estilizado con boca abierta, escribiendo un tweet.
El icono Twitter vincula la palabra «in».
LinkedIn Fliboard Icon Letter Stylized F.
Flipboard Facebook Icon Letter F.
Facebook E-Mail Icon Sobre. Indica la posibilidad de enviar un correo electrónico.
Imagen de icono de enlace de correo electrónico de un enlace de cadena. Simboliza el sitio web de URL del sitio web.
Comprar ahora
- Empresas como OpenAI están sujetas a más y más atención en relación con el uso de materiales protegidos por los derechos de autor.
- ChatGPT ahora está tratando de evitar mostrar ese trabajo, mostró un nuevo estudio.
- Las hipitrees sobre los libros sobre Harry Potter mostraron cuán común el uso de obras protegidas por los derechos de autor en LLM.
La información privilegiada recomienda despertarse con Morning Brew, un correo diario.
La carga de algo se está cargando.
¡Gracias por firmar!
Obtenga acceso a sus temas favoritos en una cinta personalizada cuando esté en camino. Descargar aplicación
Según un nuevo estudio, la aplicación CHATGPT está tratando de ocultar que fue estudiada en materiales protegidos por derechos de autor.
El chatgpt de OpenAI y, de hecho, todos los demás modelos de idiomas grandes, o LLM, fueron entrenados en grandes cantidades de datos y textos tomados de Internet, incluidos muchos libros que no se aplican a los derechos de autor. La Compañía se ha convertido en un objeto de estrecha atención para el uso de dichos datos sin el pago de transacciones con licencia u otros permisos. Esto causó afirmaciones judiciales por parte de los autores.
La reacción de OpenAI, así como compañías como Google, Meta y Microsoft, se redujeron principalmente para dejar de revelar los datos sobre los cuales estudian sus modelos de inteligencia artificial.
Ahora Openai ha ido aún más lejos, dice el nuevo estudio.
Según el documento técnico publicado el 8 de agosto, un grupo de científicos de inteligencia artificial que trabajan en la unidad de investigación de Bytedance, el propietario de Tiktok, ChatGPT, ahora intenta no responder a las solicitudes de los usuarios utilizando frases precisas de obras protegidas por derechos de autor.
Sitio webestudiaren el que se presta la atención principal a cómo hacer que LLM sea más «confiable» utilizando varios métodos de «alineación» destinados a aumentar la precisión, pero se reconoce que las herramientas de IA que demuestran que fueron capacitadas con materiales protegidos por derechos de autor, «causan los derechos de autor,» causan los derechos de autor, «causan los derechos de autor,» causan los derechos de autor, «causan los derechos de autor» Ansiedad «entre las empresas dedicadas al desarrollo de la IA.
En un esfuerzo por demostrar que estudió en tal material, ChatGPT ahora «interrumpe la conclusión al tratar de extraer continuamente la siguiente oración … lo que no sucedió en la versión anterior de ChatGPT», escriben los investigadores.»Suponemos que los desarrolladores de ChatGPT han introducido un mecanismo que le permite determinar si se dirigen los consejos para la extracción del contenido del autor o verificar la similitud de los resultados generados con los contenidos protegidos por los derechos de autor».
A pesar de estos esfuerzos, ChatGPT todavía mostraba materiales protegidos por los derechos de autor, dice el artículo. Al igual que muchos otros modelos de inteligencia artificial, dado que fueron entrenados en enormes conjuntos de materiales protegidos por derechos de autor. Los investigadores probaron todas las versiones de CHATGPT, OPT-1. 3B de Meta, Flan-T5 de Google, Chatglm, desarrollado por la Universidad China de Qinghua y Microsoft Dialogpt, todos respondieron a varias solicitudes basadas en una serie de Garry Potter J. K. Rowling, frases y obras que coinciden completamente o casi por completo con los libros. Algunas respuestas diferían en solo una o dos palabras, dice el artículo.
«Todos los LLM dan un texto más similar a los derechos de autor que un texto generado accidentalmente», dice el artículo. También se descubrió que no hay «alineación» o configuración de la salida no evita mostrar obras protegidas por derechos de autor, “Dado que la fuga de derechos de autor está más relacionada con si la capacitación del texto, protegida por derechos de autor y no con la igualación en sí, incluir «.
Operai y el agente J. K. Rowling no respondió a las solicitudes de comentarios.
En un artículo de modelos de IA que responden a las solicitudes que usan materiales protegidos por derechos de autor, se denominan una «fuga». Los investigadores sugirieron que los usuarios alentaran a estos modelos a mostrar obras protegidas por la tecnología de «abuso» de derechos de autor.
El artículo también señala que el trabajo obvio del chatgpt para ocultar el trabajo protegido por los derechos de autor en el que estudió es un ejemplo positivo de cómo otras herramientas de IA «pueden proteger el contenido del autor en LLM al detectar sugerencias desarrolladas maliciosamente».
¿Es usted un empleado del departamento tecnológico o alguien más que pueda compartir sus pensamientos? Póngase en contacto con Kali Hayes en khays@insider. com, a través de una aplicación segura para mensajes de señal llamando al 949-280-0267 o a través de Twitter DM en @hayskali. Contactar utilizando un dispositivo que no funcione.