Después de meses de rumores y especulaciones, Operai ha anunciado GPT-4: lo último en una línea de modelos de idiomas de IA que se utilizan en aplicaciones como ChatGPT y la nueva Bing.
OpenAI, el creador de ChatGPT, finalmente ha presentado GPT-4, que puede aceptar datos de texto o imagen
La compañía afirma que es «más creativa y colaborativa que nunca» y «puede resolver problemas complejos con una mayor precisión». Puede analizar tanto texto como imágenes, pero solo puede responder con texto. Operai también advierte que los sistemas conservan muchos de los mismos problemas que los modelos de idiomas anteriores, incluida una tendencia a inventar información (o «alucinar») y la capacidad de generar texto agresivo y dañino.
Operai dice que ya está trabajando con varias compañías para integrar GPT-4 en sus productos, incluidos Duolingo, Stripe y Khan Academy. El nuevo modelo está disponible para el público en general a través de ChatGPT Plus, la suscripción mensual de $ 20 de Openai a ChatGPT, y se utiliza en Bing Chatbot de Microsoft. También estará disponible como API para desarrolladores.(Aquí hay una lista de espera, que OpenAi dice que comenzará a aceptar a los usuarios hoy).
Operai dijo en una publicación de blog de investigación que la diferencia entre GPT-4 y su predecesor GPT-3. 5 es «apenas perceptible» en la conversación normal (GPT-3. 5 es el modelo en el que se ejecuta el chatgpt). El CEO de Operai, Sam Altman, tuiteó que GPT-4 es «todavía imperfecto, todavía limitado», pero también «todavía parece más impresionante la primera vez que lo usa que después de pasar más tiempo con él».
Anunciando GPT-4, un gran modelo multimodal, con nuestros mejores resultados sobre capacidades y alineación: https://t. co/twlfssyalf pic. twitter. com/lywwpjzbsg
– OpenAi (@openai) 14 de marzo de 2023
Las mejoras a GPT-4 son evidentes en los resultados de rendimiento
La compañía afirma que las mejoras de GPT-4 son evidentes en el rendimiento del sistema en una serie de pruebas y puntos de referencia, incluido el examen de bares uniformes, LSAT, matemáticas SAT y lectura y amp basada en evidencia SAT; Escribiendo. GPT-4 obtuvo un puntaje en el percentil 88 y superior en los exámenes mencionados, y aquí se puede ver una lista completa de exámenes y resultados del sistema.
La especulación sobre GPT-4 y sus capacidades ha abundado durante el año pasado, y muchos especulan que sería un gran salto sobre los sistemas anteriores. Sin embargo, según la declaración de OpenAi, parece que las mejoras son más de naturaleza iterativa, algo contra lo que la compañía ha advertido previamente.
«La gente pide que se decepcione, y se sentirán decepcionados», dijo Altman en una entrevista sobre GPT-4 en enero.»La exageración es lo mismo que … no tenemos verdadero AGI, y eso es lo que se espera de nosotros».
El rumor se agitó aún más la semana pasada después de que un ejecutivo de Microsoft soltó en una entrevista con la prensa alemana de que el sistema se daría a conocer esta semana. También sugirió que el sistema sería multimodal, es decir, capaz de generar no solo texto sino también otros medios. Muchos investigadores de IA creen que los sistemas multimodales que combinan texto, audio y video son la mejor manera de construir sistemas de IA más capaces.
GPT-4 es un sistema multimodal
GPT-4 es de hecho multimodal, pero en menos maneras de lo que algunos han predicho. OpenAI afirma que el sistema puede tomar texto e imágenes como entrada y producir texto como salida.
La compañía afirma que la capacidad del modelo para analizar simultáneamente el texto y la imagen le permite interpretar entradas más complejas.
En los ejemplos a continuación, puede ver cómo el sistema explica memes e imágenes inusuales:
La historia de GPT – Ruta de desarrollo de modelos de IA de Openai
Ha sido un largo camino a GPT-4. Modelos de lenguaje Operai e IA en general: lentamente ganó impulso durante algunos años, y luego en los últimos meses se usó en gran medida.
El artículo de investigación original que describe GPT se publicó en 2018, GPT-2 se anunció en 2019 y GPT-3 en 2020. Estos modelos están capacitados en enormes conjuntos de datos de texto, en gran parte tomados de Internet, que se procesan para identificar patrones estadísticos. Estos patrones se usan para predecir qué palabra sigue a otro. Este es un mecanismo relativamente simple, pero terminamos con sistemas flexibles que pueden generar, resumir y parafrasear lo que se escribe, así como realizar otras tareas textuales, como la traducción o la generación de códigos.
Inicialmente, Openai retrasó la liberación de sus modelos GPT, por temor a que se utilizaran para fines maliciosos, como generar spam y desinformación. Pero a fines de 2022, la compañía lanzó ChatGPT, un chatbot conversacional basado en GPT-3. 5 al que cualquiera podría acceder. El lanzamiento de ChatGPT causó revuelo en el mundo tecnológico, seguido pronto por Microsoft con su propio chatbot de IA, Bing (parte del motor de búsqueda de Bing) y Google se apresuró a ponerse al día.
Como se predijo, la amplia disponibilidad de estos modelos de idiomas de IA ha creado desafíos y dificultades. El sistema educativo todavía se está ajustando a la existencia de software que escribe ensayos universitarios decentes; Los sitios en línea como Stack Overflow y la revista de ciencia ficción Clarkesworld han tenido que cerrar la aceptación de las presentaciones debido a la afluencia de contenido generado por AI; y los primeros usos de las herramientas de escritura asistidas por AI-AI en el periodismo han sido erráticos en el mejor de los casos. Sin embargo, algunos expertos argumentan que los efectos nocivos aún eran menores de lo esperado.
En su anuncio GPT-4, Openai enfatizó que el sistema ha sufrido seis meses de capacitación en seguridad, y que en las pruebas internas es «82% menos probable que responda a las solicitudes de contenido prohibido y un 40% más de probabilidades de proporcionar respuestas reales que GPT-3. 5. «
Sin embargo, esto no significa que el sistema esté libre de errores o no produzca contenido dañino. Por ejemplo, Microsoft reveló que su chatbot Bing estaba ejecutando GPT-4 todo el tiempo, y muchos usuarios pudieron violar las barandillas de Bing de varias maneras creativas, lo que hace que el bot brinde consejos peligrosos, amenazara a los usuarios y inventara información. GPT-4 tampoco se da cuenta de los eventos «que ocurrieron después de que la gran mayoría de sus datos se interrumpieron» en septiembre de 2021.