Tech
Inteligencia Artificial
Internet y Tecnología
Internet y Tecnología. Internet se está deshaciendo en halagos por la nueva función de visión de ChatGPT.
Las últimas actualizaciones de la herramienta de OpenAI comenzaron a implementarse a principios de esta semana. Permiten que ChatGPT "vea" cuando los usuarios suben imágenes, y luego puedan discutirlas con el chatbot. Las características adicionales de "escuchar" y "hablar" permiten a los usuarios tener conversaciones con ChatGPT.
Las nuevas capacidades de inteligencia artificial (IA) utilizan GPT-3.5 y GPT-4, los cuales "aplican sus habilidades de razonamiento del lenguaje a una amplia gama de imágenes, como fotografías, capturas de pantalla y documentos que contienen tanto texto como imágenes", según una publicación del blog de OpenAI del lunes.
La ilustración anterior muestra la aplicación de ChatGPT rodeada de otras aplicaciones de inteligencia artificial en Vaasa, Finlandia, el 6 de junio de 2023. Los usuarios de ChatGPT están probando la nueva función de visión del chatbot y compartiendo sus formas favoritas de usarla en las redes sociales.
OLIVIER MORIN/AFP via Getty Images
Las personas de todo el mundo han comenzado a probar las nuevas funciones y compartir sus experiencias en las redes sociales. A continuación se presentan 10 formas creativas en las que los usuarios de ChatGPT están utilizando esta nueva función de visión.
Identificar escenas de películas
En X, anteriormente Twitter, algunos usuarios informaron a sus seguidores que podían subir una captura de pantalla de una película y hacer que ChatGPT identificara la película. En un ejemplo publicado por @skalskip92, ChatGPT identificó Pulp Fiction a partir de una captura de pantalla que mostraba a los actores John Travolta y Samuel L. Jackson.

ChatGPT también compartió información sobre el contexto histórico de la película y, cuando se le preguntó, su calificación en IMDB.
Puedes usar ChatGPT Vision para reconocer las películas
Simplemente toma una foto de la escena y pregunta por la puntuación de IMDB. pic.twitter.com/ZjiIxA2svy
— SkalskiP (@skalskip92) 26 de septiembre de 2023
El escritor Peter Yang también probó esta capacidad con una captura de pantalla de la película "Gladiator" dirigida por Ridley Scott en 2000.
Hacer tareas de los niños
El desarrollador de IA McKay Wrigley publicó un video en X que muestra cómo ChatGPT ahora puede explicar diagramas científicos a los estudiantes. En el ejemplo de Wrigley, publicó un diagrama que muestra el interior de una célula humana y pidió ayuda para comprender qué hace cada componente. ChatGPT proporcionó descripciones breves para cada parte de la célula.Yang también probó esta función de tutor enviando a ChatGPT una imagen de una hoja de ejercicios de suma para una clase de matemáticas. ChatGPT proporcionó respuestas a todos los problemas de matemáticas incluidos en la hoja.
"Los niños nunca más harán tareas", tuiteó Yang.
Ofrecer consejos de entrenamiento
El co-fundador de Create Labs, Abran Maldonado, tuiteó que proporcionó a ChatGPT dos fotos tomadas durante un partido de fútbol "en honor a la temporada de fútbol". Luego, ChatGPT explicó lo que parecía estar sucediendo en cada foto y ofreció seis consejos de entrenamiento para el mariscal de campo. Maldonado predijo que la nueva función de visión "cambiará para siempre el entrenamiento y el análisis deportivo".Uno de los demos favoritos que probé, en honor a la temporada de fútbol, ChatGPT Vision cambiará para siempre el entrenamiento y el análisis deportivo. Ya sea que lo construya o no, ChatGPT para entrenamiento estará en cada línea lateral de la liga. Tomen nota. pic.twitter.com/uUYhsKpEGh
— Abran Maldonado (@abran) 27 de septiembre de 2023
Escribir código
Los usuarios también han descubierto que ChatGPT puede escribir código a partir de imágenes, gráficos y diagramas subidos.En un ejemplo, Wrigley compartió una foto en X de diagramas dibujados en un pizarrón que ChatGPT luego transformó en código.
Varios usuarios de X compartieron otro video que muestra cómo ChatGPT creó un sitio web con un diseño que coincide con un boceto dibujado en papel, una foto del cual luego se cargó para que el chatbot lo evalúe.
🔥 De boceto a sitio con ChatGPT-4. El futuro es ahora. 🔥 ¿Qué pasaría si un simple dibujo pudiera convertirse en un sitio web completamente funcional? Ahora la IA puede crear sitios web a partir de dibujos 🤯
¿Quieres más ideas innovadoras como esta? Echa un vistazo a nuestro boletín por correo electrónico. 📧 Enlace en mi perfil. pic.twitter.com/VZ5d8qlybY
— Capitán YAR (@SobkoYaroslav) 27 de septiembre de 2023
Ajustar un asiento de bicicleta
ChatGPT puede guiar a los usuarios a través de instrucciones paso a paso para varias actividades aleatorias, incluido el ajuste de un asiento de bicicleta. En un ejemplo compartido por OpenAI, un usuario que tenía dificultades para bajar el asiento de su bicicleta pudo tomar una foto de la bicicleta y seguir las instrucciones detalladas que lo guiarían en cómo hacer los ajustes necesarios. Los usuarios pueden hacer preguntas de seguimiento y enviar imágenes adicionales para resolver pasos específicos cuando encuentren problemas, según el video de OpenAI. La función de visión se puede utilizar para reparar otros objetos aleatorios alrededor de la casa, según el artículo del blog de OpenAI.Tomar mejores fotos
Ethan Mollick, un profesor que estudia el impacto de la IA en la educación, dijo en X que la función de visión de ChatGPT puede ayudar a los usuarios a crear mejores fotografías. Mollick subió una foto a ChatGPT y solicitó instrucciones específicas sobre cómo mejorar la imagen. La respuesta que recibió mostró a ChatGPT proporcionando consejos sobre encuadre, iluminación, perspectiva y más.Un interesante caso de uso inesperado para GPT-4 con visión: se convierte en un buen entrenador inteligente de imágenes.
Puedes pedirle que te dé sugerencias específicas (estas no eran ideas malas y es genial que haya identificado las esculturas de búfalos) y luego mostrarle la revisión para obtener más ideas. pic.twitter.com/o8yRyC7k5c
— Ethan Mollick (@emollick) 29 de septiembre de 2023
Pietro Schirano, cuya biografía de X dice que trabaja en IA, publicó en X que ChatGPT también contribuyó con una sugerencia de nombre para un estilo de diseño de interiores después de que se cargaron fotos del estilo en cuestión. ChatGPT describió los elementos de diseño del espacio y explicó el contexto histórico de su sugerencia de nombre.
Utilizando la visión de GPT-4 para nombrar estilos arquitectónicos nunca antes vistos creados con Midjourney.
Destaca en la identificación de diversos elementos y asigna nombres a estas creaciones distintivas. 🏛️✨ pic.twitter.com/lLb4p8Etkf
— Pietro Schirano (@skirano) 27 de septiembre de 2023
Evitar Multas de Estacionamiento
Yang tuiteó que "nunca más recibirá una multa de estacionamiento" ahora que la función de visión de ChatGPT está disponible. Yang publicó una foto de un letrero en el que se daban varias instrucciones específicas de estacionamiento, cada una indicando distintas restricciones sobre cuándo las personas podían o no estacionar en esa zona. Yang proporcionó a ChatGPT una hora y día específicos, preguntando si era seguro estacionar.Analizar Obras de Arte
ChatGPT recurrió a análisis de arte cuando Schirano preguntó sobre el significado de una caricatura de cuatro paneles. El análisis de ChatGPT desglosó la caricatura por paneles y proporcionó una evaluación general sobre su significado al final.Descifrar Notas Escritas a Mano
ChatGPT se puede utilizar para leer estilos de escritura a mano desordenados o floridos. En un ejemplo compartido en X por Mollick, se subió una foto de una parte de un manuscrito escrito a mano a ChatGPT para descifrarlo. Según Mollick, el chatbot lo hizo bastante bien."Es probable que sea algo importante para varios campos académicos, especialmente porque la IA puede 'razonar' sobre el texto", tuiteó.
Muy interesante. La IA es mejor para descifrar la escritura a mano que yo. El profesor Breen preguntó si GPT-4 con visión puede leer el manuscrito escrito a mano de Robert Boyle. ¡Lo hace bien!
Es probable que sea algo importante para varios campos académicos, especialmente porque la IA puede "razonar" sobre el texto. https://t.co/n9jUjqeEw3 pic.twitter.com/78jYWfIhCY
— Ethan Mollick (@emollick) 27 de septiembre de 2023
Encontrar a Wally
Quizás lo más importante de todo, ChatGPT puede ayudar a niños (y adultos) de todo el mundo a encontrar a Wally."¡Lo encontré!" respondió ChatGPT a una página de Dónde está Wally? subida por Schirano, agregando instrucciones sobre dónde buscar.