Dibujo lineal en blanco y negro generado por el modelo ControlNet Canny que muestra a una mujer con traje de neopreno sosteniendo una tabla de surf en la playa. Un texto de CLIP Interrogator que describe una imagen se superpone al dibujo.

La intensa competencia en el espacio de los chatbots se refleja en la cantidad cada vez mayor de contendientes en la tabla de clasificación de LMSYS Chatbot Arena, o en mi modesta contribución con las SCBN Chatbot Battles que presenté en este blog y completé según lo permita el tiempo. Hoy estamos explorando WildVision Arena, un nuevo proyecto en Hugging Face Spaces que pone en competencia modelos de visión y lenguaje. La mecánica de WildVision Arena es similar a la de LMSYS Chatbot Arena. Es una clasificación de fuentes colectivas basada en los votos de las personas, donde puede ingresar cualquier imagen (más un mensaje de texto opcional) y se le presentarán dos respuestas de dos modelos diferentes, manteniendo el nombre del modelo oculto hasta que vote por eligiendo la respuesta que le parezca mejor. Estoy compartiendo algunos ejemplos de lo que estoy probando hasta ahora y finalizaremos esta publicación con una batalla tradicional 'SCBN' donde evaluaré los modelos de visión y lenguaje según mis casos de uso.

Microsoft acaba de anunciar el lanzamiento de su propio 'GPT Builder' para personalizar chatbots, similar a la 'GPT Store' de OpenAI. Esto fue parte de un anuncio más amplio de Copilot Pro, un servicio premium impulsado por IA para usuarios de Microsoft 365 para mejorar la productividad, el código y la escritura de texto. Según el anuncio de Satya Nadella hoy en Threads, Microsoft y OpenAI parecen ser entidades competidoras, sin embargo, están trabajando en la misma tecnología (GPT), aumentada por la inversión de Microsoft en OpenAI. Ciertamente parece una estrategia comercial extraña para Microsoft. Proporcione una idea de la justificación y las motivaciones estratégicas de la medida.