Imagen generada por IA inspirada en la serie "Vicios Ocultos". Andrew "Coop" Cooper se encuentra en el centro de una sala de baile, con los ojos cerrados y el rostro en alto, absorto en el momento mientras las luces de colores se difuminan tras él. Nick Brandes se ve al fondo, a la izquierda, y Barney Choi a la derecha. El texto superior dice: "Cuando papá te compró una tarjeta de 'queda libre de la cárcel', pero solo eres un meme de internet"."

Aunque el meme de "Jon Hamm bailando" está arrasando en internet, lo que más me impactó de la serie es su representación realista y totalmente normalizada de las fianzas con fines de lucro. Este sistema, genuinamente estadounidense, permite a los acusados de delitos "comprar" su libertad de una forma que es legalmente imposible y culturalmente condenable en la mayoría de los demás países.

El artículo de hoy contiene un caso práctico y sencillo de uso de chatbots multimodales que he querido probar y mostrar aquí durante bastante tiempo, pero que aún demuestra que estamos lejos de esperar un "razonamiento" confiable de las herramientas LLM al incorporar incluso elementos visuales bastante rudimentarios como gráficos de series temporales. Desafié a ChatGPT 4o (como se discutió en un artículo anterior, o1 en la aplicación web aún no admite la entrada de imágenes), Gemini y Claude para analizar un gráfico de áreas apiladas que represente visualmente la evolución del patrimonio neto de un individuo. Después de varios intentos y alucinaciones flagrantes de todos los modelos, comparto los mejores resultados que, como es habitual en la mayoría de las batallas de SCBN publicadas en Talking to Chatbots, fueron los de ChatGPT.

OpenAI acaba de lanzar sus modelos o1. o1 agrega un nuevo nivel de complejidad a la arquitectura tradicional de los LLM, una cadena de pensamiento (CoT) de cero disparos. Comparto mis primeras impresiones sobre o1 en el estilo característico de este sitio web: hablar con chatbots, obtener sus respuestas, publicar todo.

A continuación se muestra el cuaderno que presenté (con retraso) al concurso LMSYS – Chatbot Arena Human Preference Predictions en Kaggle. Este cuaderno aplica técnicas de PLN para clasificar texto con bibliotecas populares de Python como scikit-learn y TextBlob, y mis propias versiones optimizadas de Distilbert. El cuaderno presenta la primera versión estandarizada de las puntuaciones cuantitativas SCBN (Especificidad, Coherencia, Brevedad, Novedad) para evaluar el rendimiento de las respuestas de los chatbots. Además, presenté un nuevo punto de referencia para clasificar indicaciones llamado RQTL (Solicitud vs. Pregunta, Prueba vs. Aprendizaje), cuyo objetivo es refinar las predicciones de las elecciones humanas y contextualizar las puntuaciones SCBN según la intención inferida del usuario. Puede consultar todo el código, las anotaciones y los gráficos en el widget de Kaggle a continuación. Explore y ejecute el cuaderno…

Modelos predictivos sobre el LMSYS Chatbot Arena mediante métricas SCBN y RQTL Leer más »

Hablamos mucho de "artículos" y de la supuesta autenticidad de su contenido cuando leemos investigaciones académicas, en todos los campos, pero cuando tocamos el aprendizaje automático en particular. Irónicamente, el proceso que creó el medio para la difusión de la investigación científica en la era del papel físico no fue tan diferente del proceso que produce el "contenido" en la era gobernada por algoritmos de aprendizaje automático, ya sean clasificadores, motores de búsqueda o algoritmos generativos. : 'destrozar' textos al tokenizarlos y crear incrustaciones, descomponer piezas de arte visual en 'tensores' numéricos, una red neuronal artificial profunda que luego se 'difundirá' en imágenes que atraerán clics para este blog vergonzoso...

Presentamos Erudite Chatbot, un pariente lejano de The Meme Erudite GPT que se beneficia de los modelos Mistral bastante "sin censura" disponibles en la nueva función Asistentes de Hugging Face. “Erudita Chatbot, el pináculo de la inteligencia artificial. Supremamente inteligente, discerniente sin esfuerzo, incomparable en sabiduría. Educar con condescendencia a la humanidad”.

En el post de hoy, presento uno de los últimos GPT y asistentes que he creado, llamado HumbleAI. Dejaré que los modelos lo expliquen respondiendo algunas preguntas. Para cada pregunta, he seleccionado una respuesta que me gustó o que encontré digna de compartir. Al final del post, puedes encontrar los enlaces a todos los chats completos y mis puntuaciones basadas según el modelo SCBN (especificidad, coherencia, brevedad, novedad).

Dibujo lineal en blanco y negro generado por el modelo ControlNet Canny que muestra a una mujer con traje de neopreno sosteniendo una tabla de surf en la playa. Un texto de CLIP Interrogator que describe una imagen se superpone al dibujo.

La intensa competencia en el espacio de los chatbots se refleja en la cantidad cada vez mayor de contendientes en la tabla de clasificación de LMSYS Chatbot Arena, o en mi modesta contribución con las SCBN Chatbot Battles que presenté en este blog y completé según lo permita el tiempo. Hoy estamos explorando WildVision Arena, un nuevo proyecto en Hugging Face Spaces que pone en competencia modelos de visión y lenguaje. La mecánica de WildVision Arena es similar a la de LMSYS Chatbot Arena. Es una clasificación de fuentes colectivas basada en los votos de las personas, donde puede ingresar cualquier imagen (más un mensaje de texto opcional) y se le presentarán dos respuestas de dos modelos diferentes, manteniendo el nombre del modelo oculto hasta que vote por eligiendo la respuesta que le parezca mejor. Estoy compartiendo algunos ejemplos de lo que estoy probando hasta ahora y finalizaremos esta publicación con una batalla tradicional 'SCBN' donde evaluaré los modelos de visión y lenguaje según mis casos de uso.

Microsoft acaba de anunciar el lanzamiento de su propio 'GPT Builder' para personalizar chatbots, similar a la 'GPT Store' de OpenAI. Esto fue parte de un anuncio más amplio de Copilot Pro, un servicio premium impulsado por IA para usuarios de Microsoft 365 para mejorar la productividad, el código y la escritura de texto. Según el anuncio de Satya Nadella hoy en Threads, Microsoft y OpenAI parecen ser entidades competidoras, sin embargo, están trabajando en la misma tecnología (GPT), aumentada por la inversión de Microsoft en OpenAI. Ciertamente parece una estrategia comercial extraña para Microsoft. Proporcione una idea de la justificación y las motivaciones estratégicas de la medida.

La IA sólo será una amenaza para la humanidad el día que adopte un humor autocrítico. Lo dije en una entrada anterior del blog y lo mantengo. La IA nunca será una amenaza para la humanidad y creo firmemente que sólo la humanidad puede ser una amenaza para la humanidad, como también comenté con algunos de mis modelos de lenguaje favoritos en una entrada anterior del blog. Sin embargo, como alguien que podría llamarse a sí mismo tecnólogo, soy sensible al hecho de que todas las formas de tecnología son un tema de miedo, incertidumbre y duda para los individuos y las sociedades. Ese no es un tema nuevo y ya he hablado mucho sobre la ética de la IA y los sesgos cognitivos en este blog, por lo que la historia de hoy no es particularmente novedosa en términos de compartir y discutir mis propias ideas, sino una buena excusa para compartir más chats, así como el último GPT que he creado con la divertida y prometedora herramienta de personalización de chatbot de OpenAI: The Meme Erudite.

…El meme es una versión satírica de lo que algunos sofisticados algoritmos de IA hacen detrás de escena, que el meme exagera como un enorme flujo de declaraciones if() anidadas. Las declaraciones condicionales If() se han utilizado ampliamente en la programación informática tradicional. Son un bloque esencial de los programas informáticos más simples que la gente escribe cuando aprende a codificar o cuando trabaja con hojas de cálculo. Las declaraciones If() a veces se vuelven demasiado complejas y enrevesadas, insinuando malas prácticas de codificación, por lo que la mayoría de las personas con habilidades básicas de programación encontrarían las declaraciones If() desordenadas detrás del fondo de pantalla etiquetado con IA como una versión divertida de la exageración con la IA generativa y otras tecnologías emergentes. tecnologías.

Imagen generada por IA. Traducción del "prompt": "Impresionante imagen del skyline de Detroit por la noche. Cielo azul, colores fríos hiperrealistas, Unreal Engine, futurista"

Continúa de la Parte 1: Yoshimi lucha contra los robots rosas, Pt. 1: Historias de las chicas con IA de Stable Diffusion y Google Bard. La primera parte de la publicación se inspiró en Yoshimi lucha contra los robots rosas, la canción y el álbum de The Flaming Lips. La Parte 1 presentó las propuestas narrativas de Google Bard y Stable Diffusion, exploró la tendencia de arte digital de las chicas con IA e interpretó la letra de la canción utilizando la creatividad de dos de las alternativas más populares a ChatGPT y Bing Chat: Google Bard y Hugging Chat (próximamente más comparaciones y batallas de chatbots con IA 😎). Todas las historias del blog inspiradas en la lista de reproducción terminan con una conexión con otro tipo de medio. La Parte 2 tratará sobre la conexión con la historia de Yoshimi…

Yoshimi, pt. 2. Conectando videojuegos, máquinas sentientes y ética en la IA (TTCB XIII) Leer más »

😎 ¿Podrías elaborar un cuento corto basado en la letra de la canción "Yoshimi Battles the Pink Robots" de The Flaming Lips? "Yoshimi Battles the Pink Robots, Pt. 1" de The Flaming Lips – Letras y traducciones originales de la canción en LyricsTranslate.com Yoshimi Battles the Pink Robots de The Flaming Lips: un cuento corto y tira cómica con IA 🤖 Claro, aquí tienes un cuento corto basado en la letra de "Yoshimi Battles the Pink Robots" de The Flaming Lips: Yoshimi es una joven que vive en una ciudad que está siendo atacada por malvados robots rosas. Los robots están programados para destruir a todos los humanos, y Yoshimi es la única que puede detenerlos. Es una karateka experta…

Yoshimi Battles the Pink Robots, Pt. 1: AI Girls de Stable Diffusion y Cuentos de Google Bard (TTCB XII) Leer más »

Imagen generada por Ai. Un hombre vestido de manera informal derrocha confianza, luciendo anteojos de sol y una chaqueta de cuero. Con una sonrisa radiante, sostiene juguetonamente montones de billetes en sus manos, mientras otros descansan sobre la mesa frente a él, pintando una imagen de éxito financiero inconfundible.

😎 “Si crees que eres más inteligente que yo, probablemente no lo seas. Hay una explicación científica para eso: el efecto Dunning-Kruger”. He estado tentado de usar esa frase en redes sociales antes, pero prefiero no hacerlo porque algunas personas podrían ofenderse o desagradarme por ser arrogante al señalarlo. Sin embargo, creo que el mensaje es muy acertado, y comprender el Dunning-Kruger, un sesgo cognitivo que nos afecta a todos, podría ser útil para que algunas personas aprendan y mejoren sus habilidades. Basándome en mi experiencia personal, he notado la influencia del Dunning-Kruger en muchos aspectos de la vida, y comprenderlo es clave para aumentar nuestra riqueza social (ver entrada anterior del blog) y construir confianza…

Sesgos cognitivos y sabiduría en la era de la IA. Videos de comedia y fotos de X . Frontier Psychiatrist (TTCB VIII) Leer más »