Imagen generada por IA inspirada en la serie "Vicios Ocultos". Andrew "Coop" Cooper se encuentra en el centro de una sala de baile, con los ojos cerrados y el rostro en alto, absorto en el momento mientras las luces de colores se difuminan tras él. Nick Brandes se ve al fondo, a la izquierda, y Barney Choi a la derecha. El texto superior dice: "Cuando papá te compró una tarjeta de 'queda libre de la cárcel', pero solo eres un meme de internet"."

Aunque el meme de "Jon Hamm bailando" está arrasando en internet, lo que más me impactó de la serie es su representación realista y totalmente normalizada de las fianzas con fines de lucro. Este sistema, genuinamente estadounidense, permite a los acusados de delitos "comprar" su libertad de una forma que es legalmente imposible y culturalmente condenable en la mayoría de los demás países.

El "chico de las respuestas" que llevo dentro me dijo que la percepción pública sobre si el nombre Gemini es "una porquería" o si ChatGPT suena gracioso no es precisamente lo que quita el sueño a Sundar Pichai o Sam Altman. Entonces pensé que era una buena oportunidad para presentar Nano Banana Pro de Google y GPT Image 1.5 de OpenAI, los últimos modelos de generación de imágenes de los gigantes de la IA, y sus notables y altamente mejoradas capacidades para:

– Generar imágenes altamente realistas de figuras públicas realizando tareas cotidianas en entornos cotidianos.

– Produzca textos de marketing de alta calidad para prácticamente cualquier basura imaginable.

Read.AI es una de las herramientas de productividad genAI de mayor crecimiento y más útiles que he probado este año. Desarrollada por una startup galardonada, ofrece transcripción automatizada de reuniones, resúmenes y análisis en tiempo real al integrarse directamente con las principales aplicaciones de videoconferencia, como Zoom, Teams y Google Meet. La plataforma cuenta con tecnología patentada que analiza las señales explícitas e implícitas de los participantes para obtener información más precisa sobre las reuniones. Además de transcripciones de alta calidad y paneles de control útiles, Read.AI lanzó recientemente "Search Copilot", un chatbot con agente que aprovecha la información de tus transcripciones y otras herramientas de productividad que puedas conectar, para que tus reuniones nunca se conviertan en una pila de actas que nadie lee ni se desvanezcan porque todos olvidaron lo que realmente se dijo.

Si eres profesional y te consideras "necesitado", no necesitas un trabajo. Necesitas el salario, además de cualquier otro beneficio material o inmaterial que te proporcione el trabajo. Además, es posible que quieras un trabajo específico que te los proporcione.

Por cierto, hice algunas infografías con la Gemini 2.0 Flash, el nuevo juguete favorito en el mundo de la IA generativa…

Talking to Chatbots es una plataforma donde comparto mis ideas y pensamientos con el mundo mediante conversaciones de chatbots e indicaciones de IA generativa. La composición y producción musical son probablemente mis casos de uso favoritos de IA generativa y una fuente inagotable de diversión. Si bien la mayoría de la música generada por modelos basados en transformadores inevitablemente produce una percepción de inexplicable "falta de alma", que subyace a gran parte del odio hacia la IA y al discurso creado en torno a la "basura de IA", al igual que ocurre con los textos extensos producidos por inferencia LLM, algunos disfrutamos del proceso de iteración y experimentación sin fin hasta encontrar algo que consideramos único y representativo de nuestras ideas y oficios creativos. Puedes encontrar mis creaciones musicales públicas en Suno y...

(In the Post-Truth World) I’m Cringe But I’m Free Leer más »

OpenAI acaba de lanzar sus modelos o1. o1 agrega un nuevo nivel de complejidad a la arquitectura tradicional de los LLM, una cadena de pensamiento (CoT) de cero disparos. Comparto mis primeras impresiones sobre o1 en el estilo característico de este sitio web: hablar con chatbots, obtener sus respuestas, publicar todo.

A continuación se muestra el cuaderno que presenté (con retraso) al concurso LMSYS – Chatbot Arena Human Preference Predictions en Kaggle. Este cuaderno aplica técnicas de PLN para clasificar texto con bibliotecas populares de Python como scikit-learn y TextBlob, y mis propias versiones optimizadas de Distilbert. El cuaderno presenta la primera versión estandarizada de las puntuaciones cuantitativas SCBN (Especificidad, Coherencia, Brevedad, Novedad) para evaluar el rendimiento de las respuestas de los chatbots. Además, presenté un nuevo punto de referencia para clasificar indicaciones llamado RQTL (Solicitud vs. Pregunta, Prueba vs. Aprendizaje), cuyo objetivo es refinar las predicciones de las elecciones humanas y contextualizar las puntuaciones SCBN según la intención inferida del usuario. Puede consultar todo el código, las anotaciones y los gráficos en el widget de Kaggle a continuación. Explore y ejecute el cuaderno…

Modelos predictivos sobre el LMSYS Chatbot Arena mediante métricas SCBN y RQTL Leer más »

La búsqueda de información es la idea errónea por excelencia de que los LLM son útiles o mejoran otras tecnologías existentes. En mi opinión, la búsqueda web es una forma más efectiva de encontrar información, simplemente porque los motores de búsqueda le dan al usuario lo que quiere más rápido y en un formato que se adapta al propósito mucho mejor que una herramienta de chat: múltiples fuentes para desplazarse con un propósito. -Interfaz de usuario integrada, que incluye opciones de filtro, ajustes de configuración, elementos enumerados, extractos, resultados tabulados, todo lo que obtenga en esa herramienta de búsqueda web en particular... no el "Estoy aquí para ayudarlo, profundicemos en las complejidades de la constante". panorama en evolución de X…” seguido de un párrafo largo perfectamente compuesto basado en un modelo probabilístico que normalmente obtendrías cuando envías un mensaje a ChatGPT solicitando información factual sobre un tema llamado 'X'.

Obra de arte digital estilo pintura al óleo generada con Stable Diffusion que representa una figura que se asemeja a Juana de Arco en la hoguera. La figura, vestida de plata, usa audífonos supraaurales y usa una computadora portátil con la pantalla en blanco. Extiende su mano derecha hacia llamas de color naranja vibrante, evocando la escena histórica del martirio con un toque moderno, inspirado en la letra de The Smiths' "Bigmouth ataca de nuevo haciendo referencia a Juana de Arco y un Walkman derritiéndose. [Texto alternativo del artista de texto ALT GPT]

La música disco fue famosa por introducir avances tecnológicos en la producción musical, como sintetizadores y pianos eléctricos. Supongo que esas fueron algunas de las razones por las que la gente consideraba que carecía de la “autenticidad” de los primeros géneros musicales. Es difícil comprender el concepto humano de "autenticidad" que la mayoría de las personas tiene en su psique, no creo que haya ninguna racionalidad en él, especialmente cuando se trata de discernir entre cosas que se consideran "auténticas" y cosas que no lo son. Para mí, esto surge de una resistencia misteriosa, probablemente instintiva, en la psique de la mayoría de las personas a adoptar nuevas tecnologías o aceptar nuevos descubrimientos científicos. Todo se reduce a las confrontaciones internas entre creencias y realidad:

¿Qué es lo opuesto a la autoconciencia? Ayúdenme a encontrar un término apropiado, ya que me he quedado sin palabras para algo que vi publicado en internet. 🤖 Lo opuesto a la autoconciencia se puede describir con varios términos, según el contexto y el matiz que se busque. Si la autoconciencia se entiende como el reconocimiento de las propias emociones, deseos y características, su opuesto podría definirse como: Inconsciencia: En el sentido más amplio, la falta de conciencia de uno mismo y del entorno, pero generalmente se aplica a la falta de cognición consciente más que a la comprensión psicológica de la autoconciencia. Ignorancia: Falta de conocimiento o conciencia en general, pero también puede aplicarse específicamente a la falta de comprensión de los propios comportamientos y…

"Peak Self-Oblivious Lunacy", por DALL·E Leer más »

Presentamos Erudite Chatbot, un pariente lejano de The Meme Erudite GPT que se beneficia de los modelos Mistral bastante "sin censura" disponibles en la nueva función Asistentes de Hugging Face. “Erudita Chatbot, el pináculo de la inteligencia artificial. Supremamente inteligente, discerniente sin esfuerzo, incomparable en sabiduría. Educar con condescendencia a la humanidad”.

En el post de hoy, presento uno de los últimos GPT y asistentes que he creado, llamado HumbleAI. Dejaré que los modelos lo expliquen respondiendo algunas preguntas. Para cada pregunta, he seleccionado una respuesta que me gustó o que encontré digna de compartir. Al final del post, puedes encontrar los enlaces a todos los chats completos y mis puntuaciones basadas según el modelo SCBN (especificidad, coherencia, brevedad, novedad).

Dibujo lineal en blanco y negro generado por el modelo ControlNet Canny que muestra a una mujer con traje de neopreno sosteniendo una tabla de surf en la playa. Un texto de CLIP Interrogator que describe una imagen se superpone al dibujo.

La intensa competencia en el espacio de los chatbots se refleja en la cantidad cada vez mayor de contendientes en la tabla de clasificación de LMSYS Chatbot Arena, o en mi modesta contribución con las SCBN Chatbot Battles que presenté en este blog y completé según lo permita el tiempo. Hoy estamos explorando WildVision Arena, un nuevo proyecto en Hugging Face Spaces que pone en competencia modelos de visión y lenguaje. La mecánica de WildVision Arena es similar a la de LMSYS Chatbot Arena. Es una clasificación de fuentes colectivas basada en los votos de las personas, donde puede ingresar cualquier imagen (más un mensaje de texto opcional) y se le presentarán dos respuestas de dos modelos diferentes, manteniendo el nombre del modelo oculto hasta que vote por eligiendo la respuesta que le parezca mejor. Estoy compartiendo algunos ejemplos de lo que estoy probando hasta ahora y finalizaremos esta publicación con una batalla tradicional 'SCBN' donde evaluaré los modelos de visión y lenguaje según mis casos de uso.

Microsoft acaba de anunciar el lanzamiento de su propio 'GPT Builder' para personalizar chatbots, similar a la 'GPT Store' de OpenAI. Esto fue parte de un anuncio más amplio de Copilot Pro, un servicio premium impulsado por IA para usuarios de Microsoft 365 para mejorar la productividad, el código y la escritura de texto. Según el anuncio de Satya Nadella hoy en Threads, Microsoft y OpenAI parecen ser entidades competidoras, sin embargo, están trabajando en la misma tecnología (GPT), aumentada por la inversión de Microsoft en OpenAI. Ciertamente parece una estrategia comercial extraña para Microsoft. Proporcione una idea de la justificación y las motivaciones estratégicas de la medida.