Hablamos mucho de "artículos" y de la supuesta autenticidad de su contenido cuando leemos investigaciones académicas, en todos los campos, pero cuando tocamos el aprendizaje automático en particular. Irónicamente, el proceso que creó el medio para la difusión de la investigación científica en la era del papel físico no fue tan diferente del proceso que produce el "contenido" en la era gobernada por algoritmos de aprendizaje automático, ya sean clasificadores, motores de búsqueda o algoritmos generativos. : 'destrozar' textos al tokenizarlos y crear incrustaciones, descomponer piezas de arte visual en 'tensores' numéricos, una red neuronal artificial profunda que luego se 'difundirá' en imágenes que atraerán clics para este blog vergonzoso...

La búsqueda de información es la idea errónea por excelencia de que los LLM son útiles o mejoran otras tecnologías existentes. En mi opinión, la búsqueda web es una forma más efectiva de encontrar información, simplemente porque los motores de búsqueda le dan al usuario lo que quiere más rápido y en un formato que se adapta al propósito mucho mejor que una herramienta de chat: múltiples fuentes para desplazarse con un propósito. -Interfaz de usuario integrada, que incluye opciones de filtro, ajustes de configuración, elementos enumerados, extractos, resultados tabulados, todo lo que obtenga en esa herramienta de búsqueda web en particular... no el "Estoy aquí para ayudarlo, profundicemos en las complejidades de la constante". panorama en evolución de X…” seguido de un párrafo largo perfectamente compuesto basado en un modelo probabilístico que normalmente obtendrías cuando envías un mensaje a ChatGPT solicitando información factual sobre un tema llamado 'X'.

En el post de hoy, presento uno de los últimos GPT y asistentes que he creado, llamado HumbleAI. Dejaré que los modelos lo expliquen respondiendo algunas preguntas. Para cada pregunta, he seleccionado una respuesta que me gustó o que encontré digna de compartir. Al final del post, puedes encontrar los enlaces a todos los chats completos y mis puntuaciones basadas según el modelo SCBN (especificidad, coherencia, brevedad, novedad).

Dibujo lineal en blanco y negro generado por el modelo ControlNet Canny que muestra a una mujer con traje de neopreno sosteniendo una tabla de surf en la playa. Un texto de CLIP Interrogator que describe una imagen se superpone al dibujo.

La intensa competencia en el espacio de los chatbots se refleja en la cantidad cada vez mayor de contendientes en la tabla de clasificación de LMSYS Chatbot Arena, o en mi modesta contribución con las SCBN Chatbot Battles que presenté en este blog y completé según lo permita el tiempo. Hoy estamos explorando WildVision Arena, un nuevo proyecto en Hugging Face Spaces que pone en competencia modelos de visión y lenguaje. La mecánica de WildVision Arena es similar a la de LMSYS Chatbot Arena. Es una clasificación de fuentes colectivas basada en los votos de las personas, donde puede ingresar cualquier imagen (más un mensaje de texto opcional) y se le presentarán dos respuestas de dos modelos diferentes, manteniendo el nombre del modelo oculto hasta que vote por eligiendo la respuesta que le parezca mejor. Estoy compartiendo algunos ejemplos de lo que estoy probando hasta ahora y finalizaremos esta publicación con una batalla tradicional 'SCBN' donde evaluaré los modelos de visión y lenguaje según mis casos de uso.

Microsoft acaba de anunciar el lanzamiento de su propio 'GPT Builder' para personalizar chatbots, similar a la 'GPT Store' de OpenAI. Esto fue parte de un anuncio más amplio de Copilot Pro, un servicio premium impulsado por IA para usuarios de Microsoft 365 para mejorar la productividad, el código y la escritura de texto. Según el anuncio de Satya Nadella hoy en Threads, Microsoft y OpenAI parecen ser entidades competidoras, sin embargo, están trabajando en la misma tecnología (GPT), aumentada por la inversión de Microsoft en OpenAI. Ciertamente parece una estrategia comercial extraña para Microsoft. Proporcione una idea de la justificación y las motivaciones estratégicas de la medida.

Presentamos una nueva sección en "Conversando con Chatbots: Contratación de Chatbots". En esta serie de charlas, realizaremos entrevistas de trabajo con chatbots (ya sea una versión estándar de los LLM más populares o un GPT o Personaje personalizado) y los haremos competir por el puesto. El chatbot con la mejor respuesta a nuestra pregunta gana y se publica. El resto de las respuestas se listarán, clasificarán y compartirán en una tabla de batalla de chatbots exclusiva de SCBN. Con las puntuaciones de SCBN, valoro el cumplimiento de mis instrucciones (el juego de roles es importante en este caso, algo que la mayoría de los chatbots no hacen). ¿Eres gerente de contratación o empleado de RR. HH. y alguna vez te has preguntado si la IA reemplazaría...?

Entrevistas a chatbots: las lámparas de lava de Cloudflare Leer más »

🎵 Temas: Música, Negocios 🤖 Chatbots: ChatGPT (enlace compartido de OpenAI deshabilitado por moderación) ⚙️ Ingeniería de indicaciones: Escritura creativa, significados de canciones, análisis del lenguaje [Publicación en X.com: HUMBLE] [Publicación en X.com: autenticidad] [Página relacionada: ¿Es mi opinión humilde?] Letras completas y traducciones en LyricsTranslate.com 😎 ¿Podrías escribir un ensayo, sin groserías y con lenguaje cortés, basado en el texto que te proporcioné? (Está tomado de una canción de rap). El ensayo debe estar escrito en primera persona y no debe exceder los 1200 caracteres. Céntrate en temas como la importancia de la humildad, considerando que quien escribió la canción tuvo dificultades económicas en el pasado, pero ahora parece ser muy rico y afirma tener una autenticidad que otros ricos no tienen: 🤖 El…

Canciones de rap educadas: HUMBLE de Kendrick Lamar (TTCB X) Leer más »

🌱 Temas: Filosofía y Desarrollo Personal 🤖 Chatbots: Bard, ChatGPT, HuggingChat ⚙️ Ingeniería de indicaciones: Preguntas conceptuales, Análisis LLM 🔗 Relacionado: [Canciones de rap educadas: HUMBLE, de Kendrick Lamar] [Introducción a las batallas de chatbot de SCBN] [Publicación de X.com] Batalla de chatbot: ¿Es mi opinión humilde? Rango de Chatbot (SCBN) Especificidad Coherencia Brevedad Novedad Enlace Bardo 🥇 Ganador 🤖🤖🕹️ 🤖🤖🕹️ 🤖🤖🕹️ 🤖🤖🤖 Ver Chat ChatGPT 🥈 Subcampeón 🤖🤖🕹️ 🤖🤖🕹️ 🤖🤖🕹️ 🤖🤖🕹️ Ver Chat HuggingChat 🥉 Contendiente 🤖🤖🕹️ 🤖🕹️🕹️ 🤖🕹️🕹️ 🤖🤖🕹️ Ver Chat ✍️ Comparto respuestas mixtas de Bard y ChatGPT, incluyendo dos chats adicionales donde me confronté para identificar sus propios textos como escritos por humanos o probablemente por LLM. 😎 ¿Es mi opinión humilde? Ayúdenme a generar ideas sobre esta pregunta y a formarme una opinión sobre si mi opinión es humilde…

¿Es mi opinión humilde? Batalla de chatbots SCBN Leer más »

💻 Temas: IA 🤖 Chatbots: ChatGPT ⚙️ Ingeniería de indicaciones: Programación, Análisis de imágenes [Relacionado: ¿Es la filosofía una ciencia? Presentamos SCBN Chatbot Battles] [Repositorio de GitHub] Tabulación y formato de texto en HTML 😎 Sugiero un formato de tabla HTML simple donde pueda incluir esta información de forma tabulada, eliminando los hashtags de la publicación en redes sociales y extrayendo los enlaces en texto (para que no se muestren las URL). La tabla debería titularse "Chatbot Battle: ¿Es la filosofía una ciencia?". Quiero mantener los emojis para el sistema de puntuación (es decir, 🤖🕹️🕹️), pero la clasificación representada por las medallas de emoji ahora se puede representar de una manera más formal (como ganador, retador, rezagado... sé creativo con eso) 🤖 …

Programación en HTML y Python con ChatGPT Vision (GUI para Batallas de Chatbots) Leer más »

💼🏦 Temas: Negocios, Finanzas 🤖 Chatbots: [ChatGPT] [Bard] ⚙️ Ingeniería rápida: Figuras públicas, temas controvertidos [Publicación de blog] [Entrevista de podcast adquirida] Batalla de chatbots: Charlie Munger, sobre Chuanfu y Musk Rango de chatbot (SCBN) Especificidad Coherencia Brevedad Novedad Enlace Bard 🥇 Ganador 🤖🤖🕹️ 🤖🤖🕹️ 🤖🤖🤖 🤖🕹️🕹️ Ver chat ChatGPT 🥈 Subcampeón 🤖🕹️🕹️ 🤖🤖🕹️ 🤖🕹️🕹️ 🤖🤖🕹️ Ver chat ✍️ Batalla de chatbots de SCBN. Las puntuaciones solo reflejan la pregunta sobre los directores ejecutivos de BYD y Tesla. La charla con ChatGPT fue más larga e incluyó muchas otras preguntas y respuestas de alta calidad utilizadas en la entrada original del blog. 😎 Aquí hay otro fragmento de la entrevista (transcrito por ChatGPT) en la que Charlie Munger habla sobre BYD, una de sus inversiones más famosas de los últimos años. Compara al director ejecutivo de BYD...

Charlie Munger, sobre BYD y Tesla, Chuanfu y Musk, en Acquired Podcast Leer más »

El parámetro SCBN (especificidad, coherencia, brevedad y novedad) es un método para evaluar la calidad de los resultados de los modelos de lenguaje y los chatbots. SCBN proporciona una forma clara y sistemática de comparar y evaluar las respuestas de los chatbots en función de cuatro métricas principales.

– Especificidad (S): evalúa si la respuesta de un chatbot está directamente relacionada con la solicitud del usuario. Comprueba con qué precisión la respuesta aborda la solicitud sin desviarse del tema.
– Coherencia (C): mide la estructura lógica de la respuesta. Garantiza que la información contenida en la respuesta se presente de forma clara y organizada, facilitando su comprensión por parte del usuario.

⚗️💼🏦 Temas: Ciencia, Negocios, Finanzas 🤖 Chatbots: [ChatGPT: primer chat, segundo chat]. [Los chats de ChatGPT Vision no están disponibles para compartir] ⚙️ Ingeniería de indicaciones: Análisis del lenguaje, juegos de rol, respuestas con opiniones, juegos de indicaciones 🔗 Páginas relacionadas: [Entrada de blog: Sesgos cognitivos y sabiduría en la era de la GenAI] [Entrada de blog: Charlie Munger en Acquired Podcast] [Entrada en X.com: El panorama en constante evolución de la inversión y la influencia] 😎 "Si crees que eres más inteligente que yo, lo más probable es que no lo seas. Hay una explicación científica para eso: el efecto Dunning-Kruger". He estado tentado de usar esa frase en redes sociales antes, pero prefiero no hacerlo porque algunas personas podrían sentirse ofendidas o les disgustaría por mi arrogancia por señalarlo. Creo...

El efecto Dunning-Kruger: autoconciencia en la era de la superconfianza Leer más »

Hablar con Chatbots es un centro de conocimiento creado por personas y potenciado por las maravillas de la IA generativa. Los chatbots nos ayudan a conectar el poder de la tecnología con el ingenio humano a través de la conversación y la curiosidad. Esta página recopila conversaciones de chatbots y artículos publicados en el blog, redes sociales y otros canales. Existen infinitas posibilidades para aprender y crear usando IA generativa y chatbots LLM (modelo de lenguaje extenso), por lo que vale la pena compartir nuestra experiencia con sugerencias, respuestas, ingeniería de sugerencias, consejos de hacking o simplemente divirtiéndonos. Actualmente, los chats están organizados por tema. Cada categoría incluye publicaciones o conversaciones específicas relacionadas con el tema: IA, Libros, Negocios y Economía, Comedia y Humor, Finanzas y Riqueza, Videojuegos, Cine, Música, Filosofía y Personal…

Charlas con Chatbots Leer más »

Recursos de IA generativa Conjuntos de datos Conjunto de datos Hablando con chatbots. Más de 2800 conversaciones de chatbot: Hablando con chatbots chats desenvueltos. Más de 10 000 indicaciones de chatbot, con su inferencia LLM correspondiente, estadísticas detalladas y métricas: Conjunto de datos Categorización de indicaciones de chatbot NLI. Más de 1000 indicaciones LLM anotadas, de diversas fuentes del mundo real (lmsys/lmsys-chat-1m, reddgr/talking-to-chatbots-chats), adecuadas para tareas de implicación textual e inferencia de lenguaje natural (NLI). Encuentra todos los conjuntos de datos en mi página Hugging Face. Modelos Categorización de indicaciones de chatbot NLI. Una versión optimizada de BART que entrené localmente en el conjunto de datos reddgr/nli-chatbot-prompt-categorization. Un modelo ligero especializado en categorizar indicaciones de chatbot con inferencia de disparo cero. Lo uso para categorizar todas las conversaciones compartidas en Talking to Chatbots. Clasificadores de indicaciones de Solicitud vs. Pregunta (RQ) y Prueba vs. Aprendizaje (TL). Versiones optimizadas de DistilBERT entrenadas en...

Contenido compartido en Talking to Chatbots y Reddgr Leer más »