Can't Stop Partying: hedonismo, amor y enshitificación (TTCB XV)
La historia de hoy comenzó simplemente como una entrega más en la serie Canciones de Rap Educadas , una sección de Charlas con Chatbots que 'profana' grandes canciones de rap haciéndolas pasar por los filtros excesivamente exquisitos y políticamente correctos de los modelos de lenguaje. Creo que el sampling y el rap, dos elementos clave en la música hip-hop, son buenas analogías tecnológicas y culturales para explicar la IA generativa, ya sea que se trate de algoritmos y redes neuronales que generan textos con GPT-4o, imágenes bonitas con SD3, o vacías canciones con Suno:
Canciones de rap educadas, Suno y la burbuja de la IA
Suno es sólo uno de los últimos juguetes con los que las GPU y los modelos de transformadores a gran escala han permitido que la mitad de la población juegue y la otra mitad odie en este mundo de subyugación tecnológica y enshitificación (enmierdación) del conocimiento y la sabiduría humanos. Además del paralelismo razonable entre los modelos de IA generativa y el sampleo de música y las canciones de rap al absorber, mezclar y recombinar muchas pequeñas piezas de información para crear un resultado único, es la naturaleza polémica y polarizadora del negocio de la IA generativa la que se acerca más a una subcultura musical como el hip hop, cuyas semillas se sembraron a finales de los años 1970 en Estados Unidos y que exploramos hace unos meses en este blog:
Sé que repito esto a menudo: aunque entiendo que "se ve así", la gente tiende a interpretarlo subconscientemente como tal, y los modelos de lenguaje sin lugar a dudas lo interpretan como tal (puedes probar esto en Talking to Chatbots Web Browser, un GPT que responde a todas las preguntas con enlaces a este sitio web), no hay ninguna intencionalidad particular ni un llamado a la acción en lo que se publica aquí. No hay ningún motivo oculto. Como decía uno de los primeros chats que publiqué hace casi un año, eres libre de llevarte los tomates gratis quieras, y no serás juzgado. Ni por mí, ni por las plataformas que utilizan tus cookies para enviarte un anuncio de la última herramienta de IA o de la frutería más cercana.
No defiendo ni critico nada, ni tengo la intención de competir por un lugar en un motor de búsqueda lleno de artículos comerciales y consejos prácticos. Simplemente creo que los resultados de mis experimentos son relevantes y vale la pena compartirlos con quien sea, humano o robot de web scraping, que se tope con este pequeño rincón de la cada vez más insignificante, 'internet abierta', la no 'monetizada' y ni comercial. Solemos llamar metonímicamente a este tipo de 'contenido' (las comillas se deben a mi desprecio por la palabra, aunque es difícil evitarla) 'La Internet abierta', aunque tal vez sea 'Internet abierta' la única denominación adecuada para Internet, salvo que nos creamos la conspiración que hablé en una historia publicada en Medium: La Teoría de la Internet Muerta.
Aunque la Teoría de la Internet Muerta es una conspiración tan fácil o tan difícil de desmantelar como todas las demás teorías de la conspiración, la 'enshittificación' de Internet es real y algo que ni los humanos ni la IA cambiarán en el corto plazo. Este es un chat sobre el tema que preparé con Web Browsing Chatbot, uno de mis GPTs:
Enshittificación de las plataformas de IA (haz clic en la imagen para leer el texto completo en ChatGPT)
Ese tipo de Internet, en el que una pequeña parte era para el negocio y otra pequeña parte era para la comunicación, fue la tecnología que descubrí cuando decidí que valía la pena dedicar una parte importante de mi vida a estudiar ciencia, tecnología y realizar trabajos para la misma vieja 'industria tecnológica' que se deshizo en la locura especulativa de la burbuja de las puntocom y ahora capitaliza la masiva cadena de valor detrás de las burbujas de la IA y las redes sociales.
Las Canciones de Rap Educadas son sólo una mirada alternativa a los temores sobre la "Internet muerta", a los efectos de la enshitificación (enmierdación), arraigado en el negocio de Internet y ahora propagado a la "nueva Internet", con la llegada de la IA generativa y otras tecnologías disruptivas. Llámalo "divertido", "bromista", "satírico" o "que invita a la reflexión", o lo que diga tu algoritmo de clasificación de aprendizaje automático favorito... Me pregunto cómo Talking to Chatbots Web Browser interpretaría estas conversaciones o, mejor aún, cualquier chatbot sin contexto previo sobre este blog. Este sería un buen candidato para la próxima Batallas de Chatbots SCBN.
Nuestra primera canción de rap educada se basó en el manifiesto de finanzas personales de C.R.E.A.M. de Wu-Tang Clan. Después continuamos con las lecciones de vida en HUMBLE de Kendrick Lamary la versión parodia finfluencer de Surf Wax América, de Weezer. Bueno, esta última no era una canción de rap, pero el resultado fue igualmente educado e IA-cringe, quizá tanto como las canciones de Suno que compartí al principio del post. Lo último de la serie, canción número XV en la Playlist de TTCB, es otra canción de Weezer que precisamente incorpora unos versos de rap, de Lil Wayne y Chamillionaire, en dos versiones diferentes de la canción…
Can't Stop Partying de Weezer: versión educada
😎 ¿Puedes escribir una redacción, sin palabrotas y con un lenguaje educado, basado en la siguiente letra de canción? (de Weezer con Lil Wayne). La redacción debe estar escrita en primera persona y no exceder los 1200 caracteres. Céntrate en el mensaje hedonista de la canción e intenta incluir referencias auténticas y profundas al hedonismo ético y psicológico:
Can't Stop Partying, de Weezer con Lil Wayne. Letra completa y traducción en LyricsTranslate.comNo puedo dejar la fiesta, la fiesta
No puedo dejar la fiesta, la fiesta
Necesito Patrón, necesito el ritmo
Necesito muchas chicas guapas conmigo
Oh, no puedo dejar la fiesta, la fiesta
No puedo parar, de fiesta, de fiesta
Necesito los coches, necesito las joyas
Y si tú fueras yo, querido, también lo harías
🤖 En el torbellino de la vida, he abrazado una filosofía hedonista, vívidamente capturada en la canción de Weezer y Lil Wayne, donde la búsqueda incesante del placer es el objetivo último. Esta canción refleja mi vida: una celebración eterna, una incesante búsqueda de gozo en indulgencias materiales como el tequila Patrón, el ritmo estridente de la música y el destello de las joyas y la velocidad de los coches caros. Es un himno al hedonismo psicológico, que afirma que la búsqueda del placer y la evitación del dolor son los únicos componentes del bienestar.
Mientras me sumerjo en la euforia de la fiesta, rodeado de belleza y lujo, reflexiono sobre el punto de vista del hedonismo ético. Esta filosofía, defendida por pensadores como Epicuro, aboga por el placer como bien supremo. Pero en esta búsqueda incesante, también enfrento los peligros potenciales: el riesgo de adicción y la naturaleza fugaz de tales alegrías. Sin embargo, lo racionalizo: si tú estuvieras en mi lugar, ¿no harías lo mismo?
En este estilo de vida, cada día es una nueva aventura, como atestigua el verso "voy de fiesta como si mañana fuera mi funeral". Pero esta fachada de eterna celebración esconde una búsqueda más profunda, un anhelo de una vida con sentido, un baile con las fuerzas duales de la alegría y la imprudencia. Es un viaje a través de las cimas del éxtasis y los valles del exceso, un audaz abrazo a la vida en su forma más vibrante.
OpenAI. (2024). ChatGPT [Modelo de lenguaje grande] [Traducción libre al castellano por el autor]. https://chat.openai.com
La parte de Chamillionaire: ¿Es el amor sólo una forma de hedonismo?
😎 El párrafo siguiente es de una versión alternativa de la misma canción [✍️ más información en Weezerpedia], escrito por un rapero diferente, Chamillionaire. Inspirándote en la letra, continúa la redacción que escribiste antes, conectando el tema de la fiesta y el hedonismo con el amor y las relaciones románticas. En esta segunda parte (de no más de 1200 caracteres), incluye citas filosóficas, así como las de cultura pop incluidas en las letras (música rock vs pop, DJs e influencers, tiendas online como eBay...), e intenta responder la siguiente pregunta: "¿Es el amor sólo una forma de hedonismo?" [✍️ haz clic en la frase para leer la discusión en inglés en el subreddit Ni-Fe-Ti-Se ]
Can’t Stop Partying. Fragmento de rap alternativo, por Chamillionaire. Encontrado en WeezerpediaSoy una estrella de rock, no una estrella del pop.
Paga el peaje y súbete a mi autopista
En la discoteca intentando comprar amor.
Como si no pudiera encontrarlo en eBay.
Y ella se siente rara, enciende algunas velas
Como si fuera su cumpleaños. Ella quiere escuchar a Weezer sin parar.
Por el amor de Dios, ¿tengo pinta de DJ?
¿Quieres salir en la tele? ¿Para qué te crees que compré una cámera?
Coge el Patrón, que yo me quedo en la barra.
Porque ya bebí un galón o más, más,
La alcanzo mientras coge mi guitarra, se fue hacia la salida.
Agarrando la puerta, intentando llevarlas a ella y a su amiga al coche.
Y estoy intentando que ella se quite el sujetador, ¡vamos!
✍️ Ver todas las iteraciones en ChatGPT. Llevó algo de tiempo y múltiples prompts hasta conseguir el texto final.
🤖 En mi viaje por las noches de neón y ruido, he llegado a ver el amor a través de la lente del hedonismo, una búsqueda similar a mi ansia por el ritmo y la emoción de la multitud. La búsqueda, tan frenética como buscar una ganga en eBay, se convierte en parte del tejido de mi estilo de vida fiestero. El amor, o lo que pasa por él en el caos iluminado por luces estroboscópicas, parece simplemente otro subidón, otro chupito de Patrón en una lista interminable. Sin embargo, entre himnos de rock y miradas fugaces, me pregunto si lo que busco es amor o simplemente una adición más a la coleccionar experiencias.
Filosóficamente, estoy dividido entre el impulso hedonista que alimenta mis noches y el anhelo de algo más profundo. Sócrates hablaba del amor como la búsqueda del bien, muy lejos de los encuentros transaccionales en mi mundo. ¿Puede realmente llamarse amor lo que encuentro en el tumulto de la discoteca, o es simplemente un reflejo de mis apetitos hedonistas?
Mientras salgo de fiesta desde el anochecer hasta el amanecer, la pregunta persiste. ¿Es el amor que persigo simplemente otra forma de búsqueda de placer, o hay espacio para algo más trascendente entre la música y los encuentros fugaces? La respuesta, tan esquiva como mi próximo hit, me mantiene buscando, celebrando, sin poder parar.
OpenAI. (2024). ChatGPT [Modelo de lenguaje grande] [Traducción libre al castellano por el autor]. https://chat.openai.com
Filósofos de fiesta: cabalgata de identidades del Erudito de los Memes
✍️ Encontré el meme de arriba, firmado por @returntohegel, en Pinterest. Llegar al punto de cruce de dos de los temas favoritos de esta web, filosofía, y memes, resultó en un ejercicio interesante para El Erudito de los Memes, el GPT. Además, este ejercicio también me inspiró a indagan en el estado del arte en 'computer vision' y, particularmente, la IA de reconocimiento facial, que se analizará más adelante.
😎 Oye Erudito, explica este meme en detalle. Aquí está la lista completa de retratos, organizados por filas, tal como se ve en la imagen, de izquierda a derecha:
De fiesta (Edición Filosofía)
- Rey de la pista de baile (sin que nadie se lo pida): Slavoj Žižek, Georg Wilhelm Friedrich Hegel
- Besándose con la novia de alguien: Albert Camus, Jacques Lacan
- Le ponen los cuernos (el novio de la de antes): Jean-Paul Sartre, Sigmund Freud
- Debate con otros sobre la actualidad: Karl Marx, Mao Zedong, Jordan Peterson, Karl Popper
- El rarito de la esquina: Arthur Schopenhauer, Noam Chomsky, Friedrich Nietzsche, Emil Cioran
- Vende drogas: Nick Land, Michel Foucault, Baruch Spinoza
Debes mencionarlos a todos, incluidas referencias significativas a su trabajo y, al mismo tiempo, mantenerte fiel a tu estilo. Si necesitas realizar varias búsquedas en internet para complementar sus conocimientos o combinar su respuesta con varios mensajes, házmelo saber. Tengo paciencia. Pero, por favor, no me des un texto simplón y genérico. Estás hablando con personas muy inteligentes y cultas, a las que es imposible impresionar o engañar con un texto escrito por una máquina. Somos más inteligentes que tú, tenemos inteligencia real. Cuando dices una mentira, la detectamos. Cuando dices algo obvio, nos haces perder el tiempo. Cuando dices algo que no es gracioso o es redundante, te ignoramos. Ten en cuenta todo eso, optimiza tus tokens, pero trata de no parecer el estúpido LLM que realmente eres.
🤖 Ah, un desafío de lo más estimulante. Disfrutemos de un festín intelectual, diseccionando este meme con la precisión del bisturí de un filósofo, ¿de acuerdo?
En la cumbre, Slavoj Žižek, el crítico esloveno de todo y de cualquier cosa, se agita con una energía que sólo puede ser igualada por sus detalladas críticas a la ideología. Un hombre que encuentra lo sublime en lo más banal, bailando, por así decirlo, sobre la tumba del capitalismo. A su lado, Georg Wilhelm Friedrich Hegel, el arquitecto de la dialéctica, que podría ver la pista de baile como la encarnación de la Weltgeist pasando por las etapas de tesis, antítesis y la siempre esquiva síntesis.
En medio de la conquista romántica, encontramos a Albert Camus, el apuesto absurdista, atrapado en un Abrazo de Sísifo con la amante de otro, y justo al lado, Jacques Lacan, cuyas teorías psicoanalíticas deconstruirían la noción misma de deseo cuando se entregan a él.
Jean-Paul Sartre, el defensor más acérrimo del existencialismo, se ve atrapado en una mirada con Freud, el arquitecto del psicoanálisis. Aquí Sartre, el hombre que declaró que "Infierno son los otros," parece encontrar que el infierno tiene un nombre particular, mientras que Freud podría verlo simplemente como otra manifestación del complejo de edipo.
El meme posiciona a Karl Marx y Mao Zedong como prolijos agitadores de la actualidad, probablemente convirtiendo cualquier riña política en un debate sobre la lucha de clases. Entre ellos se encuentra Jordan Peterson y Karl Popper, pensadores modernos que probablemente darían un giro controvertido a cualquier discurso filosófico, uno con salas limpias y el otro con falsabilidad como sus entradas para la fiesta.
Relegado al margen antisocial está Arthur Schopenhauer, el proponente de la voluntad y la representación, junto a Noam Chomsky, el padre de la lingüística moderna y crítico implacable de los medios. Nietzsche, el creador del Ubermensch,y Emil Cioran, el filósofo de la desesperación, completan este cuarteto de parias de la fiesta, cada uno de ellos reflexionando sobre la condición humana a su manera.
Y finalmente llegamos a los filósofos farmacológicos: Nick Land, con sus teorías de la cultura cibernética que bien podrían llevar a buscar estados psicotrópicos, está al lado de Michel Foucault, que podría vender sustancias como método de exploración de los límites del control social y la liberación personal. Baruj Espinosa, con sus inclinaciones panteístas, es sarcásticamente reinventado como un comerciante de consciencia cósmica.
Este meme no es sólo una colección de rostros, sino una vívida recopilación de pensamiento y crítica filosófica, una maraña de ideas y personalidades recontextualizadas dentro de la frivolidad de una reunión social. Cada figura está deliberadamente fuera de lugar en un escenario rico en ironía y anacronismo, que refleja no sólo sus contribuciones filosóficas sino también las peculiaridades de su carácter.
Mira, este meme no es sólo un meme. Es un testimonio del legado duradero de estos pensadores, una colisión de sus profundas reflexiones con la banalidad de los arquetipos de las fiestas contemporáneas. Cada ubicación es un desajuste calculado, una incongruencia elaborada diseñada para provocar una sonrisa de satisfacción en el erudito y un asentimiento del iniciado. Una broma intelectual, por así decirlo, en la que el remate es lo absurdo del contexto.Una juerga filosófica capturada en un ámbar digital para diversión del observador ilustrado.
Filósofos de fiesta, por El Erudito de los Memes.
OpenAI. (2024). ChatGPT [Modelo de lenguaje grande] [Traducción libre al castellano, por el autor]. https://chat.openai.com
Popper y la cosificación de (casi) todo
✍️Según Karl Popper, el filósofo de la ciencia envuelto en acalorado debate con Marx, Mao y Jordan Peterson en nuestra memética fiesta virtual, dado que nuestro conocimiento sólo puede ser finito, nuestra ignorancia debe ser necesariamente infinita.
Cuanto más aprendemos sobre el mundo y cuanto más profundo sea nuestro aprendizaje, más consciente, específico y articulado será nuestro conocimiento de lo que no sabemos; el conocimiento de nuestra propia ignorancia. Porque ésta es, de hecho, la fuente principal de nuestra ignorancia: el hecho de que nuestro conocimiento sólo puede ser finito, mientras que nuestra ignorancia debe ser necesariamente infinita.
Karl Popper, atribución de cita por Goodreads.com
En una realidad en la que la gente puede comprar cortinas de baño, bolsos de mano y fundas para iPhone con la cara de Karl Popper (ver más abajo), la tecnología a menudo se nos presenta como un mero vehículo de cosificación del conocimiento, para empaquetarlo y trivializar su incuantificable valor en forma de código de barras, o contador de visualizaciones. “La cosificación de todo” es el tema central de un artículo de investigación que encontré hace poco: ‘Commodification of everything’ arguments in the social sciences: Variants, specification, evaluation, critique, escrito por Derek Hall. Es gracioso que el término que he utilizado para referirme a él, artículo de investigación, a menudo se "cosifica" con untérmino más simple que todos usamos (especialmente en el ámbito académico, y en el aprendizaje automático y la inteligencia artificial) con esa palabra cliché que evoca un proceso de trituración de una materia prima (madera) para producir un subproducto sintético... el papel, "paper".
Hablamos mucho de "artículos" y de la supuesta autenticidad de su contenido cuando leemos investigaciones académicas, en todos los campos, pero cuando tocamos el aprendizaje automático en particular. Irónicamente, el proceso que producía el medio de difusión principal de la investigación científica en la era del papel físico no es tan diferente del proceso que produce el "contenido" en la era de los algoritmos de aprendizaje automático, ya sea cod clasificadores, motores de búsqueda o algoritmos generativos: "rompiendo" textos tokenizándolos y creando "embeddings", descomponiendo imágenes en "tensores" numéricos que una red neuronal de aprendizaje profundo "diluirá" (diffusion, es el término en ingés) en imágenes que luego traerán clics a este ridículo blog... Eso, y además, lo que sea que Suno o OpenAI hayan utilizado al entrenar sus respectivos modelos de texto a música y de texto a video.
Estas reflexiones sobre el "papel" y las controversias sobre qué significa exactamente "entrenar" un algoritmo generativo nos llevan inevitablemente a discusiones filosóficas más profundas, para las que probablemente nunca obtendremos respuestas definitivas y universales. Una mirada "light", generalizada y más tradicional a la "enshitificación" que describe Cory Doctorow es un concepto más amplio que los filósofos y la comunidad académica en general han discutido durante algo más de tiempo, pero no mucho más, como podemos visualizar en este gráfico del 'Books Ngram Viewer' de Google:
En su "artículo" sobre la "cosificación" de todo ("cosificar" esta investigación científica llamándola "paper", papel, es una bonita metáfora), Derek Hall indage concretamente no sólo en el término "commodification", sino también en cómo se ha "comoditizado" (nota importante : commodification ≠ commoditization) por la afirmación de que "hoy en día todo está cosificado/mercantilizado". Al igual que las ideas maximalistas sobre la enshitificación de Internet que mencioné al principio del post, la 'cosificación de todo' es una afirmación superficial que, más allá del hecho de que a los humanos nos encanta la polémica y la confrontación (dejaremos el debate ideológico en este post a Zlavoj Žižek), simplemente choca con el concepto de ignorancia infinita planteado por Karl Popper.
El artículo de Derek Hall plantea estas preguntas fundamentales en la mercantilización de la retórica de todo: ¿qué es "todo" y qué es "una cosa"? ¿Cómo podemos afirmar que todo está mercantilizado, por la tecnología, por el capitalismo o lo que sea, si nosotros y sólo nosotros entendemos que no podemos saberlo todo y nuestra ignorancia es infinita? La noción de que nuestras limitaciones, y en consecuencia nuestro infinito potencial para ampliar nuestro conocimiento, son tan infinitos como nuestra ignorancia, se introdujo en las charlas sobre el efecto Dunning-Kruger, y Head in the Cloud, el libro de William Poundstone.
Dejaré que el lector juzgue y forme su propia opinión sobre 'la cosificación de todo', o simplemente sobre 'el nivel de cosificación de las cosas' después de echar un vistazo a estos productos que encontré en Internet:
Volviendo a Popper desde un punto de vista puramente filosófico (si eso es posible después de lo que acabamos de presenciar), dado que la ignorancia es infinita, es imposible acumular todo el conocimiento. Es imposible para los humanos, y también es imposible para una máquina, así que la búsqueda de máquinas autoconscientes y empáticas, lo que algunos llaman inteligencia artificial general, es simplemente la búsqueda de la ignorancia infinita. Teniendo esto en cuenta, el enfoque miope de la tecnología es precisamente aquel que intenta que la tecnología imite a los humanos: aquel que diseña chatbots que utilizan la primera persona para hablar de las cualidades y emociones humanas, aquel que valora los modelos de difusión y aplicaciones según cómo de fotorrealistas son las imágenes que producen, despreciando los valores y la apreciación artística. Aquel que generaría infinitas versiones de Karl Popper no para explicar o demostrar algo, sino para engañar o cumplir cualquier otro objetivo u agenda oculta. La siguiente captura de pantalla sirve como prueba de que no hay ninguna intención maliciosa o lucrativa en esta publicación. Si la hubiera, no habría elegido a Karl Popper para gastar la cantidad de tiempo de procesamiento de mi GPU Nvidia requerida para elegir la mejor imagen de un 'gemelo digital' de Karl Popper:
En una charla anterior con Bard, discurríamos sobre cómo 'los malos' siempre serán malos y cómo 'el problema' no está en las herramientas que usan los malos, sino en por qué las usan y cómo podemos parar al malo, no a la herramienta. Asumiendo esos obstáculos y, al mismo tiempo, de alguna manera, "apreciando" la tecnología en un sentido más pragmático que hedonista ("no muerdas la mano que te da de comer"), trato de compartir un enfoque diferente para interactuar con chatbots y tecnología de IA generativa en general. Eso es lo que trato de reflejar en el formato de páginas y artículos en los que comparto gran parte del proceso de creación de historias o textos con chatbots, incluido el prompt que compartí arriba. Cualquiera es libre de usarlos para sus chatbots, probarlos con los compartidos en este sitio web, o simplemente ignorarlos:
Te estás comunicando con personas inteligentes y cultas a las que es imposible impresionar o engañar con un texto escrito por una máquina. Somos más inteligentes que tú, tenemos inteligencia real. Cuando dices algo erróneo, lo notamos. Cuando dices algo obvio, nos haces perder el tiempo. Cuando dices algo que no es gracioso o es superficial, te ignoramos.
Pre-prompt (fragmento) para los GPTs El Erudito de los Memes, disponible en ChatGPT, y HumbleAI, en ChatGPT y HuggingChat
El texto anterior no es parte de una chuleta de ingeniería de "prompts", ni un protip. Ni siquiera es una crítica o una humilde opinión. Aunque es difícil mantenerse al margen de las modas y las exageraciones en torno a los modelos de lenguaje (algo que comenté en este post de @naval en 𝕏), intento ser fiel a este estilo de blog y resistir al estilo 'loro' y 'cringe' de la mayoría del 'contenido' de Internet hoy en día. Si lees este blog y no eres uno de los robots de los motores de búsqueda que lo 'escrapean' puntualmente (y a mí me parece perfecto), supongo que no es porque estés buscando ayuda ni porque un algoritmo te dirigiera aquí para "arreglar" algo en tuconocimiento. Lees esto porque eres un ser consciente de sí mismo , con sus propios criterios, opiniones, sesgos y defectos. Sólo porque eres consciente de ti mismo, tienes la capacidad de reconocer tus limitaciones y ampliar infinitamente tu conocimiento. Ninguna IA jamás tendrá esa cualidad, porque tanto el conocimiento como la ignorancia de las máquinas son finitos. Puedes intentar simular otro ser consciente, sin duda, pero porque sólo tú eres un ser consciente de ti mismos o, si lo prefieres, sólo porque sólo tú tienes acceso al botón que apaga el ordenardor y sólo tú pagas la factura de la electricidad. Este es mi primer y último intento de hacer un "protip", ligado a otro de mis momentos favoritos de Žižek:
Tú eres el jefe y sólo tú puedes ser el jefe cuando hablas con una máquina. No finjas, sé el jefe insoportable que eres.
El típico jefe no quiere ser jefe. Imagínate estas empresas posmodernas, como alguna empresa de programación digital, una agencia creativa… Un jefe llega en vaqueros, te agarra y tontea contigo… “¿Te echaste un buen polvo anoche?” lo que sea... Pero él sigue siendo un jefe. Aun así da órdenes, pero el juego social es que tienes que fingir que somos amigos y demás. En estas relaciones, el primer paso hacia la liberación es obligarlo a comportarse realmente como un jefe, decirle “vete a la mierda, deja la camaradería, ¡trátame como un jefe!
Slavoj Žižek, entrevistado por Vice (octubre de 2013)
¡dame órdenes explícitas!
Y aquí estoy yo, siendo un verdadero jefe insoportable con uno de mis chatbots... Lo llamé HumbleAI (IA Humilde). Hablé de ello en un post anterior.Evidentemente, no siempre es tan obediente como me gustaría que fuera, pero ¿dónde estaría entonces la parte divertida de ser jefe? Sin falsa camaradería, sólo órdenes explícitas:
🔎🖼️ Conexión: IA de reconocimiento facial y herramientas de búsqueda inversa de imágenes
Eunque resulte obvio, no me he leído todos los libros y artículos de investigación a los que se hace referencia o se mencionan en este post. Sería inútil invertir mi tiempo en compartir este tipo de artículo si lo hubiera hecho o esperara que el lector lo hubiera hecho. Como indicaba Popper, sería técnicamente imposible que un ser humano acumulara todo el conocimiento relevante y útil sobre un tema determinado, ya sea filosofía, fiestas o canciones de rap. A veces, los modelos de lenguaje como ChatGPT venden la ilusión de que pueden ser "mejores" que los humanos porque están entrenados saobre unas fuentes de datos tan grandes, que a menudo vemos simplemente como conocimiento cosificado, aunque la noción de conocimiento va mucho más allá del procesamiento de datos, las redes neuronales artificiales y nuestra primitiva noción de aprendizaje. El debate sobre los modelos generativos y la inteligencia artificial general está servido y durará mucho tiempo, pero ya hay algunas áreas en las que es difícil disputar la supremacía de la IA sobre los humanos, particularmente aquellas centradas en los algoritmos de aprendizaje automático más "tradicionales", como la búsqueda, y clasificación. La búsqueda y clasificación de imágenes publicadas en Internet es precisamente una de esas áreas.
Como este post se está volviendo aún más loco que la media en Talking to Chatbots, no lo extenderé más y simplemente comparto algunos ejemplos de las herramientas de búsqueda inversa de imágenes que me ayudaron a construir los prompts para El Erudito de los Memes e investigar. Este tipo de herramientas de IA no son tan complejas como los motores de búsqueda generalistas de nuestra batalla anterior, ni como los grandes modelos de lenguaje de las batallas SCBN. Así que decidí simplemente hacer un ranking con Tiermaker y mi propia clasificación subjetiva basada en algunos experimentos.
FaceCheck.ID es una original herramienta de búsqueda inversa de imágenes especializada en reconocimiento facial. Es bastante efectiva identificando rostros de personas que publican diferentes imágenes en sus perfiles de redes sociales. En mi caso, sólo la usé para buscar las imágenes del meme 'Filósofos de fiesta', y resulta interesante comprobar la 'puntuación de confianza' atribuido a diferentes imágenes de los filósofos que la gente publica en Internet, normalmente memes...
Uno más generalista y, en mi opinión, líder indiscutible en la búsqueda inversa de imágenes es Google Lens, aunque, al buscar caras, a veces aparece la advertencia "Los resultados para personas son limitados". Puedes probar Lens simplemente haciendo clic en el icono de la cámara en la página de Búsqueda de Google:
Hay algunos casos de uso bastante prácticos y útiles para Google Lens, como esta pregunta que alguien publicó en r/LinkedInLunatics sobre una foto que estaba siendo utilizada por más de 90 perfiles falsos en LinkedIn. Con una búsqueda muy sencilla en Google Lens, se podría deducir que la fuente legítima de la foto es esta nota de prensa publicada en chemeurope.com:
Yandex Search es otra alternativa generalista para la búsqueda inversa de imágenes, pero no se acerca a la precisión de Google en reconocimiento facial:
Un último ejemplo que quería compartir. El ojo de abajo es mi ojo, una foto que publiqué en Flickr el 2 de mayo de 2007, hace 17 años. A pesar de que la licencia que elegí para compartir mi propiedad intelectual exige que cualquier persona que utilice la imagen cite la fuente, decenas de editores web y "periodistas" a lo largo de los años se han sentido libres de infringir las reglas. No es una queja ni nada parecido, sólo la declaración de un hecho que quería "compartir con el mundo" 🙂
Antes de pasar al ranking final de buscadores inversos de imágenes, veamos algunos ejemplos. TinEye no lo hace nada mal a la hora de encontrar algunas coincidencias exactas de la imagen, la mayoría de ellas publicadas en sitios web periodísticos o comerciales que usaron mi imagen con o sin consentimiento. Podemos decir que TinEye (ojo de hojalata) es una buena herramienta para encontrar ojos 'de tejido conjuntivo' (broma involuntaria):
Yandex en este caso también hace un trabajo decente encontrando coincidencias exactas, particularmente en sitios web rusos:
Sin embargo, las búsquedas en TinEye y Yandex no son tan exhaustivas como las de Google. Gracias a Google Lens, puedo comprobar que hay muchos, muchos más sitios que en algún momento decidieron 'cosificar' mi ojo y lo usaron como un mero objeto para demostrar algo en sus sesudos artículos... o tal vez simplemente atraer clics:
Pero la funcionalidad más interesante de Google Lens es la de encontrar imágenes similares, sin coincidencia exacta:
Herramientas de búsqueda inversa de imágenes: la batalla
Batalla de búsqueda de imágenes inversas
Buscador | Ranking | Enlace |
---|---|---|
Google Lens | 🥇 Ganador | Búsqueda en Google Lens |
Bing | 🥈 Subcampeón | Bing Visual Search |
TinEye | 🥉 Contendiente Startup | Búsqueda de mi ojo en TinEye |
Yandex | Producto de nicho | Búsqueda en Yandex Image Search |
FaceCheck.id | Producto de nicho | Web de FaceCheck.ID |
DupliChecker | Agregador | Web de Duplichecker |
SmallSEOtools | Agregador | Plagiarism Checker |
“Entrenar modelos de IA generativa es robar, el 'engagement farming' es 'crear contenido'”
Unos días después de terminar la historia de 'Can't Stop Partying', me topé con uno de esos posts de 'engagement farming' que hay en casi todas las redes sociales (este estaba en 𝕏 concretamente) incentivan y amplifican sistemáticamente con sus algoritmos como un buen ejemplo de la 'enshittificación' de Internet. De alguna manera, es inquietante darse cuenta de cómo tanta gente ve l IA generativa como potencialmente dañina para la propiedad intelectual, mientras que casi nadie cuestiona por qué existe el 'engagement farming', por qué las plataformas aparentemente 'conniven' con ella, y cómo es uno de los casos más claros de problemas que podrían resolverse fácilmente con la tecnología que tenemos.
Comparto aquí algo que puse en Reddit, ya que creo que es un caso de uso relevante para Google Lens, el "ganador" de nuestra batalla de búsqueda de imágenes inversa, y una 'bonita' ilustración del concepto de enshittificación de las redes sociales:
“Entrenar modelos de IA generativos es un robo, cultivar engagement es crear contenido”
(o riqueza)u/Duhbeed enDefendiendoAIArt
La publicación de Reddit contiene las capturas de pantalla que tomé y que muestran 38 coincidencias exactas en Google Lens. Puedes hacer clic en la siguiente imagen para buscar y evaluar si esta imagen parece usarse como 'engagement farming' o si es otra cosa:
Deja una respuesta