01 - Los modelos de lenguaje: ¿solo repiten?
Más allá de la repetición mecánica - la verdadera inteligencia de IA
Las computadoras, nos han dicho, operan usando solo ceros y unos. A primera vista, para la mayoría de nosotros, esto podría sonar ridículo. Difícil de comprender. ¿Cómo puede toda la información reducirse a solo ceros y unos?
Pero sí, es posible. Porque la unidad más pequeña de datos es un bit - una unidad binaria - una simple dicotomía verdadero/falso, sí/no, 1/0. Es esa señal que se enviaba desde lo alto de un castillo en la Europa medieval por un topo para señalar que estaban listos para la invasión. Es el color del humo del Vaticano que señala esa tan esperada decisión papal. De hecho, dentro de la computadora misma, es el flujo o no flujo de electricidad en un momento dado lo que señala el cero o el uno.
Una consecuencia necesaria de esto es lo que podemos llamar comportamiento determinista. Si bien vemos aleatoriedad e imprevisibilidad en los dispositivos informáticos, el software tradicional es fundamentalmente un fenómeno determinista. El código que se escribe, que finalmente se convierte en esos ceros y unos, está basado en reglas (rules-based), donde las reglas buscan especificar precisamente cómo debe comportarse la máquina en cada escenario previsto.
Esto es bueno, en muchos casos, porque queremos un comportamiento determinista: resultados esperados - precisos, consistentes y confiables. Tu calculadora siempre te da 2+2=4. Del cajero automático esperarías que siempre dispense la cantidad exacta de dinero, ¡al menos no menos! Esperas que la instrumentación en el avión muestre los valores exactos para que el piloto esté correctamente informado.
Sin embargo, hay muchos casos donde no es posible tomar un enfoque basado en reglas. Simplemente no es factible preconcebir cada escenario, premeditar cada probabilidad y programar para ello. Aquí es donde tenemos sistemas que, dados grandes cantidades de datos, pueden aprender de ellos y desarrollar los comportamientos necesarios.
Los algoritmos que, al imitar el cerebro humano, pueden llevar a cabo tal aprendizaje es lo que llamamos Inteligencia Artificial - IA o AI. Y quizás el caso de uso más sólido para tal máquina de aprendizaje está en el manejo del lenguaje humano - el dispositivo mismo que usamos para expresar nuestra percepción de la realidad, en todos sus matices y complejidad.
Si has visto código de computadora tradicional, habrás notado que está en un formato muy rígido, con un conjunto muy limitado de palabras clave dispuestas de una manera muy particular - ¡incluso una coma faltante puede causar estragos, pregúntale a un programador!
Pero eso es parte del espacio determinista en el que vive la computación tradicional. La AI, como los modelos de lenguaje grandes (LLMs, o large language models) que generan lenguaje que suena convincentemente humano, es un fenómeno completamente diferente. De hecho, es lo opuesto a determinista: es probabilístico o estocástico.
Los LLMs, que típicamente se basan en la arquitectura transformer, son solo eso - simplemente adivinan la palabra más probable que sigue dada una serie de palabras: "de tal palo, tal...?" No se les ha dado ningún conjunto de reglas que especifique qué palabra viene después. Pero eso es por elección deliberada. Después de todo, en la vida real, ¿cómo puedes necesariamente adivinar qué palabra va a pronunciar tu interlocutor a continuación?
El software convencional ha sido y sigue siendo útil, por las razones ya mencionadas. Pero con el advenimiento de arquitecturas como las redes neuronales que pueden imitar el cerebro humano, y el hardware para satisfacer sus necesidades de cómputo, esta tecnología probabilística - efectivamente basada en conjeturas - la AI se está convirtiendo en una forma cada vez más viable de modelar aspectos de nuestra realidad, quizás lo más sorprendente, como se mencionó, siendo estos 'chatbots' que generan habla humana.
Alan Turing, el científico británico de la era de la Segunda Guerra Mundial, está más famosamente asociado con esta pregunta: ¿puede una máquina hablar de manera convincente como un humano?: La Prueba de Turing (Turing Test). Si has usado ChatGPT o Claude o un modelo de chat similar, probablemente dirás que sí, la Prueba de Turing finalmente se ha superado.
Alan Turing también reflexionó sobre si toda la realidad puede expresarse de manera determinista, totalmente predecible, y si es así, si no existe tal cosa como el libre albedrío. Pero eso es para otro día.
Audio generado por OpenAI TTS.