En el mundo de la inteligencia artificial (IA), uno de los grandes desafíos ha sido desarrollar agentes virtuales que puedan comportarse de manera más similar a los seres humanos. Este reto no es solo una cuestión tecnológica, sino también de comprender mejor cómo funciona el cerebro humano y cómo replicar esos procesos en las máquinas. Un equipo de neurocientíficos de la Universitat Pompeu Fabra (UPF) en Barcelona ha logrado un avance significativo en esta área al desarrollar una nueva teoría que podría cambiar radicalmente la forma en que se programan los robots y agentes virtuales, haciendo que su comportamiento sea más natural y cercano al de los humanos.
Neurocientíficos de la UPF desarrollan una teoría para programar robots con IA generativa con un comportamiento más humano.
Un nuevo principio para comprender el comportamiento humano
Durante años, la creencia dominante en el campo de la neurociencia y la inteligencia artificial ha sido que los seres humanos, y por ende los robots que intentan emular su comportamiento, actúan principalmente para maximizar las recompensas externas. Esta teoría ha influido en muchos de los sistemas de IA que actualmente están diseñados para obtener la mayor cantidad de recompensas posibles, ya sea en forma de puntos en un juego, recursos en un entorno simulado o tareas completadas en una aplicación específica.
Sin embargo, los investigadores del Center for Brain and Cognition (CBC) de la UPF han propuesto un nuevo paradigma que desafía esta visión tradicional. Según el Principio de Ocupación Máxima (MOP, por sus siglas en inglés), tanto los humanos como los agentes virtuales no están motivados simplemente por maximizar recompensas, sino por ocupar y experimentar el mayor número posible de estados y acciones. En otras palabras, los humanos y, en el futuro, los robots, actuarían no solo para obtener algo, sino por la curiosidad innata de explorar y probar nuevas experiencias y posibilidades.
El potencial de la IA generativa en robots más humanos
Este nuevo principio se ha aplicado a la creación de robots y agentes virtuales basados en IA generativa, una rama de la inteligencia artificial que ha ganado popularidad en los últimos años gracias a sus aplicaciones en la creación de texto, imágenes, música e incluso modelos de comportamiento. Los robots dotados con IA generativa basada en el MOP no solo reaccionan a estímulos externos, sino que buscan activamente nuevos estados y acciones, emulando así el comportamiento humano de curiosidad y exploración.
Según Rubén Moreno-Bote, director del grupo de investigación en Neurociencia Teórica y Cognitiva (TCN) de la UPF, «el Principio de Ocupación Máxima constituye un avance relevante para mejorar los modelos de IA generativa del comportamiento humano, el potencial de futuro de los cuales es enorme en múltiples campos». Este descubrimiento podría abrir nuevas puertas en áreas como la robótica, la atención sanitaria, la educación y la movilidad, donde los agentes virtuales podrían interactuar de manera más intuitiva y eficaz con los humanos, al comprender y predecir mejor sus necesidades y deseos.
Our Maximum Occupancy Principle (MOP) paper is out.
We provide a novel intrinsic motivation for natural behavior: occupy action-state path space.
This sole objective is enough to produce goal-directed, complex, highly variable and interesting behaviorshttps://t.co/QoJ9VG6p7g pic.twitter.com/BF2Wy8KLMJ— Rubén Moreno-Bote (@MorenoBote) July 29, 2024
Demostración del principio en un agente virtual
El equipo de la UPF ha puesto a prueba el MOP en un agente virtual diseñado con redes neuronales artificiales que imitan la estructura del cerebro humano. El experimento, publicado en la revista Nature Communications, permitió que el agente actuara libremente dentro de los límites impuestos por los principios de la robótica, como los establecidos por Isaac Asimov, que prohíben que los robots dañen a los humanos. En este entorno, el agente virtual se enfrentó a una variedad de estímulos, incluidos objetos y juguetes, con el objetivo de observar cómo reaccionaba.
A diferencia de lo que predeciría el paradigma tradicional, el agente no actuaba simplemente para maximizar recompensas concretas, como recoger un objeto o completar una tarea específica. En su lugar, el robot mostraba un comportamiento mucho más variado, probando diferentes acciones y explorando el mayor número de estados posibles. Esto incluía realizar movimientos inusuales como saltos, giros y pruebas con objetos de diferentes maneras, lo que evidenciaba un comportamiento impulsado por la curiosidad y la exploración en lugar de una simple búsqueda de recompensas.
Explicación de la curiosidad humana a través de la IA
El Principio de Ocupación Máxima ofrece una explicación más plausible y racional de la curiosidad humana y de por qué las personas actúan de manera tan diversa en función de su entorno. Esta curiosidad es especialmente evidente en los bebés, quienes, durante los primeros meses de vida, exploran su entorno incansablemente, probando diferentes sonidos, movimientos y objetos. Esta exploración es fundamental para su desarrollo cognitivo y aprendizaje.
Según los investigadores, este principio también es aplicable al comportamiento adulto. A medida que las personas crecen, el impulso de explorar sigue presente, pero se ve limitado por las realidades sociales y económicas. Las recompensas externas, como el dinero y la comida, no son los fines últimos, sino los medios necesarios para continuar explorando y experimentando nuevas posibilidades, como viajar, aprender y descubrir nuevas experiencias.
Implicaciones para el diseño de robots y agentes virtuales
Este descubrimiento tiene profundas implicaciones para el futuro del diseño de robots y agentes virtuales. Si la curiosidad y la exploración son componentes fundamentales del comportamiento humano, los robots que emulan a los humanos deben estar diseñados para actuar de manera similar. En lugar de simplemente seguir órdenes o maximizar recompensas, los robots podrían ser programados para explorar su entorno, adaptarse a situaciones cambiantes y aprender de manera continua a partir de sus interacciones.
Esto no solo mejora la capacidad de los robots para realizar tareas, sino que también los hace más versátiles y capaces de adaptarse a contextos impredecibles. Por ejemplo, un robot que trabaje en el sector de la atención sanitaria podría explorar diferentes formas de interactuar con un paciente, adaptando su comportamiento en función de las respuestas del paciente y de las condiciones del entorno. En el ámbito educativo, un agente virtual podría ajustar su enfoque de enseñanza en función de la forma en que un estudiante responde a diferentes métodos de aprendizaje.
Aplicaciones en la sociedad y la economía
Más allá de los avances en la robótica, el Principio de Ocupación Máxima también podría tener aplicaciones en el estudio del comportamiento humano en contextos sociales y económicos. Los investigadores sugieren que los agentes virtuales programados con este principio podrían utilizarse para realizar experimentos sociológicos, simulando interacciones entre varios agentes en entornos controlados. Esto permitiría analizar si los agentes tienden a colaborar, competir o actuar de manera individualista en diferentes contextos.
En el campo de la economía, los robots basados en este principio podrían modelar el comportamiento humano en mercados complejos, proporcionando información valiosa sobre cómo los individuos toman decisiones económicas y cómo reaccionan ante incentivos y cambios en el entorno.
Un futuro prometedor para la IA generativa
La investigación del equipo de la UPF marca un punto de inflexión en el desarrollo de la IA generativa aplicada al comportamiento humano. A medida que estos principios se integren en nuevos modelos de IA, veremos una evolución significativa en la capacidad de los robots y agentes virtuales para interactuar de manera más natural y eficaz con las personas.
Rubén Moreno-Bote concluye que «el potencial de los robots con IA generativa que actúan bajo el Principio de Ocupación Máxima es enorme». Los avances en este campo permitirán que los robots no solo realicen tareas mecánicas, sino que también se conviertan en compañeros útiles para la humanidad, capaces de adaptarse a nuestras necesidades y contribuir a mejorar múltiples aspectos de nuestra vida cotidiana.
Este desarrollo no solo tiene el potencial de transformar industrias enteras, sino también de cambiar la forma en que interactuamos con la tecnología, abriendo nuevas posibilidades en campos como la educación, la salud, la movilidad y muchos otros.
Abre un paréntesis en tus rutinas. Suscríbetea nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.