¿Por Qué los Ordenadores Siguen Siendo Tan Limitados?

The AI Mirage
Por Ian Bogost
Durante décadas, las empresas tecnológicas han prometido que la inteligencia artificial haría que nuestras computadoras fueran más fáciles de usar. Hasta el momento, esto no ha sucedido.

“No voy a responder a eso”, respondió Siri. Yo apenas le había gritado, y este fue mi castigo pasivo-agresivo.
La grosería, en mi opinión, era justificada. Estaba en mi auto, haciendo diligencias, y me encontraba en una parte desconocida de la ciudad. Solicité “direcciones a Lowe’s”, esperando que me dirigieran a la tienda de mejoras para el hogar sin quitar la vista del camino. Pero aparentemente Siri no entendió. “¿Cuál Lowe?” preguntó, antes de mostrarme una lista de personas con el apellido Lowe en mi libreta de direcciones.
¿Estás bromeando? No solo fue la respuesta incoherente en contexto, sino que, además, solo una de las entradas de Lowe en mis contactos incluía una dirección, y esta estaba a 800 millas de distancia, una coincidencia poco probable en comparación con la dirección de la tienda. La inteligencia artificial puede que nunca logre todas las cosas que las empresas tecnológicas dicen que hará, pero parece que, al menos, las computadoras deberían ser más inteligentes ahora de lo que eran hace 10 o 15 años.
Parece que habría necesitado un teléfono completamente nuevo para que Siri hubiera deducido que quería ir a la tienda. Craig Federighi, vicepresidente senior de ingeniería de software de Apple, dijo en una entrevista el mes pasado que la última versión de Siri tiene “mejor contexto conversacional”, algo que debería ayudar al software a saber cuándo le pido que me guíe a la tienda de mejoras para el hogar en lugar de a un tipo llamado Lowe. Pero mi iPhone aparentemente no es lo suficientemente nuevo para esta actualización. Necesitaría inteligencia artificial de vanguardia para obtener direcciones a Lowe’s.
Este es efectivamente todo el argumento de Apple sobre la IA. Cuando lanzó Apple Intelligence (el nombre de la compañía para las características de IA en sus sistemas operativos) el año pasado, la tercera empresa más valiosa del mundo prometió una comprensión rica y contextual de todos tus datos, y la capacidad de interactuar con ellos a través de frases ordinarias en tu iPhone, iPad o Mac. Por ejemplo, según Apple, podrías pedirle a Siri que “envíe las fotos de la barbacoa del sábado a Malia”.
Pero en mi experiencia, no puedes pedirle a la Siri mejorada que haga cosas así. Realicé una prueba modesta de Apple Intelligence en mi Mac, que puede manejar la función. Falló en buscar mi correo electrónico, sin importar cómo formulé mi pedido. Cuando intenté usar Siri para localizar un PDF de un informe de inspección de propiedad que había guardado en mi computadora, intentó delegar la tarea a ChatGPT. Está bien. Pero ChatGPT solo proporcionó una guía para encontrar un informe de una propiedad en San Francisco, una ciudad en la que no vivo. Quizás podría ser más general. Escribí en Siri: “¿Puedes ayudarme a encontrar archivos en mi computadora?” Me dirigió a abrir Finder (el administrador de archivos de Mac) y mirar allí. La IA me estaba diciendo que hiciera el trabajo yo mismo. Finalmente, pensé en probar algo como el propio ejemplo de Apple. Le dije a Siri que “me mostrara fotos que he tomado de barbacoa”, lo que resultó en una cuadrícula de imágenes, todas las cuales eran fotos de archivo de internet, no imágenes de mi biblioteca.
Estas limitaciones son diferentes de la tendencia de ChatGPT de inventar historias y presentarlas como hechos. Al menos ese error genera una respuesta a la pregunta planteada, aunque sea inexacta. La inteligencia de Apple ni siquiera parece entender la pregunta. Esto no podría parecer un problema si no usas productos de Apple o si estás contento con ir a lo loco a Lowe’s. Pero revela un triste estado de las cosas para la computación. Durante años, nos han dicho que las interacciones sin fricciones con nuestros dispositivos serán comunes en el futuro. Ahora estamos viendo cuánto progreso se ha logrado hacia este objetivo.
Les pregunté a Apple sobre los problemas que tengo con Apple Intelligence, y más o menos confirmaron que el producto no funciona todavía. La postura de Apple es que el anuncio de 2024, que presenta a Malia y la barbacoa, representa una visión de lo que Siri puede y debería hacer. La empresa espera que el trabajo en funcionalidades de este tipo continúe hasta 2026, y me mostró una serie de otras herramientas de IA que vendrán, incluida una con la capacidad de reconocer un evento en una captura de pantalla de un mensaje de texto y añadir la información a un calendario, o resaltar un objeto en una foto y buscar similares en Google o Etsy. También vi una demostración de traducción de idioma en tiempo real en una llamada telefónica, emojis creados por IA actualizados y herramientas para refinar lo que has escrito dentro de correos electrónicos y en software de Apple. Interesante, pero en mi mente, todas estas características cambian la forma en que puedes usar un computador; no mejoran las formas existentes.
Después de dar vueltas en mi cabeza a la idea de que Apple Intelligence representa una visión de cómo debería funcionar una computadora, recordé que Apple expresó por primera vez esta visión en 1987, en un video conceptual sobre un producto llamado Knowledge Navigator. El cortometraje retrata a un profesor universitario llevando a cabo varias acciones de la vida cotidiana y profesional hablando directamente a un asistente de software personificado en una computadora tipo tableta; todas las cosas que deseo hacer con mi computadora 38 años después. Knowledge Navigator, según el video, podría sintetizar información de varias fuentes, respondiendo a las solicitudes de un usuario para mostrar varios documentos y datos. “Déjame ver las notas de la clase del semestre pasado”, dijo el profesor, y la computadora llevó a cabo la tarea. Mientras el profesor revisaba artículos, la computadora pudo identificar uno de una colega, encontrar su información de contacto y llamarla a petición suya.
Aunque es poco conocida fuera de los círculos de historia de la computación, Knowledge Navigator es legendaria en Silicon Valley. Se basó en visiones igualmente míticas para la computación, como la propuesta de Alan Kay en 1972 para una computadora tipo tableta que él llamó DynaBook. Apple eventualmente llevaría a cabo la forma de esa idea en el iPad. Pero la visión de Knowledge Navigator no se trataba realmente de cómo se vería o se sentiría un dispositivo. Se trataba de lo que haría: permitir integrar todos los aspectos de una vida digital (entonces aún teórica) al hablar con un agente virtual, al estilo de Star Trek. Hoy, este sueño se siente tecnológicamente factible, sin embargo, aparentemente sigue estando fuera de alcance. (Federighi prometió en la entrevista de junio que una mejor Siri está a la vuelta de la esquina, con “muchísima mayor calidad y mucho mejor capacidad”.)
Apple Intelligence—en realidad, la IA generativa en general—subraya una triste realidad. La historia de las interfaces de computadoras personales también es una historia de decepciones. Al principio, los usuarios tenían que escribir para hacer cosas con archivos y programas, usando comandos esotéricos para navegar hacia arriba y hacia abajo por las estructuras de directorios que los contenían. La interfaz gráfica de usuario, que Apple popularizó, adaptó ese paradigma de archivos y carpetas en una abstracción de escritorio, donde los usuarios podrían hacer clic y mover esos archivos. Pero el progreso produjo confusión. Eventualmente, a medida que los discos duros crecían y se acumulaban correos electrónicos, acabamos con tantos materiales digitales que encontrarlo a través de una búsqueda virtual se volvió difícil. Los comandos de texto devueltos a través de funciones como Spotlight de Apple, que permite a un usuario escribir el nombre de un archivo o programa, son lo que podrían haber hecho hace 50 años.
Pero ahora todo el espacio de información es parte de la interfaz de computadora. La ubicación y la ruta a Lowe’s se mezclan con personas llamadas Lowe en mi libreta de direcciones personal. Una barbacoa podría ser un evento particular al que asistí, o podría ser una abstracción etiquetada en imágenes en línea. Esto no es nada nuevo, por supuesto; durante décadas, usar una computadora ha significado estar en línea, y la conglomeración de materiales digitales en tu cabeza, en tu disco duro y en internet a menudo causa problemas. Cuando buscas en la web, Google pregunta si quizás estás realmente buscando la cosa que considera más común en función del comportamiento de otras personas, en lugar de la cosa que escribiste. Y iCloud Drive carga amablemente tus archivos en la nube para ahorrar espacio en disco, pero entonces no puedes acceder a ellos en un avión sin servicio Wi-Fi. Estamos ahogándonos en datos, pero de alguna manera no podemos beber de su manantial.
En principio, la IA debería resolver esto. Servicios como ChatGPT, construidos sobre grandes modelos de lenguaje que están entrenados en vastas cantidades de datos en línea y fuera de línea, prometieron domesticar los espacios salvajes de internet. Y a pesar de todo su riesgo de fabricación y alucinación, los LLM realmente cumplen en ese aspecto. Si quieres saber si existe una lente con propiedades específicas compatibles con un modelo particular de cámara, o buscar consejos sobre cómo realizar una reparación de fontanería, probablemente ChatGPT puede ser útil. Pero ChatGPT es mucho menos probable que te ayude a darle sentido a tu bandeja de entrada o a tus archivos, en parte porque no ha sido entrenado en ellos, y en parte porque aspira a convertirse en un dios en lugar de un sirviente.
Apple Intelligence se suponía que llenaría ese vacío, y lo haría de manera distintiva. Knowledge Navigator nunca se construyó, pero fue muy influyente dentro de la industria tecnológica como una visión de una experiencia informática; muestra que Apple ha expresado este objetivo durante décadas, aunque bajo diferentes condiciones tecnológicas y liderazgo ejecutivo. Otras empresas, incluida Google, están ahora haciendo progresos hacia ese objetivo también. Pero Apple se encuentra en una posición única para llevar a cabo la visión. Es principalmente un negocio de hardware de computadoras personales centrado en la relación entre el usuario y el dispositivo (y sus propios datos) en lugar de la relación entre el usuario y internet, que es cómo funcionan casi todas las otras grandes empresas tecnológicas. Apple Intelligence haría sentido de toda tu información personal y otorgaría un acceso nuevo y mejorado a ella a través de Siri, que finalmente realizaría su propósito como una interfaz de lenguaje natural impulsada por IA para todos esos datos. Como la compañía ha hecho durante décadas, Apple dejaría el desordenoso internet mayormente a otros y se centraría en el dispositivo en sí.
Esa idea sigue siendo buena. Usar una computadora para navegar mi vida laboral o personal sigue siendo sorprendentemente difícil. Los calendarios no se sincronizan correctamente. La búsqueda de correos electrónicos sigue sin funcionar bien, por alguna razón. Los archivos están esparcidos por todas partes, en varias aplicaciones y servicios, ¿y quién puede recordar dónde? Si los especialistas en computación no pueden hacer que la IA funcione de manera efectiva en las máquinas, nadie creerá que pueden hacer lo mismo para nada, y mucho menos para todo lo demás.
¿Quieres contenido aún más especializado? ¡Suscríbete a nuestro newsletter!
Comments ()