El fundador de Sequoia, Don Valentine, solía hacer dos preguntas a los fundadores: "¿por qué ahora?" y "¿y qué?". En el centro de estas preguntas se encuentra la combinación de curiosidad y rigor que se pregunta qué ha cambiado en el mundo (¿por qué ahora?) y qué significará esto (¿y qué?).
La IA tiene un "¿por qué ahora?" convincente con el desarrollo de grandes modelos de lenguaje (LLMs) entrenados con la arquitectura Transformer. Los Transformers son adecuados para las GPU, lo que hace posible utilizar cantidades inmensas de datos y cálculos para entrenar modelos de IA con miles de millones y billones de parámetros.
También tenemos un persuasivo "¿y qué?" ahora. Estas tecnologías han permitido una nueva interfaz de usuario para las computadoras: el lenguaje humano. Al igual que la interfaz de usuario gráfica hizo que las computadoras personales fueran accesibles para millones de clientes en la década de 1980, las nuevas interfaces de lenguaje natural han hecho que la IA sea accesible para cientos de millones de usuarios de todo el mundo en el último año.
La inteligencia artificial ha pasado por muchos ciclos altos y bajos. Cuando la IA está en ascenso, como lo está ahora, el término se usa con demasiada frecuencia para incluir no solo la tecnología predictiva de vanguardia, sino también cualquier software que sea en cierto sentido "inteligente". Sin embargo, durante los inviernos anteriores de la IA, los investigadores recurrieron a términos más seguros como el aprendizaje automático.
John McCarthy acuñó el término de IA en la década de 1950 para distinguir su investigación de la cibernética de su antiguo rival Norbert Wiener. Sin embargo, McCarthy mismo se desencantó con el término, quejándose: "Tan pronto como funciona, nadie lo llama IA". McCarthy llamó al tendencia de las personas de cambiar el nombre de los esfuerzos pasados de IA con descripciones más funcionales tan pronto como se resolvían lo suficiente como el "efecto AI" y nos afecta hasta el día de hoy. La historia de la IA está llena de logros que han funcionado lo suficientemente bien como para no considerarse lo suficientemente inteligentes para merecer el apodo aspiracional.
Como recordatorio, consideremos la visión por computadora, que sustenta los avances actuales en la generación de imágenes. Durante mucho tiempo, detectar objetos en imágenes o videos era una IA de vanguardia, ahora es solo una de las muchas tecnologías que te permiten pedir un viaje en un vehículo autónomo de Waymo en San Francisco. Ya no lo llamamos IA. Pronto simplemente lo llamaremos un coche. Del mismo modo, la detección de objetos en ImageNet fue un avance importante en el aprendizaje profundo en 2012 y ahora está en todos los teléfonos inteligentes. Ya no es IA.
En el lado del lenguaje natural, hay una larga historia antes de la aparición de ChatGPT, Claude y Bard. Recuerdo haber usado Dragon Speech-To-Text alrededor de 2002 para escribir correos electrónicos cuando tenía el brazo roto. Lo que antes se llamaba IA ahora es simplemente "dictado" y está en todos los teléfonos y computadoras. La traducción de idiomas y el análisis de sentimientos, antes las joyas de la corona del procesamiento del lenguaje natural, ahora son algo común. No es IA.
También es fácil olvidar cuánto de lo que damos por sentado en la nube surgió de disciplinas anteriores de IA como los sistemas de recomendación (Netflix y Amazon) y la optimización de rutas (Google Maps y UPS). Cuanto más cotidiana se vuelve algo, menos probable es que lo llamemos IA.
Lo que se considera IA y lo que no lo es es importante para los fundadores porque a largo plazo siempre es mejor prometer menos y cumplir más. En lo que Gartner ha descrito a lo largo de décadas de ciclos de frenesí tecnológico, la entusiasmo desenfrenado es seguido inevitablemente por la decepción, el valle del desencanto.
Los fundadores se benefician a corto plazo del marketing atractivo, pero a un costo. Arthur C. Clark escribió famosamente: "Cualquier tecnología suficientemente avanzada es indistinguible de la magia". Pero él era un escritor de ciencia ficción. Los practicantes del aprendizaje automático son científicos e ingenieros y, sin embargo, a primera vista, sus esfuerzos siempre parecen ser mágicos, hasta que un día ya no lo son.
El paradigma actual de la IA es como perseguir una zanahoria en un palo mientras se corre en una cinta de correr. Para los fundadores de hoy, creo que es hora de romper este ciclo comprendiendo lo que realmente está sucediendo.
Hay una razón lingüística por la que seguimos cometiendo los mismos errores. Si usamos el Diccionario Oxford de Inglés para diseccionar recursivamente el término "Inteligencia Artificial", encontramos:
- "Artificial": hecho o producido por seres humanos en lugar de ocurrir naturalmente, especialmente como una copia de algo natural.
- "Inteligencia": la capacidad de adquirir y aplicar conocimientos y habilidades.
- "Conocimientos": hechos, información y habilidades adquiridas por una persona a través de la experiencia o educación; la comprensión teórica o práctica de un tema.
- "Habilidades": la capacidad de hacer algo bien.
Cada rama de esta definición recursiva se basa en "seres humanos" o "una persona". Por lo tanto, según la definición, pensamos en la IA como imitativa de los humanos. Pensemos en la prueba de Turing. Pero tan pronto como una capacidad se encuentra firmemente en el ámbito de las máquinas, perdemos el punto de referencia humano y dejamos de pensar en ello como IA.
Parte de esto es el excepcionalismo humano. A lo largo de los siglos, hemos elevado los aspectos de la inteligencia que parecen únicos en los humanos: el lenguaje, la imaginación, la creatividad y la lógica. Nos reservamos ciertas palabras para nosotros mismos. Los humanos piensan y razonan, las computadoras calculan. Los humanos hacen arte, las computadoras lo generan. Los humanos nadan, los barcos y submarinos no. Y sin embargo, "computadora" era una vez un título laboral del siglo XVII para una persona que calculaba, y empleamos habitaciones llenas de ellos antes de formalizar las computadoras mecánicas y electrónicas.
El efecto de la IA es en realidad parte de un fenómeno humano más amplio que llamamos el paradójico de la frontera. Debido a que atribuimos a los humanos la frontera más allá de nuestro dominio tecnológico, esa frontera siempre será mal definida. La inteligencia no es algo que podamos capturar, sino un horizonte siempre aproximado que convertimos en herramientas útiles. La tecnología es el artificio de la inteligencia forjada a lo largo de milenios de colaboración y competencia humana.
En 2018, me inspiré en una publicación del profesor de Estadística y Ciencias de la Computación de Berkeley, Michael Jordan. "Ya sea que lleguemos o no a comprender la 'inteligencia' pronto", escribió, "tenemos un desafío importante entre manos para unir las computadoras y los humanos de maneras que mejoren la vida humana. Si bien este desafío es visto por algunos como subordinado a la creación de 'inteligencia artificial', también se puede ver de manera más prosaica, pero sin menos reverencia, como la creación de una nueva rama de la ingeniería".
Esto me llevó a escribir mi propia publicación cuestionando la utilidad de llamar a este esfuerzo IA en absoluto. ¿Cinco años después, estamos más cerca de la visión de Jordan de una infraestructura práctica para la ampliación humana? Creo que sí, pero necesitamos un vocabulario más preciso para aprovechar la oportunidad computacional que se avecina.
La sorprendente eficacia de los LLM para generar un lenguaje coherente y creíble ha sorprendido a casi todos. La capacidad de los modelos de difusión para generar imágenes altamente detalladas y estéticamente atractivas a partir de descripciones de texto también ha superado las suposiciones convencionales. Y hay mucho más en el horizonte en términos de mejoras adicionales en el lenguaje y las imágenes, generalización a video y nuevas innovaciones en robótica, vehículos autónomos, biología, química y medicina.
Todos estos avances se benefician de la infraestructura para la computación distribuida que construyeron las últimas compañías tecnológicas de hiperescala en la nube. También se benefician de la enorme cantidad de datos que se ha acumulado en Internet, especialmente gracias a la ubicuidad de dispositivos móviles altamente utilizables con sus cámaras, sensores y facilidad de entrada de datos.
Pero llamar a todas estas cosas IA confunde al público y a los fundadores acerca de lo que realmente se necesita construir y cómo unirlo todo de manera segura y moral que fomente tanto la experimentación como el comportamiento responsable.
Dado toda esta increíble infraestructura, la IA como proyecto científico en la intersección de la informática, la física, la cognición y la neurociencia seguramente avanzará a lo largo de la frontera de la comprensión. También seguirá contribuyendo con aplicaciones útiles, pero si las llamamos a todas IA, el término perderá rápidamente su significado y su novedad.
Los expertos estiman que incluso con la recuperación de información, los LLM tienen una precisión de aproximadamente el 90% del tiempo. Todavía queda mucha investigación y escalado para llegar al 99%. Sin embargo, una vez que alcancen ese 99%, ya no serán IA, serán "interfaces de lenguaje" o simplemente LLM. Podrás escribir código sobre la marcha, comunicarte con personas en otros idiomas, aprender o enseñar lo que te interese y más. El impacto será real, pero no lo llamaremos IA. Estas nuevas capacidades se volverán invisibles para nosotros, partes adicionales de nuestras mentes extendidas junto con nuestros motores de búsqueda y teléfonos inteligentes.
Esto es el paradójico de la frontera en acción. La IA se está acelerando tan rápidamente que pronto simplemente será una tecnología y una nueva frontera será la IA. Graduarse en tecnología debería verse como un distintivo de honor para una idea que anteriormente estaba en la vanguardia de lo posible. El paradójico de la frontera significa que la IA siempre se referirá a enfoques aspiracionales, mientras que la tecnología se referirá a lo que se puede poner en funcionamiento hoy. Creemos que necesitamos ambas cosas.
En Sequoia, hemos tratado de ser más precisos en cómo hablamos internamente de AI y con los fundadores. Nos enfocamos en tecnologías específicas que pueden utilizarse, como los transformadores para modelos de lenguaje grandes o la difusión para la generación de imágenes. Esto hace que nuestra capacidad para evaluar un emprendimiento sea mucho más explícita, tangible y real.
El viaje empresarial comienza con el lenguaje. Solo a través del lenguaje las empresas pueden expresar la singularidad de su producto y su beneficio para los clientes mucho antes de que esté listo para ser lanzado. La precisión del lenguaje es la clave para crear categorías, diseñar empresas y liderar el mercado, los componentes que hacen a las empresas duraderas.
Esta precisión es aún más importante a medida que los fundadores surfean las crecientes olas de AI para mantenerse justo en la frontera. Los fundadores que puedan definir el lenguaje mientras esta frontera se convierte en tecnología cotidiana, tendrán una ventaja distintiva.