En su trascendental juicio por antimonopolio, Google ha señalado una tecnología emergente que podría igualar la competencia en el mercado de motores de búsqueda: la inteligencia artificial.
Durante sus interrogatorios cruzados a testigos del Departamento de Justicia, Google ha empleado mucho tiempo haciendo referencia a informes que indican que la revolución de la IA representa un "cambio de paradigma" para la búsqueda y podría plantear "una de las mayores amenazas para la posición establecida de Google como la principal puerta de entrada a Internet".
Sin embargo, las afirmaciones de Google sobre la IA como un gran nivelador han sido contradichas por un testigo estrella poco probable: el propio chatbot de IA de Google, Bard.
En las conversaciones obtenidas y repetidas por The Prospect, se interrogó al chatbot sobre las cuestiones en juego. El propio chatbot reconoció que su ventaja sobre otros chatbots de IA proviene del amplio conjunto de información disponible para él, que se deriva de otros productos de Google y de su rastreador web, que es el mismo que utiliza Google Search para indexar Internet. "Esta ventaja es probable que siga creciendo a medida que Google continúe invirtiendo en sus tecnologías de rastreo e indexación", afirmó Bard.
Cuando se le preguntó si los motores de búsqueda competidores pueden acceder a este conjunto de datos, Bard inicialmente dijo que sí, pero admitió que estaba equivocado. "Google no ha publicado el conjunto de datos de entrenamiento de Bard porque quiere proteger su propiedad intelectual", afirmó la IA en una conversación. En otra, Bard simplemente afirmó: "El conjunto de datos es un activo valioso para Google y le otorga a Google una ventaja competitiva en el mercado de IA".
Más de David Dayen | Luke Goldstein
Además, Bard explicó que los sitios web de terceros que deseen controlar sus propios datos y decidan proteger a Bard del escaneo de su contenido enfrentarían consecuencias. "Es importante tener en cuenta que bloquear a Google-Extended", señaló Bard, refiriéndose al nombre del rastreador web de Bard, "también evitará que Bard explore e indexe su sitio para Google Search. Esto significa que su sitio no será elegible para aparecer en las SERP (páginas de resultados de motores de búsqueda) de Google".
Esto hace que Bard sea extremadamente propenso a maximizar la adquisición de datos y bloquear a los competidores para recibirlos. Si esto tiene éxito, Bard reconoció que es posible que "Bard pueda brindar a los usuarios toda la información que necesitan en un solo lugar, sin necesidad de visitar otros sitios web". Bard también planteó un escenario alternativo en el que Bard podría aumentar la competencia en la búsqueda en Internet, pero gran parte de su respuesta depende de que los rivales puedan obtener los datos de entrenamiento de Bard, lo que admite que no está permitido actualmente.
Bard expone otros impactos perjudiciales que la IA generativa podría tener en los sitios web de terceros que dependen de Google. Mientras Bard recopila datos de sitios web de terceros, afirmó que no siempre enlazaría a esos sitios en sus resultados. En una conversación, Bard explicó que la decisión de enlazar o citar una fuente es una cuestión de "preferencia personal", y "depende de mí".
Como resultado, Bard admitió que sus respuestas autorizadas probablemente desviarían tráfico y ingresos de los productores externos de páginas web, sin posibilidad de escapar de la órbita de Google en la web.
Es posible que menos personas salgan de Google para visitar otros sitios una vez que Bard esté integrado en los resultados de búsqueda generales. Esto podría llevar a una disminución en el tráfico hacia esos sitios y dificultarles la creación de modelos de negocio sostenibles", afirmó Bard.
Bard argumentó que Google también podría aprovechar los datos de sus otros productos, como Gmail, Google Drive y Google Maps, para obtener una ventaja en herramientas de IA. Estas afirmaciones ya han sido confirmadas por un informe del New York Times sobre la reciente autorización de Google a Bard para utilizar estas líneas de negocio independientes.
Se llevó a cabo una conversación inicial en un chat por parte de un individuo externo crítico con el poder de mercado de Google. Después, The Prospect hizo las mismas preguntas y obtuvo resultados generalmente similares, aunque no exactamente iguales.
HAY SOLO DOS POSIBLES VERSIONES de las respuestas de Bard en estos chats. Da la casualidad de que son correctas, lo que ofrece una visión de las intenciones de Google de maximizar el poder de sus datos para crear e integrar IA generativa en detrimento de los competidores. La otra opción es que Bard esté sintetizando información de noticias y foros de mensajes y otras fuentes de datos, y no informe de manera confiable sobre la verdad de lo que Google está haciendo con Bard.
En una declaración, un portavoz de Google optó por la opción dos. "Todos los LLMs alucinan, incluido Bard", dijo el portavoz a The Prospect en una declaración por correo electrónico. "Como siempre hemos dicho, Bard es un experimento diseñado para la creatividad y la productividad, y es mejor recomendando lugares imperdibles en NYC o sugiriendo decoraciones de Acción de Gracias que dando opiniones sobre complejas demandas por prácticas anticompetitivas".
Pero esta respuesta significa que Bard es deficiente no solo en el análisis de demandas legales, sino también en explicar qué hace Bard y cómo se utiliza. Si bien no deberíamos confiar en que la IA hable de sí misma de manera confiable, esto pone en duda el valor que podemos obtener de ella en una serie de temas.
Google ha llamado repetidamente a Bard un experimento y ha sido bastante transparente al respecto. En el sitio web de demostración de Bard, se advierte: "Bard no siempre acertará: puede dar respuestas inexactas u ofensivas. Si tienes dudas, utiliza el botón de Google para verificar las respuestas de Bard".
The Prospect lo hizo en varias ocasiones. La Búsqueda de Google confirmó que Google-Extended es el rastreador web de Bard, que Bard extrae datos de la web, y que los usuarios ya pueden integrar Bard en otros productos de Google, incluida la Búsqueda.
Fue más inconcluso sobre cómo Bard decide enlazar datos, o si los motores de búsqueda de terceros pueden integrar Bard en sus productos.
La naturaleza experimental de Bard se manifestó en ocasiones en las conversaciones. Bard le dice al individuo externo en su chat que puede raspar sitios web de terceros, mientras le dice al Prospect que no puede. Google ha sido cauteloso al respecto en el pasado, consciente de las preocupaciones de privacidad, pero en julio confirmó que estaba utilizando datos de terceros para Bard.
Bard expone los impactos perjudiciales que la IA generativa podría tener en sitios web de terceros que dependen de Google.
Bard también dio una respuesta legal a la pregunta de cómo los sitios web de terceros pueden evitar el raspado de datos. Indicó que los sitios web podrían usar etiquetas meta que evitarían que Bard mostrara todo o parte del contenido de ese sitio en sus respuestas. Por ejemplo, un sitio web podría ocultar un párrafo de texto poniendo una etiqueta "max-snippet" o "data-nonsnippet" alrededor de él, o agregar una etiqueta "no-snippet" para eliminar cualquier uso de contenido del sitio en las respuestas. Pero esto parece indicar que los datos no serán citados ni mencionados, no que no serán raspados. En otras palabras, los datos aún podrían ser accedidos para informar a Bard, incluso si no se muestra el contenido a los usuarios.
Si bien se citó la "preferencia personal" en un chat como un posible motivo para no vincular a una fuente en una respuesta, en otro chat esto no aparece. En ambos casos, Bard afirmó que si un sitio web no es "relevante, autoritario, de alta calidad o accesible", se negará a vincularlo. Pero luego agregó: "Mi objetivo es proporcionar a los usuarios la respuesta más útil e informativa posible. Si un enlace a un sitio ayudaría a alcanzar ese objetivo, entonces lo incluiré. Sin embargo, si un enlace no sería útil o informativo, entonces no lo incluiré". Eso parece apuntar de vuelta a la preferencia personal, y de todos modos, solo Bard tomaría la determinación de si un sitio web es "relevante, autoritario, de alta calidad o accesible".
En otras ocasiones, Bard parece simplemente confundido. Al explicar si la integración de Bard beneficiará a Google a expensas de otros sitios web, dio muchos ejemplos de por qué sería el caso. "Si un usuario busca 'cómo hacer un pastel', Bard podría generar una respuesta detallada que incluya instrucciones, ingredientes y consejos", escribió. "Esta respuesta podría ser tan completa e informativa que el usuario no necesite hacer clic en ningún enlace para obtener más información".
Por otro lado, Bard afirmó que su integración podría hacer que los usuarios abandonen Google y visiten otros sitios web. Pero la respuesta es un non sequitur: "Esto se debe a que Bard podría generar resultados de búsqueda tan informativos y completos que los usuarios ya no necesitan visitar otros sitios web para obtener más información".
En otro chat, Bard añadió: "También es probable que la integración de Bard en la búsqueda de Google aumente la dominancia de Google en la web. Google ya es el motor de búsqueda dominante en el mundo, y la integración de Bard en la búsqueda solo hará que el motor de búsqueda de Google sea más poderoso y útil".
Finalmente, las respuestas de Bard sobre cómo otros sitios web podrían beneficiarse de Bard sin poder acceder a los datos de entrenamiento rozan el pensamiento ilusorio. Indicó que un desarrollador simplemente podría construir su propia versión de Bard, aunque reconoce que "esto sería un desafío muy difícil y costoso". Sugiere que el desarrollador podría rastrear las páginas de búsqueda de Google y tomar todos los datos, a pesar de que "probablemente violaría los términos de servicio de Google". O Bard podría ser utilizado por otros desarrolladores como "fuente de inspiración".
En última instancia, la decisión de cómo hacer que Bard sea accesible para sitios no pertenecientes a Google recae en Google", concluye Bard.
LA IA HA ESTADO EN SEGUNDO PLANO del juicio en curso por violación a las leyes antimonopolio entre el Departamento de Justicia y Google. Desde el inicio del caso, los defensores de la ley antimonopolio, como el antiguo zar de políticas de competencia del presidente Biden, Tim Wu, han argumentado que la decisión del juez Amit Mehta podría influir en gran medida en las reglas de competencia en la carrera armamentista de IA entre las empresas tecnológicas.
Por su parte, Google también ha mencionado la competencia en IA como una ventaja propia en el juicio para rebatir varias de las acusaciones del gobierno. El equipo de defensa señala la carrera armamentista de IA para la búsqueda generativa como argumento de que el mercado de búsqueda se encuentra en un periodo de transición y que Google enfrenta una sólida competencia en el horizonte.
Los abogados de Google han sugerido que la IA es un mercado abierto porque los nuevos participantes pueden superar fácilmente las barreras de entrada que Google podría tener, como la escala y la gran cantidad de datos de usuarios. Esto se debe a que los nuevos productos de IA pueden, al menos en teoría, basarse en conjuntos de datos públicamente disponibles existentes para desarrollar el aprendizaje automático.
Google estableció estos puntos desde el comienzo del juicio durante el examen de su economista jefe, Hal Varian, quien cuestionó la importancia de los "efectos de red" para Google. Los abogados de Google también interrogaron al CEO de Microsoft, Satya Nadella, sobre la competencia en IA durante su testimonio. Nadella desafió la presentación de Google acerca del mercado de IA al explicar que los "conjuntos de datos dinámicos" de Google proporcionarían una gran ventaja para el desarrollo de la IA.
"Será aún más difícil competir en la era de la IA con alguien que tiene esa ventaja principal", dijo Nadella. Bard respaldó esta afirmación en nuestras conversaciones.
"La forma en que Google ha utilizado estos argumentos sobre la IA es una especie de juego de ilusionismo para deslumbrar al juez... pero no es realmente relevante para el meollo del caso", dijo Megan Gray, abogada independiente y exasesora jurídica de DuckDuckGo, quien ha estado asistiendo al juicio.
Al poner en duda su propia destreza tecnológica en IA, el equipo de defensa de Google también ha socavado las declaraciones de su propio CEO en las llamadas de ganancias. Sundar Pichai ha estado constantemente generando entusiasmo entre los inversionistas acerca de la confianza de Google en que podrá ganar el mercado de la IA. En la conferencia Google I/O de este año, Pichai llamó a Google "una empresa centrada en la IA", mencionando varias formas en las que "la IA generativa está ayudando a evolucionar nuestros productos".
Incluso los defensores de Google en su caso antimonopolio han dejado entrever sus pensamientos acerca de la IA. Adam Kovacevich, CEO del grupo comercial pro-tecnología Cámara de Progreso, al hablar sobre la reducción del caso antimonopolio del Departamento de Justicia en la etapa de decisión resumida, celebró "el ángulo de la IA en el fallo: ChatGPT y Bart muestran que la búsqueda está evolucionando aún más, de los enlaces a las respuestas/robots de chat".
Los sitios web pueden no estar contentos con la disminución de tráfico, pero los consumidores se benefician de respuestas más rápidas.
Eso es tan franco como Bard, reconociendo que la próxima iteración de la búsqueda integrada con IA buscará eliminar cualquier necesidad de que los usuarios visiten otros sitios web.
Bard es franco en otro aspecto: en su sitio de demostración, informa a los usuarios que "Bard puede compartir partes de sus conversaciones y otra información relevante, como su ubicación, con otros servicios".