Google actualizó su política de privacidad durante el fin de semana, diciendo explícitamente que la compañía se reserva el derecho de recopilar prácticamente todo lo que publiques en línea para construir sus herramientas de IA. Si Google puede leer tus palabras, asume que ahora le pertenecen a la empresa y espera que estén anidadas en algún lugar en las entrañas de un chatbot.
"Google utiliza la información para mejorar nuestros servicios y desarrollar nuevos productos, funciones y tecnologías que benefician a nuestros usuarios y al público", dice la nueva política de Google. "Por ejemplo, utilizamos información disponible públicamente para ayudar a entrenar los modelos de IA de Google y construir productos y características como Google Translate, Bard y capacidades de IA en la nube".
Afortunadamente para los aficionados a la historia, Google mantiene un historial de cambios en sus términos de servicio. El nuevo lenguaje modifica una política existente, detallando nuevas formas en las que tus reflexiones en línea podrían ser utilizadas para el trabajo de las herramientas de IA del gigante tecnológico.
Anteriormente, Google decía que los datos se utilizarían "para modelos de lenguaje", en lugar de "modelos de IA", y donde la política anterior solo mencionaba a Google Translate, ahora también aparecen Bard y Cloud AI.
Esta es una cláusula inusual para una política de privacidad. Por lo general, estas políticas describen las formas en que una empresa utiliza la información que publicas en los propios servicios de la empresa. Aquí, parece que Google se reserva el derecho de recolectar y aprovechar los datos publicados en cualquier parte de la web pública, como si todo Internet fuera el patio de recreo de IA de la compañía. Google no respondió inmediatamente a una solicitud de comentario.
Esta práctica plantea nuevas e interesantes preguntas sobre la privacidad. Las personas comprenden en general que las publicaciones públicas son públicas. Pero hoy en día, necesitas un nuevo modelo mental de lo que significa escribir algo en línea. Ya no se trata de quién puede ver la información, sino de cómo podría ser utilizada. Existe una buena probabilidad de que Bard y ChatGPT hayan digerido tus olvidadas publicaciones de blog o reseñas de restaurantes de hace 15 años. Mientras lees esto, los chatbots podrían estar regurgitando alguna versión humoncolesca de tus palabras de formas imposibles de predecir y difíciles de entender.
Una de las complicaciones menos obvias del mundo posterior a ChatGPT es la cuestión de dónde obtuvieron sus datos los chatbots ávidos de información. Empresas como Google y OpenAI han recopilado grandes partes de Internet para alimentar sus hábitos robóticos. No está del todo claro que esto sea legal, y en los próximos años los tribunales se enfrentarán a preguntas sobre derechos de autor que habrían parecido ciencia ficción hace unos años. Mientras tanto, el fenómeno ya afecta a los consumidores de formas inesperadas.
Los altos mandos de Twitter y Reddit se sienten particularmente agraviados por el tema de la IA y han realizado cambios controvertidos para proteger sus plataformas. Ambas compañías han desactivado el acceso gratuito a sus APIs, lo que permitía a cualquiera descargar grandes cantidades de publicaciones. Supuestamente, esto pretende proteger los derechos de propiedad intelectual de los sitios de redes sociales, pero ha tenido otras consecuencias.
Los cambios en las APIs de Twitter y Reddit han afectado a herramientas de terceros que muchas personas utilizaban para acceder a esos sitios. Por un momento, incluso pareció que Twitter iba a obligar a las entidades públicas, como los servicios meteorológicos, de transporte y de emergencia, a pagar si querían tuitear. Sin embargo, la compañía dio marcha atrás después de recibir una gran cantidad de críticas.
Últimamente, la extracción de datos web es el enemigo favorito de Elon Musk. Musk ha culpado a una serie de desastres en Twitter a la necesidad de la compañía de evitar que otros extraigan datos de su sitio, incluso cuando los problemas parecen no estar relacionados. Durante el fin de semana, Twitter limitó el número de tweets que los usuarios pueden ver por día, lo que volvió el servicio casi inutilizable. Musk dijo que fue una respuesta necesaria a la "extracción de datos" y a la "manipulación del sistema". Sin embargo, la mayoría de los expertos en tecnología de la información coinciden en que la limitación de la velocidad probablemente fue una respuesta a problemas técnicos derivados de una mala gestión, incompetencia o ambas cosas. Twitter no respondió a las preguntas de Gizmodo sobre el tema.
En Reddit, el efecto de los cambios en la API fue especialmente ruidoso. Reddit es básicamente administrado por moderadores no remunerados que mantienen los foros saludables. Los moderadores de subreddits grandes tienden a depender de herramientas de terceros para su trabajo, herramientas que están construidas sobre APIs ahora inaccesibles. Esto generó una protesta masiva, donde los moderadores básicamente cerraron Reddit. Aunque la controversia aún está en desarrollo, es probable que tenga consecuencias permanentes, ya que los moderadores desilusionados cuelgan sus sombreros.