por Peter Grad, Tech Xplore

El flujo de decisión de SIDE, desde una afirmación en Wikipedia hasta una sugerencia para una nueva cita, es el siguiente: (1) la afirmación se envía al motor de recuperación Sphere, que produce una lista de posibles documentos candidatos del corpus de Sphere; (2) el motor de verificación clasifica los documentos candidatos y la cita original con respecto a la afirmación; (3) si la cita original no se clasifica por encima de los documentos candidatos, entonces se sugiere una nueva cita de los candidatos recuperados. Tenga en cuenta que la puntuación del motor de verificación puede ser indicativa de una verificación fallida potencial, como la reportada en el ejemplo. Crédito: Nature Machine Intelligence (2023). DOI: 10.1038/s42256-023-00726-1

Hay suficientes opiniones diferentes sobre la utilidad de Wikipedia como para llenar, bueno, una enciclopedia.

El novelista Nicholson Baker llamó a Wikipedia, una recopilación de datos que sus desarrolladores llaman una colección de todo el conocimiento del mundo, "simplemente una cosa increíble. Es enormemente grande, y es idiosincrásico, cuidadoso, desordenado, divertido, impactante y está lleno de controversias latentes, y además es gratuito y rápido".

El escritor Oscar Auliq-Ice declaró que Wikipedia es "un recurso revolucionario que ha transformado la forma en que las personas acceden y comparten información".

Algunos reconocen el gigantesco recurso en línea, que esta semana contiene más de 6,7 millones de artículos (en inglés) compuestos por más de 4,3 mil millones de palabras, como un proyecto majestuoso pero defectuoso.

"Wikipedia es como un lecho de flores, mayormente hermoso con algunas malas hierbas feas", dijo el experto en medio ambiente Steven Magee.

Al señalar la naturaleza colectiva de Wikipedia, que está abierta a cualquier persona que ofrezca información, el humorista Stephen Colbert sugirió: "Wikipedia es el primer lugar al que acudo cuando busco conocimiento... o cuando quiero crear algo".

Sin embargo, para algunos, Wikipedia es una píldora amarga. "No necesito acceso inalámbrico a Wikipedia. Preferiría saltear mis propios intestinos delgados antes que tener un acceso continuo a un sitio donde la entrada sobre Klingon es más larga que la entrada sobre el latín", dijo Tara Brabazon, decana de estudios de posgrado y profesora de estudios culturales en la Charles Darwin University de Australia.

Si bien generalmente se considera una fuente recomendable y rápida de información, siempre se aconseja a los usuarios que hagan su debida diligencia y no confíen únicamente en una sola fuente de información. Más bien, deben revisar otros sitios web, explorar los enlaces de los artículos y quizás lo más importante, verificar las fuentes mencionadas al final de cada entrada de Wikipedia.

Expertos de todo el mundo son contribuyentes regulares de Wikipedia y la mayoría sigue pautas en cuanto a neutralidad y uso de fuentes confiables. El sistema funciona en general, aunque siempre se pueden hacer mejoras.

Esta semana, Nature Machine Intelligence publicó un artículo titulado "Mejorando la verificabilidad de Wikipedia con IA", sobre una empresa de IA con sede en Londres que busca fortalecer la confiabilidad del sistema de referencia de Wikipedia.

Lo hace mediante la verificación de fuentes e identificando aquellas que son precisas y las que son cuestionables, para luego proporcionar sus propias recomendaciones.

Fabio Petroni, co-fundador de Samaya AI, una plataforma de descubrimiento de conocimiento, dijo: "El proceso de mejorar las referencias se puede abordar con la ayuda de la inteligencia artificial impulsada por un sistema de recuperación de información y un modelo de lenguaje. Las máquinas pueden ayudar a los humanos a encontrar mejores citas, una tarea que requiere comprensión del lenguaje y dominio de la búsqueda en línea".

Su equipo entrenó su modelo con un enorme conjunto de datos de entradas de Wikipedia y luego lo utilizó para revisar artículos que no había escaneado antes. Analizó fuentes y ofreció sitios alternativos de referencia, y sus resultados fueron examinados por los usuarios de Wikipedia.

Cuando el sistema de IA, llamado SIDE, clasificó las fuentes de Wikipedia como no verificables y ofreció sus propias alternativas, los usuarios prefirieron las recomendaciones de SIDE el 70% de las veces, descubrieron los investigadores.

En aproximadamente la mitad de los casos, SIDE recomendaba las mismas fuentes idénticas que Wikipedia había ofrecido como su primera referencia.

"Demostramos que las tecnologías existentes han llegado a un punto en el que pueden apoyar de manera efectiva y pragmática a los usuarios de Wikipedia en la verificación de afirmaciones", dijo Petroni.

Dijo que la investigación futura se centrará en las referencias de Wikipedia más allá del texto en internet, como imágenes, vídeos y publicaciones en papel.

"Esperamos que este trabajo pueda ser utilizado en un contexto más amplio... ayudando a los humanos a verificar los hechos. En general, creemos que este trabajo podría conducir a una información en línea más confiable", dijo Petroni.

Más información: Fabio Petroni et al, Mejora de la verificabilidad de Wikipedia con inteligencia artificial, Nature Machine Intelligence (2023). DOI: 10.1038/s42256-023-00726-1

Información de la revista: Nature Machine Intelligence © 2023 Science X Network