¿Puede la Inteligencia Artificial ayudarnos a debatir mejor?
La búsqueda de evidencias demostrativas de nuestros argumentos constituye una parte esencial de la preparación de cualquier debate y se engloba en lo que, de modo genérico, denominamos “investigación”. Es verdad que para ello partimos en el debate universitario contemporáneo de instrumentos que son ya de por sí increíblemente sofisticados, como es el caso de los buscadores, o motores de búsqueda, de la red. No son los únicos medios, pero nadie negará su papel preponderante.
Pero hay más: el artículo que os ofrecemos a continuación es sugerente, no ya por los progresos que muestra la Inteligencia Artificial (IA) en este terreno, sino por otras dos cosas que, lógicamente, no pueden ignorarse: que la cuestión no estriba en acumular cantidades inconmensurables de información sino en abrirse paso entre ellas y descubrir lo más útil, eficaz y pertinente; y por otro lado, que lo que más se resiste a la IA es precisamente lo más “humano”: la capacidad de razonar, de establecer diferencias, de hacer distinciones y juicios que no provengan necesariamente de un patrón mecánico y fácilmente reconocible.
El artículo se publicó el 21 de enero de este año en la MIT Technology Review, la revista del Massachusetts Institute of Technology, institución que no por casualidad figura en lo más alto de cualquier clasificación de las universidades del mundo y con la que Comillas mantiene estrecha relación a través de ICAI.
Su autor, Will Douglas Heaven, uno de los responsables, además, de ser editor de la revista, ha trabajado asimismo para la página Future Now de la BBC, así como para la prestigiosa revista británica New Scientist.
A continuación te ofrecemos la traducción del artículo:
La Inteligencia Artificial de IBM ha dado un gran paso para poder ser una herramienta útil.
Will Douglas Heaven
Traducción: Pablo Carbajosa
Los ordenadores nos han llevado hasta la luna, y vuelta, pero no pueden ayudarnos con las decisiones más importantes que hemos de afrontar hoy en día. ¿Habría que procesar a Donald Trump y apartarlo de su cargo? ¿Debería Gran Bretaña salir de la UE? ¿Tendría Australia que dejar de exportar combustibles fósiles? Preguntas como estas no tienen fácil respuesta con un “sí” o un “no”, por tentador que resulte pensar de otra manera.
Tomamos decisiones sopesando pros y contras. La Inteligencia Artificial (IA) posee el potencial de ayudarnos a ello cribando montañas de datos cada vez más ingentes. Pero para que resulte verdaderamente útil, le hace falta razonar más como un ser humano. “Hacemos uso del lenguaje persuasivo y de toda suerte de conocimiento de fondo, que resulta muy difícil de modelar en IA”, afirma Jacky Visser, del Centro de Tecnología de la Argumentación de la Universidad de Dundee, en Escocia, Reino Unido. “Este ha sido uno de los santos griales desde que la gente empezó a pensar en la IA”.
Una técnica medular utilizada para ayudar a razonar a las máquinas, conocida como “minería de argumentos” (“argument mining”), implica elaborar un programa (“software”) para analizar documentos escritos y extraer sentencias clave que proporcionen evidencias a favor o en contra de una determinada afirmación. Luego se pueden ensamblar formando una argumentación. Además de ayudarnos a tomar mejores decisiones, esas herramientas se podrían utilizar para cazar noticias falsas (“fake news”) — minando las afirmaciones sospechosas y respaldando aquellas basadas en hechos —o para filtrar los resultados de búsquedas en la Red, teniendo como resultado declaraciones relevantes, en lugar de documentos enteros.
El trabajo de otros grupos sobre la minería de argumentos se ha centrado en tipos concretos de textos, como documentos legales o trabajos de estudiantes, que tienden, para empezar, a contener gran cantidad de argumentación estructurada. Eso resulta útil si se quiere un resumen de todas las evidencias encontradas en muchos documentos diferentes sobre un caso legal, por ejemplo. Pero la meta última consiste en desarrollar un sistema que pueda rastrear todas las fuentes posibles de información y desarrollar un argumento recurriendo a cualquier elemento de prueba que pueda encontrar.
IBM acaba de dar un gran paso en esa dirección. El equipo del Proyecto Debatidor [Project Debater] de la empresa pasó varios años desarrollando una IA que pueda desarrollar argumentos. El año pasado, IBM realizó una demostración de la tecnología en proceso de elaboración en un debate en vivo contra un debatiente humano, campeón mundial, el equivalente del enfrentamiento de Watson [un supercomputador de inteligencia artificial de IBM] en Jeopardy! [programa concurso de televisión en el que Watson se enfrentó a varios humanos…y les venció.] Esos recursos publicitarios son divertidos, y ofrecían una demostración de lo que es el concepto. Y ahora IBM está convirtiendo su juguete en una herramienta de verdadera actualidad.
La versión del Proyecto Debatidor utilizada en los debates en vivo incluía las semillas del sistema más moderno, como es la capacidad de buscar millones de artículos nuevos. Pero en los meses transcurridos desde entonces, el equipo ha afinado ampliamente las redes neuronales que utiliza, mejorando la calidad de las evidencias que puede exhumar. Un importante añadido lo constituye BERT, una red neuronal que desarrolló Google para el procesamiento de lenguaje natural, que puede contestar preguntas. El trabajo se presentará en la Asociación para el Avance de la Inteligencia Artificial en Nueva York el mes que viene.
Para adiestrar a su IA, el investigador principal, Noam Slonim, y sus colegas de IBM Investigación en Haifa, Israel, echó mano de 400 millones de documentos tomados de la base de datos LexisNexis de artículos de periódicos y revistas. Con ello se hicieron con unos 10.000 millones de frases, un corpus de lenguje natural cincuenta veces mayor que Wikipedia. Emparejaron este inmenso conjunto con afirmaciones acerca de varios cientos de temas distintos, tales como “Debería ser obligatorio donar sangre” o “Deberíamos dejar de celebrar San Valentín”.
Pidieron después a trabajadores del público de la plataforma Figure Eight que etiquetaran las frases según que ofrecieran o no pruebas a favor o en contra de determinadas afirmaciones. Los datos etiquetados se introdujeron en un algoritmo de aprendizaje supervisado.
La red neuronal resultado de ello puede tratar preguntas sobre una amplia variedad de temas, dando como resultado frases que son más relevantes que las identificadas por sistemas anteriores. Clasifica las sentencias que encuentra de acuerdo con su eficacia como evidencia. Así, por ejemplo, dada la afirmación “Debería ser obligatorio donar sangre”, el programa encontró la frase “Un estudio publicado en el American Journal of Epidemiology descubrió que los donantes de sangre tienen un 88 % menos de riesgo de sufrir un ataque cardíaco o una apoplejía”.
Un reto grande es el que supone diferenciar las frases que ofrecen evidencias de las que no, aunque contengan los mismos términos. El Proyecto Debatidor encontró asimismo esta frase a favor de la afirmación sobre la donación de sangre, por ejemplo, pero fue capaz de decir que ni la respaldaba ni la socavaba: “Las estadísticas del Banco de Sangre Nakasero muestran que los estudiantes son los principales donantes de sangre, aportando cerca del 80 % de la sangre que se recoge en todo el mundo”.
Qué es lo que hay exactamente en esas frases que recoge la red neuronal para realizar su clasificación es algo que no está claro, afirma Slonim. Con todo, cuando se probó el Proyecto Debatidor logró un 95% de precisión en las cincuenta frases principales referidas a cien temas distintos, afirma, y añade: “Esas cifras son insólitas”. Otros sistemas se han enfrentado solamente a unas cuantas docenas de temas. Se trata también de una gran mejora sobre el sistema de debates en vivo que mostró Slonim el año pasado.
Otros investigadores con los que he hablado, entre ellos Visser y Oana Cocarascu, que estudia programas de argumentación y procesamiento de lenguaje natural en el Imperial College de Londres, se mostraron a su vez impresionados con el nuevo sistema. Para Cocarascu, el potencial de aplicaciones en el mundo real es lo que resulta más emocionante. Un sistema adiestrado en documentos legales no puede lidiar con los muy distintos tipos de evidencias que se encuentran en la Red. El equipo de Slonim ha mostrado que el Proyecto Debatidor puede manejar este amplio abanico de recursos. “Eso es lo que lo hace estupendo”, afirma Cocarascu.
El equipo está ahora publicando sus datos de adistramiento para que trabajen otros con ellos. Visser quiere desarrollar herramientas de minería de argumentos cono el Proyecto Debatidor que puedan evaluar la calidad de los argumentos, estando atentos a cosas como el sesgo cognitivo. Él y sus colegas han recurrido a la IA para estimar la calidad de los argumentos en los debates presidenciales, por ejemplo.
La misma IBM está haciendo algo semejante. Por medio de un añadido, denominado “Discurso por Multitud” (“Speech by Crowd”), el Proyecto Debatidor puede convocar una búsqueda masiva de argumentos a favor y en contra y luego evaluar automáticamente la calidad de los argumentos presentados recurriendo a una red neuronal adiestrada con un conjunto de datos de cerca de 30.000 argumentos previamente puntuados por humanos en función de su calidad.
IBM tiene planes para ofrecer el Proyecto Debatidor como plataforma para empresas y gobiernos. “Vemos el futuro del Proyecto Debatidor como servicio de nube de IA”, afirma Christopher Sciacca, portavoz de la empresa. Como ejemplo de la aplicación, IBM recogió 3.500 opiniones de ciudadanos de Lugano, en Suiza, acerca de si debería invertir la ciudad en vehículos autónomos, y recurrió a la IA para extraer y evaluar argumentos a favor y en contra de la propuesta. El gobierno municipal podría utilizar los resultados para ayudar a tomar decisiones en relación a una medida política.
Pero, para Slonim, todo se centra en mejorar nuestra interacción con la IA en el plano personal. Los argumentos desempeñan una parte importante en cómo se comunica la gente: enumeramos las razones, pedimos consejo, persuadimos y convencemos. Hablar con asistentes virtuales que pudieran dialogar en ese plano parecería bastante más natural. “Lo que estamos haciendo afecta a algo fundamental de nuestras vidas”, declara. “Estamos tratando de enlazar las tecnologías de comprensión lingüística para ayudar a que la gente tome decisiones mejores”.
The MIT Technology Review, 21 de enero de 2020
En este vídeo puedes ver el debate que se produjo entre Project Debater y Harish Natarajan (en inglés):
Puedes seguirnos en el Twitter de Comillas Cultural y a través de nuestro canal de Telegram.