Algoritmos de clasificación mejoran servicios en línea
Algoritmos de clasificación mejoran servicios en línea, resultado de una metodología desarrollada en un trabajo en el que ha participado Vicente Gómez, investigador del grupo de investigación en Artificial Intelligence and Machine Learning del DTIC, presentado a: International Workshop on Misinformation, Computational Fact-Checking and Credible Web, San Francisco (EE.UU.); Alan Turing Instituto, en Londres (Reino Unido).
Los modelos de clasificación o rankings son omnipresentes en una gran variedad de servicios en Internet, desde motores de búsqueda, comercios, sistemas de recomendación, medios de comunicación social y citas en línea. En consecuencia, se ha vuelto mucho más fácil para el usuario encontrar información, productos de consumo, ofertas de trabajo, opiniones etc. Los sistemas de clasificación han aumentado los servicios disponibles para los usuarios en línea. Sin embargo, se les ha atribuido también fuentes de desinformación, de polarización y de discurso inapropiado o antidemocrático.
Un trabajo en el que ha participado Vicente Gómez , investigador del grupo de investigación en Artificial Intelligence and Machine Learning , en el Departamento de Tecnologías de la Información y las Comunicaciones ( DTIC ) de la UPF, ha tenido como objetivo principal diseñar modelos de clasificación consecuentes capaces tener en cuenta las consecuencias de sus propuestas de clasificación a largo plazo. El trabajo se ha presentado en dos certámenes internacionales: International Workshop on Misinformation, Computational Fact-Checking and Credible Web, 14 de mayo, San Francisco (EE.UU.); Alan Turing Instituto, en un Worshop celebrado el 3 y 4 de junio en Londres (Reino Unido).
Como explica Gómez: “Normalmente, los modelos de clasificación actuales se diseñan para optimizar las medidas inmediatas de utilidad para los usuarios. Premian la gratificación instantánea sin tener en cuenta las consecuencias a largo plazo. Como resultado acaban comportando costes inesperados para el bienestar del sistema “. Por ejemplo, en la integridad de la información , el bienestar tiene que ver con el tamaño medio de publicaciones que, a pesar de clasificarse en las primeras posiciones del ranking, comportan desinformación a lo largo del tiempo.
Los modelos de clasificación consecuentes, derivados de la metodología presentada en este trabajo, proporcionan rangos que pueden mitigar la propagación de la desinformación y mejorar la civilidad de los debates en línea sin desviaciones significativas de las clasificaciones proporcionadas por modelos que maximizan las medidas de utilidad inmediatas.
Entonces, el objetivo de los autores ha sido construir modelos de clasificación consecuentes que compensen de manera óptima la fidelidad al modelo de clasificación original maximizando la utilidad inmediata y también el bienestar a largo plazo. Presentan un algoritmo práctico y eficiente para aprender modelos de clasificación consecuentes parametrizados de manera que se aproximan de manera más efectiva a los óptimos. Los investigadores muestran que esta representación simplifica enormemente la construcción de modelos de clasificación consecuentes que compensan la fidelidad a los rankings proporcionados por un modelo que maximiza la utilidad inmediata y el bienestar a largo plazo.
En este trabajo, por primera vez, se presenta una representación que contempla conjuntamente los modelos de clasificación y las dinámicas de los usuarios, utilizando un proceso de control probabilístico denominado Proceso de Decisión de Markov (en inglés, MDP), “una estrategia especialmente bien equipada para caracterizar fielmente el problema mencionado anteriormente “, afirman los autores.
Un marco matemático para la modelización de la toma de decisiones
Un proceso de decisión de Markov proporciona un marco matemático para la modelización de la toma de decisiones en situaciones en que los resultados son parcialmente aleatorios y en parte bajo el control de un decisor. Los autores han mostrado su metodología utilizando datos sintéticos y reales recogidas de Reddit , un sitio web de marcadores sociales y agregador de noticias en el que los usuarios pueden añadir contenidos que quedan más o menos destacados según sean las votaciones de los demás usuarios.
“Nuestros resultados muestran que los modelos de clasificación consecuentes derivados de nuestra metodología proporcionan rangos que pueden mitigar la propagación de la desinformación y mejorar la civilidad de los debates en línea sin desviaciones significativas de las clasificaciones proporcionadas por modelos que maximizan las medidas de utilidad inmediatas “, concluye Gómez.