La revista profesional sobre tecnología y transformación digital
Haya Pablo sum

Pablo Haya Coll

Director del área de Social Business Analytics en el Instituto de Ingeniería del Conocimiento (IIC).

Tecnología para combatir las fake news

¿Cómo se difunden las noticias falsas?

Técnicas de Inteligencia Artificial como el aprendizaje automático permiten aproximarse a la detección automática de fake news que se generan artificialmente y se difunden con plataformas de bots cada vez más sofisticadas. Como hemos podido apreciar nuevamente y de forma especial durante la reciente crisis sanitaria que hemos sufrido, las noticias falsas cobran actualmente protagonismo en las redes sociales y tienen un impacto destacable en la opinión pública y el terreno político.

Las noticias falsas, fake news en inglés, se definen como aquella información que ha sido publicada con la intención de engañar y confundir al lector. Los medios que fabrican estas noticias imitan la forma de publicación de los medios fiables, ignorando los procesos de verificación o directamente adulterando intencionalmente el contenido [1]. De esta manera, pretenden hacer pasar una mentira, o en el mejor de los casos una opinión, por un hecho objetivo. Existen múltiples formas de manipular una noticia que van más allá de la pura inventiva, pudiendo hacer referencia a hechos verosímiles para pasar desapercibidas. Si a esto se le añade la subjetividad propia de cualquier noticia, así como incorrecciones accidentales, podemos entrever la dificultad que supone comprobar su veracidad.

Fake news en política

En este artículo nos centraremos en su impacto en la política. Las noticias falsas suponen una amenaza para las democracias de países occidentales, al atentar contra los valores democráticos y la convivencia entre los ciudadanos. El pluralismo informativo se ve seriamente dañado cuando las campañas de desinformación confunden a la opinión pública, siendo difícil discernir entre qué es cierto o falso, y copan las conversaciones dificultando un debate informado. Actualmente, ya se ha confirmado fehacientemente el uso masivo de noticias falsas junto con el perfilado selectivo de usuarios, con el objetivo de influir en la intención de voto. Este fue el caso de la empresa Cambridge Analytics, que intervino en múltiples elecciones como las últimas presidenciales americanas.

El pluralismo informativo se ve seriamente dañado cuando las campañas de desinformación confunden a la opinión pública

Las noticias falsas aprovechan sesgos cognitivos de los seres humanos para que, paradójicamente, nos resulten más atractivas que las noticias verdaderas [2]. Esta superior efectividad se respalda, principalmente, en dos aspectos que en realidad son las dos caras de una misma moneda. Por un lado, tendemos a filtrar la información que nos llega quedándonos con aquella que refuerza nuestras creencias previas y descartamos aquella que nos desafía. Esto se conoce como sesgo confirmatorio. Por otro lado, tendemos a buscar argumentos y conclusiones que concuerdan con nuestras creencias, en vez de buscar argumentos que las contradicen. Esto se denomina razonamiento motivado.

Redes sociales y emociones

Aunque se pueden encontrar ejemplos históricos de fake news, ha sido en la actualidad cuando han cobrado mayor protagonismo, gracias a las redes sociales. Estas plataformas actúan como amplificadores, multiplicando el impacto de una noticia falsa, gracias a la participación de los propios usuarios en la viralización de la misma. Esta se ve también favorecida por la propia naturaleza de los algoritmos que regulan la difusión de información dentro de estas plataformas. Como nuestros valores y convicciones se ven fuertemente influenciados por los grupos a los que pertenecemos, las noticias falsas se difunden más en las redes sociales gracias a que refuerzan la identidad de nuestro grupo frente al resto.

Con todo a su favor, no nos deben extrañar los resultados publicados en la revista Science en 2018, por los que los investigadores detectaron que las noticias falsas llegan a muchas más personas que las noticias veraces [3]. El 1% de las noticias falsas más difundidas llegan a entre 1.000 y 100.000 personas, mientras que las noticias veraces rara vez llegan a más de 1.000 personas. Además de llegar más lejos, también se comprobó que las noticias falsas se difundían más deprisa. Estos efectos se repiten independientemente de la temática, aunque fue en las noticias de corte político donde eran más pronunciados. En consonancia con lo explicado más arriba, las noticias falsas se basan en historias que apelaban a las emociones y se presentaban como noticias más novedosas e impactantes que las noticias verdaderas.

Detección automática de bots

Al atractivo de las noticias falsas y a las facilidades que aportan las plataformas sociales para viralizarlas se une el creciente aumento de contenido generado automáticamente por bots sociales. Se ha identificado que los bots juegan un papel importante como fuentes de difusión de información de baja calidad, y que amplifican las noticias falsas en los momentos iniciales, antes de que se viralicen, dirigiéndose a los usuarios con más seguidores y provocando que difundan estos contenidos [4].

Estos bots tratan de confundir a los usuarios emulando el comportamiento humano y demostrando ser eficientes en la difusión de propaganda y mensajes electorales durante las elecciones en distintos países. Usos habituales son la promoción artificial de hashtags, los likes a contenidos publicitados por las cuentas oficiales de un partido o el incremento de seguidores de los candidatos. Otros contextos destacados donde se utilizan son las campañas de desinformación sobre salud pública, la difusión de rumores y teorías conspiratorias, el reclutamiento y propaganda terrorista o la manipulación de mercados financieros.

Una primera aproximación para la detección automática de bots sociales se basa en el aprendizaje automático y en el análisis de redes sociales [5]. Las técnicas de aprendizaje automático precisan conocer previamente un conjunto de ejemplos válidos que sean lo más representativos de la variabilidad de casos posibles. A partir de este conjunto finito de ejemplos, se construye automáticamente un modelo estadístico que infiera el resultado correcto para un nuevo caso.

Las noticias falsas se difunden más en las redes sociales gracias a que refuerzan la identidad de nuestro grupo frente al resto

Llevándolo al terreno de la detección de bots, se recolectan un número elevado de cuentas verificadas que incluyen tanto a éstos como a humanos. Cada cuenta se perfila a su vez a partir de miles de características extraídas de sus comentarios y metadatos, tales como los seguidores y perfiles seguidos, los patrones temporales de actividad o el contenido y sentimiento de los comentarios.

Estas características se eligen de tal manera que los bots y los humanos presenten combinaciones de valores diferenciales y que pueda descubrir el modelo para distinguirlos, por ejemplo, al publicar con una frecuencia y una temática distinta. La dificultad surge porque los bots sociales evolucionan constantemente, de manera que cada vez emulan más fidedignamente el compartimiento en redes sociales de un humano. Esto obliga a reconstruir el modelo con nuevos ejemplos, a medida que se descubren nuevos bots más sofisticados.

Otra aproximación se basa en estudiar las redes que forman las plataformas de bots. En este caso se va más allá de las características individuales de cada usuario y se tiene en cuenta cómo se relacionan y cómo se comportan cuando comparten contenidos similares. Esta aproximación permite además detectar acciones coordinadas, que de otra manera podría confundirse con una acción espontánea.

Los bots juegan un papel importante como fuentes de difusión de información de baja calidad y amplifican las noticias falsas en los momentos iniciales

El elemento más novedoso a tener en cuenta es la generación automática de noticias falsas mediante tecnologías de generación de lenguaje natural (Natural Language Generation, NLG) dando lugar a textos artificiales que parecen escritos por un humano.

Enfrentarse a un fenómeno tan complejo requiere incorporar, más allá de contramedidas tecnológicas, experiencia y conocimiento de múltiples disciplinas como la epidemiología, la psicología, la estadística, la pedagogía o las ciencias de la información.

También existen incentivos comerciales (se añaden a los ya mencionados de tipo político) que son causa de la proliferación de portales de información que publican este tipo de noticias de baja calidad y baratas de producir para atraer usuarios y generar ingresos publicitarios. Ahora bien, bajo la premisa de que los bots no gozan del derecho a la libertad de expresión, el uso de la tecnología para la identificación temprana de bots maliciosos, así como la detección de noticias creadas artificialmente, se muestran como medidas claves para frenar este fenómeno.

[1] Lazer, D. et al. The science of fake news. Science 359, 1094–1096 (2018).
[2] Nogués, G. Pensar con Otros: Una guía de supervivencia en tiempos de posverdad. El Gato y La Caja (2019).
[3] Vosoughi, S., Roy, D. & Aral, S. The spread of true and false news online. Science 359, 1146–1151 (2018).
[4] Shao, C., Ciampaglia, G. L., Varol, O., Yang, K. C., Flammini, A., & Menczer, F. (2018). The spread of low-credibility content by social bots. Nature communications, 9(1), 1-9.
[5] Ferrara, E., Varol, O., Davis, C., Menczer, F. & Flammini, A. The rise of social bots. Comm. ACM 59, 96–104 (2016).

 

Textos ficticios

Recientemente, se han desarrollado modelos de aprendizaje profundo muy sofisticados que permiten generar textos ficticios con un nivel de calidad similar a los escritos por un humano -como la mencionada generación automática de noticias falsas mediante tecnologías de generación de lenguaje natural (Natural Language Generation, NLG)-. Con estos modelos, se puede crear un número ilimitado de noticias falsas para una temática concreta, lo que abre una nueva línea de investigación en la detección, no tanto de la veracidad, sino de la autoría del artículo, de manera que se puedan descartar rápidamente aquellas noticias generadas artificialmente.

Comparte