Una red de 350,000 bots fue descubierta accidentalmente en Twitter. Bot master perforado en geoetiquetas

Según cifras oficiales, la audiencia activa de Twitter supera los 313 millones de personas. Será más exacto decir 313 millones de usuarios, porque no se sabe con certeza qué parte de los usuarios son personas vivas. Alrededor de 500 millones de mensajes se generan diariamente en Twitter, y es muy difícil monitorear y analizar un flujo de información tan enorme para detectar actividades sospechosas.

Durante muchos años, Twitter ha sido objeto de atención de los científicos. Los investigadores examinaron previamente el gráfico de los usuarios de Twitter y trataron de crear un modelo de influencia individual del usuario . Un área de investigación muy prometedora es el análisis del flujo de tweets en tiempo real: para predecir tendencias, sentimientos públicos, resultados electorales , identificar rápidamente eventos importantes,focos de infecciones virales , terremotos y tifones .

Twitter bot es una cuenta de usuario de Twitter que opera con una participación humana mínima o nula. Una botnet es un grupo de cuentas creadas y administradas por una sola persona llamada botmaster . Este es un buen negocio, porque un botmaster puede vender sus servicios para distribuir spam, vender seguidores y manipular la opinión pública. En años anteriores, los investigadores estudiaron en detalle cómo aumenta la influencia del bot (promoción antes del trabajo), cómo penetra en el entorno de Twitter para establecer conexiones con usuarios en vivo y se fusiona con la masa total de usuarios, cómo se usan los bots para propaganda. Los bots de Twitter se comercializan en el mercado negro , al igual que Facebook, YouTube, Gmail, Linkedin y más. Mil cuentas de Twitter (confirmadas por correo, con avatares, un tema y una biografía cambiados, es decir, con todo el "relleno"), el corredor ruso buyaccs.com cuesta $ 60.

¿Para qué son los bots de Twitter?


Correo no deseado . Distribución de una gran cantidad de enlaces publicitarios a otros usuarios, distribución de software malicioso.

Distribución de noticias falsas sobre "tendencias" . Dado que los bots se consideran cuentas en vivo de personas reales que utilizan algoritmos de Twitter, se tratan de la misma manera cuando se calculan temas y hashtags "de tendencia". Esto le permite crear temas de tendencias falsos que originalmente no eran populares en Twitter, pero que caen en la lista de tendencias, y desde allí hasta bloggers reales y los medios.

Manipulación de la opinión pública.. Si la red de bot no se detecta a tiempo, el maestro de bot puede publicar una gran cantidad de mensajes positivos / negativos sobre un tema en particular que distorsionará los resultados de la investigación de opinión pública realizada en Twitter por investigadores, organizaciones comerciales y gubernamentales.

Astroturfing . La tecnología de crear artificialmente opinión pública mediante la publicación de numerosos tweets diseñados como opiniones completamente independientes de las personas, enmascarando al patrocinador del astroturfing.

seguidores falsos . Por una tarifa, miles de bots al mando de un botmaster pueden suscribirse a los tweets de los clientes para dar más importancia a su cuenta debido a la mayor cantidad de suscriptores.

Contaminación API de Streaming de Twitter. Hay sospechas de que los mensajes de bot se pueden organizar de tal manera que caigan en la selección filtrada de la API de Streaming de Twitter, que es utilizada por muchos para la minería de datos, con una probabilidad de hasta 82% en lugar del 1% esperado.

Una red de más de 350,000 bots en Twitter


El propio Twitter y los investigadores independientes han desarrollado una serie de tecnologías avanzadas para determinar los bots en una red social, incluido el uso del aprendizaje automático para calcular la distancia de Levenshtein entre tweets, etc.

La mayoría de los estudios de botnet de Twitter utilizaron conjuntos de datos de muestra compilados al desplazarse aleatoriamente a través de un gráfico o basados ​​en la API de Streaming de Twitter. En ambos casos, tales muestras estarán distorsionadas. En el primer caso, hacia usuarios con muchos amigos / seguidores. En el segundo caso, a favor de usuarios más activos.

En cambio, los investigadores del Departamento de Informática, University College London, compilaron un conjunto de datos de muestra de ID de cuenta de Twitter ( pdf)) Para el estudio, tomaron el 1% de los usuarios de Twitter, es decir, cada centésima parte. Para todos, los perfiles se extrajeron a través de la API, luego se filtraron los perfiles que no están en inglés. Como resultado, quedó una muestra de 6 millones de cuentas en inglés.

Estudiar este conjunto de datos produjo un resultado muy interesante. Las cuentas de esta muestra publicaron 843 millones de tweets, de los cuales aproximadamente 20 millones fueron geoetiquetados. Resultó que la ubicación geográfica de las geoetiquetas generalmente se correlaciona con la densidad de población, a excepción de dos grandes áreas en Europa / África y América del Norte, llena de manera uniforme con un número distinto de cero de tweets geoetiquetados en esta área, incluidos mares, desiertos y áreas de permafrost. La distribución de tweets geoetiquetados en ambos rectángulos es absolutamente uniforme, el 50% de los tweets publicados en América del Norte, el 50% de los tweets en Europa.


El color corresponde al número de tweets. La ubicación geográfica de las etiquetas geográficas en Twitter generalmente se correlaciona con la densidad de población mundial, a excepción de dos grandes áreas rectangulares en Europa / África y América del Norte, uniformemente llenas de un número distinto de cero de tweets, incluidos mares, desiertos y áreas de permafrost.

Todos estos tweets pertenecen a un rango específico de identificadores de Twitter. ID como se muestra en el gráfico.



Esta botnet se llamó Star Wars , ya que los bots publicaron activamente citas de la película Star Wars.



Otra característica de la botnet es la publicación de tweets solo desde teléfonos inteligentes en Windows (o una biblioteca / software para publicación se define como un teléfono inteligente en Windows).



Para explorar más a fondo esta y otras botnets, los investigadores están pidiendo a los usuarios de Twitter que informen sobre los bots detectados a thatisabot.com .

Source: https://habr.com/ru/post/es400951/


All Articles