
Vous savez ce qu'est le déjà-vu? Ce même «c'était déjà quelque part», mais pas du dernier film sorti au cinéma, mais de ce qui vous arrive.
Par exemple, ne pensiez-vous pas avoir déjà vu un article sur Habré auparavant? Dans la plupart des cas, il n'y a rien de mal à cela. Les articles techniques contiennent souvent des informations publiées précédemment - ils sont révisés, revérifiés et simplement améliorés. Eh bien, les nouvelles - vous avez juste besoin de les accepter.
Voyons donc si c'était vraiment le cas, après avoir mené une petite enquête.
Commencer
Mon déjà-vu a commencé avec cette image. Il convient de noter que je ne lis pas la plupart des messages, mais que je ne regarde que les titres et les images avant la balise <cut /> et faites défiler vers le bas. Par conséquent, le JPG inoffensif a attiré mon attention - il était déjà quelque part récemment.
Fig. 1. KDPV des "Couches linguistiques" (2019-11-20)
De plus, j'ai certainement vu récemment des traductions des articles de Robert C. Martin. Il n'a pas été difficile de les trouver - tous les trois. CAP "Three Paradigms" (2019-11-12) - même image sur hsto.org .
"Et alors?" - Demandez à tous ceux qui ont lu cette phrase. Bien sûr, les auteurs de publications sur le même sujet utilisent souvent des images similaires pour attirer l'attention et en même temps économiser de l'espace sur hsto.org. Pour commencer, je dirai que les auteurs des articles mentionnés sont différents ( Harhencko et Simple219, respectivement). Mais la qualité de la traduction leur semble similaire, ou plutôt, "La traduction est un peu étrange . "
Mais revenons à la troisième post-traduction, que j'ai déjà mentionnée - "Trop propre?" (2019-11-16).
Oui, KDPV est formellement différent - cela a rassuré ma paranoïa et j'ai commencé à lire la traduction. Nous ne nous attarderons pas sur la qualité de la traduction, je note simplement qu’après lecture, j’ai vu la connexion de l’auteur et la paranoïa revenir. Message écrit par Yanaharchencko . Et ce n'est pas l'utilisateur que Harhencko .
Eh bien, maintenant je ne pouvais plus m'arrêter. Je devrais savoir combien de traductions similaires sont publiées sur Habré.
Enquête
La première étape de notre enquête pseudo-détective est de trouver un terrain d'entente. Beaucoup de choses sont publiées sur Habré et il a fallu resserrer le cercle des suspects. Tout commence par "Bonjour, Habr! J'attire votre attention sur la traduction de l'article" - un début standard. Certes, il est remplacé par un OVNI qui libère des messages du Sandbox. Arrêtez-vous, bac à sable - à partir de là, les trois postes sont à partir de là. En fait, seulement deux sur trois, cependant, je l'ai remarqué plus tard et ma surveillance initiale n'a pas affecté l'enquête. Et tous sont des traductions. Pour commencer, cela nous suffit.
Au total, au moment de la première recherche (2019-11-20), j'ai trouvé 37 messages similaires jusqu'au 2019-07-15 inclus. 14 d'entre eux ont été publiés en novembre. Peut-être que j'ai raté certains des mêmes pour cette période - la recherche a été effectuée manuellement, car en tant que véritable détective, je ne fais confiance à personne, pas même à un ordinateur. Il convient de noter qu'au moment de la rédaction de cette partie du texte (2019-11-23), 5 autres traductions du bac à sable ont été ajoutées. Dans le même temps, l' un d'eux a été envoyé dans l'espace lointain des inconvénients et caché par l'auteur.
Nous avons donc 41 + 1 messages - ce que nous savons d'eux et de leurs auteurs. 10 auteurs ont plus d'un poste, maximum - 7 pièces d'un. Nous considérerons que ces utilisateurs sont des membres vraiment actifs de la communauté Habra. 12 des 32 autres ont été enregistrés sur le site jusqu'en 2019, et certains d'entre eux en 2012. Deux autres utilisateurs ont été enregistrés 119 et 109 jours avant de publier leurs premiers messages.
Après un filtrage aussi grossier, 18 ont été enregistrés. Voyons les statistiques de leurs traductions. Les notes varient de -19 pour "Ces 10 chaînes en direct vous permettront de mieux programmer" (et il a également obtenu le plus de contre-24) à +33 pour le Too clean déjà mentionné ? (avec un maximum de 46 plus). Le poste des 10 meilleures pratiques pour la conception de bases de données a été caché jusqu'à ce que des statistiques soient collectées du 23/11/2019 (mais j'ai vu beaucoup d'inconvénients là-bas, même si je n'ai pas à faire confiance).
Les statistiques des auteurs sont légèrement différentes - le plus grand nombre de votes pour le karma a été reçu par l'utilisateur yanaharchencko - 21 (ce qui n'a pas aidé le karma total en 6.2), et la note de karmo la plus basse pour evelina_n était de 0 karma avec 12 votes. Seul un des utilisateurs a commenté divers articles sur Habré et nous allons donc également l'exclure de la considération. Cinq ont commenté leurs messages et 12 autres n'ont pas écrit un seul commentaire.
Mais quelque chose devrait être commun à ces utilisateurs? Trouver la réponse n'a pas été difficile. Il suffisait juste d'aller dans l'onglet abonné à / abonnés. Et puis une réponse m'attendait pour ma paranoïa - il y avait quelque chose en commun entre eux. Ils sont tous abonnés les uns aux autres. Eh bien, c'est tout, 11 comptes. Examinons de plus près.
Fig. 2. Souscription mutuelle des comptes concernés du 2019-11-20 au 2019-11-23
Même animation GIF (186 Ko)Fig. S2. Abonnement mutuel des comptes concernés du 2019-11-20 au 2019-11-23
Est-ce suspect? Surtout quand on considère qu'ils n'ont pratiquement aucun abonnement à d'autres comptes. Un lecteur attentif peut remarquer qu'en plus des 11 utilisateurs que j'ai mentionnés plus tôt (et qui sont répertoriés sous le prochain spoiler), il y a un douzième dans les données - Ramir23 - le seul qui a écrit le post original Création d'un simple jeu de clicker à partir de zéro . Ce qu'il fait ici est une question distincte.
Liste des signatairesTab. S1. Liste des comptes suspects, triés par date d'invitation à Habr
* Pour l'utilisateur Emil-8 , les données sont présentées aux 23/11/2019 et -24 dans le cadre de la publication d'un nouvel article.
Tous les comptes sont enregistrés à partir du 2019-09-20 et sont enregistrés à partir du 2019-10-04. Entre l'enregistrement et la publication a pris de 1 à 14 jours à l'exception de
borisname (49 jours).
Pendant que je réfléchissais et faisais un beau plan d'abonnement, le compte Emil-8 a publié une nouvelle traduction Comment rendre votre HTML réactif en ajoutant une ligne de code CSS du 23/11/2019 à un sujet complètement différent et plus du bac à sable. Plus tôt, une traduction d'une autre version du même texte de l'auteur original avait déjà été publiée sur Habr. Nous faisons du HTML adaptatif, en ajoutant une ligne au CSS 2017-12-16.
Que font les comptes sans méfiance?
Ainsi, les originaux sont tirés de:
Parmi les originaux, 11 sont en anglais, 1 en allemand. 3 articles ont été écrits par un auteur et 2 autres par l'autre, le reste par des auteurs différents.
Parlons du sujet, et dans le cas de Habr, des hubs. Ainsi, sur 11 traductions disponibles à la lecture, les hubs suivants sont présentés:
- Programmation 6x;
- 2x Code parfait , conception Web , CSS , HTML et carrière informatique ;
- 1x Programmation fonctionnelle , Histoire de l'informatique , Apprentissage des langues , Salle de lecture , Normes informatiques , Développement pour iOS , Électronique pour débutants , Développement de sites Web , Conception , Haute performance , Java , Interfaces , Localisation de langue , Marketing Internet et Marketing de contenu ;
Les utilisateurs de Habr ont signalé des inexactitudes ou des erreurs de traduction dans 7 articles sur 10 commentés.
En plus de publier une traduction de chacun des 11 comptes, les utilisateurs examinés ajoutent également les messages de leurs collègues à leurs favoris - 24 fois (maximum 5 favoris par compte).
Sur les 12 comptes, 5 sont abonnés à 26 sociétés différentes représentées sur Habré - un total de 45 abonnements, 2 sociétés se réunissent toutes 5 fois et 3 autres 3 fois.
Quelqu'un d'autre?
Jusqu'à présent, seuls les comptes mentionnés se sont produits un nombre important de fois dans les abonnements. Y en a-t-il d'autres là-bas? Il y en a trois. Deux en lecture seule (enregistrement 2019-11-09 et -22) et un à part entière (enregistrement 2019-11-07, invitation de UFO 2019-11-17). Ce dernier est probablement sorti du bac à sable et a caché le message plus tard, car il n'y a actuellement aucune information sur le message.
Fig. 3. Abonnement des comptes concernés au 2019-11-24, complété par des comptes ayant un comportement similaire
Une observation intéressante, Alsou17 immédiatement après l'inscription a ajouté bar_nat aux abonnements et n'a plus montré d'activité (au 2019-11-24). Les abonnements ays_aad et Mercerexy n'ont pas changé depuis le début de l'observation (la dernière activité est le 2019-11-20 et -18, respectivement).
À quelle fréquence puis-je voir un abonnement à un compte en lecture seule fraîchement enregistré? Je laisserai peut-être cette question sans réponse.
Au lieu d'une conclusion
"Que faire de ces informations?" demandez-vous, après avoir lu jusqu'à la fin? La question est sans aucun doute intéressante.
D'une part, ce ne sont que 11 comptes (et 3 autres non moins suspects), dont la contribution aux Habr - "traductions par Google Translate". 6 d'entre eux ont reçu un karma supérieur à 5 et peuvent affecter la notation des postes d'autres personnes et le karma des comptes.
En revanche, 6 des comptes sont apparus ces derniers jours et on ne sait pas si cette répartition des «utilisateurs» interconnectés se poursuivra.
Mais encore, pourquoi font-ils cela? ..
Sur cette note vague dans l'esprit de n'importe quel film de détective standard directement du film, je terminerai. Merci de votre attention!
"Si vous êtes paranoïaque, cela ne signifie pas que vous n'êtes pas surveillé." Harold Finch
Mise à jour: Dans les commentaires, Exosphere a parlé de l'enquête des modérateurs concernant ce problème.
Citation d'un commentaireNous étions également intéressés par cette histoire et, bien sûr, nous avons mené une enquête, mais beaucoup plus primitive que la vôtre, pour une seule raison - nous avons l'IP de tous ces utilisateurs. Général, oui.
Mais tout s'est avéré être prosaïque (et ce n'est pas le premier cas) - l'adresse IP appartient à l'un des États concernés. Universités russes. Autrement dit, les gars ont eu la tâche de faire des traductions techniques afin d'obtenir le test / examen. Il y a une invitation - il y a probablement une peste dans le dossier. Et comme les traductions sont plutôt bonnes et que le public les a acceptées positivement, pourquoi ne pas aider les bons? Espérons que les habraraautors les cultiveront, ou du moins de bons lecteurs :-)
Update-2: Simple219 a confirmé la raison de leur activité. Par conséquent, nous leur souhaitons d'atteindre leur objectif.
Citation d'un commentaireUn très «bon» professeur nous a donné la possibilité d'obtenir automatiquement des crédits si l'article était publié et ajouté.) Merci d'avoir posté nos articles!
PS Si vous trouvez des fautes de frappe ou des erreurs dans le texte, faites-le moi savoir. Cela peut être fait en mettant en surbrillance une partie du texte et en appuyant sur " Ctrl / ⌘ + Entrée ", si vous avez Ctrl / ⌘, ou par le biais de messages privés . Si les deux options ne sont pas disponibles, notez les erreurs dans les commentaires. Je vous remercie!
PPS Peut-être serez-vous également intéressé par mes autres études sur Habr ou vous souhaitez suggérer votre sujet pour la prochaine publication, ou peut-être même une nouvelle série de publications.
Où trouver la liste et comment faire une offreToutes les informations peuvent être trouvées dans un référentiel spécial de détective Habra . Vous pouvez y découvrir quelles propositions ont déjà été exprimées et ce qui est déjà en cours.
De plus, vous pouvez me mentionner (en écrivant VaskivskyiYe ) dans les commentaires sur une publication que vous trouvez intéressante pour la recherche ou l'analyse. Merci à Lolohaev pour cette idée.