En juin, nous avons fait écho à une nouvelle qui avait sauté aux gros titres en s'assurant que « 16 000 millions de mots de passe » avaient été exposés dans ce qui a été décrit comme une « filtration historique ». Mais Troy Hunt, célèbre pour être le créateur de Ai-je été pwned (Le site Web de référence lors de la vérification si nos informations d'identification ont été filtrées), a analysé un échantillon important de ce matériel pour séparer les actes de l'hyperbole.
Sa conclusion: L'impact réel est beaucoup plus petit que le chiffre qui a été diffusé et, en outre, ce n'est pas un seul espace, mais sur les compilations de références précédentes et redondantes.
D'où vient le chef des « 16 000 millions » de «
La dynamique est connue: les médias rivalisent pour présenter « la plus grande filtration jamais vue », à la recherche d'un chiffre qui dépasse le précédent. Dans ce cas, l'intimidateur (qui avait fait écho même les sociétés de cybersécurité) a pris du traction et à l'époque a même conduit à des recherches pour les recherches pour Ai-je été pwnedmalgré le fait que HIBP n'avait pas encore facturé de données de cette supposée «mégafiltration».
Le fait est qu'il n'y a pas de source d'exposition unique: « Bob », un chercheur renommé, a expliqué à chasser que ce qui a circulé était différents ensembles de données d'infosteas qui avaient été rendus publics tout au long de l'année, parfois à la retraite déjà souvent repapités.
Le Journaux des voleurs La machine à machine est générée lorsqu'un appareil engagé vole les informations d'identification stockées ou entrées dans le navigateur; Au fil du temps, ils sont regroupés et redistribués. Le présenter comme « une filtration » est donc trompeur.
Ce que HIBP a analysé: taille réelle, structure et purification
Hunt a reçu des fichiers « Bob » 10 JSON qui ont ajouté 775 Go et 2,7 milliards de lignes de données. Un contrôle rapide a montré que plus de 90% des adresses étaient déjà en HIBP et, dans le cas des anciens journaux de voleurs, les mêmes domaines coïncidaient. C'est-à-dire beaucoup de matériel précédemment vu.
Hunt résume trois raisons pour lesquelles les nombres « de couverture » sont systématiquement infectés:
- Duplication entre les fichiers (les mêmes données apparaissent dans plusieurs packages).
- Duplication dans le même fichier (répétitions brutes).
- Métrique trompeuse: une « ligne » ne représente pas « une personne »; Une seule victime peut générer des dizaines ou des centaines de lignes (× compte de service).
En appliquant son processus de nettoyage et d'analyse, sur ces 2,7 milliards de lignes, 325 millions de billets uniques dans les journaux de voleurs ont été extraits (lignes valides avec web + e-mail + mot de passe). En consolidant les individus, le total était de 109 millions d'adresses de messagerie uniques, qui sont celles qui ont fini par intégrer dans HIBP.
En d'autres termes: 2 700 millions de « rangées » ont été transmises à 109 millions de « personnes »: une réduction de 96%.
Cependant, l'échantillon donné par « Bob » ne représente qu'une septième partie du nombre de gros titres, se pourrait-il que le reste des informations d'identification ne montrent pas de tels chiffres gonflés? La chasse est claire: vous ne pouvez pas savoir avec certitude. Mais parie que la chute serait encore plus grande.
Les chiffres qui comptent (et ce qu'ils signifient)
- De nouvelles adresses de messagerie uniques: malgré la grande redondance, il est vrai que 4,4 millions de directions ont finalement été incorporées qui n'étaient pas auparavant dans HIBP. C'est pertinent … mais ne justifie pas « le plus grand de l'histoire ».
- Mots de passe uniques: 231 millions de mots de passe uniques ont été identifiés dans des entrées valides; 96% était déjà connu par HIBP et son service Mots de passe pwned (avec des dénombrements de prévalence mis à jour). Ils sont consultables sur le Web et l'API HIBP.
Pourquoi devez-vous prendre le fer de la question
- Ce n'est pas un seul incident: présenter un agrégat de journaux de logiciels malveillants tels que « un écart d'enregistrement » pervertit le concept de « GAP » (ce qui implique une source spécifique et un événement).
- La métrique basée sur les lignes Infla: parler des « rangs » ou des « titres de compétences » dans la brume brute des dégâts. Ce qui compte est unique et les personnes d'identification valides après déduction. Dans le corpus analysé, l'inflation était de 96%.
- Le matériel n'est pas « frais »: une grande partie de ces informations circulait, donc le risque n'est pas nouveau dans ce qui est déjà connu.
Que devez-vous faire si vous inquiétez votre sécurité?
- Vérifiez votre e-mail dans HIBP et activez les alertes.
- Modifier les mots de passe où vous avez réutilisé ou où le gestionnaire indique le risque. Utilisez des générateurs aléatoires et stockés dans Password Manager.
- Activa MFA / 2FA dans les services critiques: courrier, banque, réseaux sociaux, travail. Bien qu'un mot de passe soit filtré, le deuxième facteur bloque la plupart des abus.
- Nettoyez et mettez à jour votre équipement: des journaux de voleurs existent car les logiciels malveillants ont volé vos informations d'identification. Pass antimalware, Système de mise à jour et navigateur, vérifiez les extensions suspectes.