Notre système est câblé pour identifier les sous-domaines de spam dès le début, de sorte qu’ils n’entrent même pas dans notre base de données en premier lieu.
Par exemple, si un site web comporte des tonnes de sous-domaines, nous ne téléchargerons que la partie supérieure de la liste et nous arrêterons dès que la qualité dépassera un certain seuil.
Donc, en gros, nous n’avons pas besoin de nettoyer notre base de données des réseaux de spam parce que nous ne les indexons même pas au début.