Méthodologie

ipdex est un index dérivé. Chaque chiffre, nom et classement remonte à une source publique et est reconstruit chaque jour par un pipeline validé — rien n’est édité à la main.

Quatre sources

Les statistiques de délégation des RIR (les cinq registres régionaux) donnent l’allocation officielle de l’espace d’adressage et des ASN par pays, avec les dates d’allocation.

Les tables de routage BGP (APNIC thyme / RouteViews) donnent les préfixes que chaque ASN annonce réellement — la réalité routée, pas seulement l’enregistrement.

PeeringDB donne à chaque réseau son type (FAI, contenu, hébergement, éducation, entreprise) et sa présence de peering.

IPinfo Lite est la colonne vertébrale : IP→pays, IP→ASN, nom d’organisation et domaine, pour IPv4 comme IPv6.

Le pipeline

Chaque exécution est : récupération → validation → diff → dérivation → écriture → rapport. Elle procède par diff d’abord : seules les lignes réellement modifiées sont écrites. Une réécriture quotidienne complète serait un bug, pas une mise à jour.

Les organisations ne sont pas une source — elles sont dérivées, en regroupant les ASN d’un même opérateur. Les classements par pays sont calculés à partir du nombre de préfixes annoncés.

Les contrôles de validation

Avant toute publication, l’exécution doit passer chaque contrôle : un contrôle de dérive des effectifs face à l’instantané précédent, un contrôle des pays inconnus, vingt ancres fixes (par exemple 8.8.8.8 doit résoudre vers AS15169), et un contrôle croisé d’accord de pays entre IPinfo et les données des RIR.

Si un contrôle échoue, l’exécution s’interrompt et la production reste intacte. ipdex ne publie jamais de données partielles ou non validées.

Le contrôle croisé compare le pays d’origine de chaque réseau : IPinfo indique la géolocalisation (où les adresses sont utilisées) tandis que les registres indiquent l’allocation (où elles ont été attribuées) ; les deux divergent par nature — nous mesurons donc l’accord au niveau du réseau, pas par adresse.

Versionnage et fraîcheur

Chaque publication porte une version de données (empreinte de contenu) et une date, affichées dans l’encadré de provenance de chaque page et listées dans le journal des modifications. Vous pouvez toujours voir la fraîcheur des données derrière une page.

Le score d'exposition

Un indice directionnel de 0 à 100 de l'identifiabilité apparente de votre navigateur — NI une probabilité, NI un outil légiste. Formule : score = 100 × (34 × (1 − e^(−Σ min(bits_i, 9) / 34))) / 34, où les bits_i sont des estimations publiées de rareté par signal, chacune plafonnée à 9 bits pour qu'aucun trait ne domine, combinées par une courbe saturante qui modélise la corrélation entre signaux.

Poids (bits, source, date) : rendu canvas 8,5 (Eckersley, EFF Panopticlick, PETS 2010-05) · polices installées 6,5 (idem, 2010-05) · graphismes WebGL 6,0 (Cao et al., NDSS 2017-02) · traitement audio 5,0 (Englehardt & Narayanan, CCS 2016-10) · résolution d'écran 4,0, fuseau horaire 3,0, langues 2,0 (Eckersley 2010-05). Fichier lisible par machine : data/rarity-baselines.json, versionné et daté.

Limites, sans détour : ipdex n'a aucune télémétrie — la Ligne Rouge interdit de mesurer nos visiteurs — chaque référence est donc une recherche publiée externe, datée ; les populations de navigateurs ont évolué depuis. Le score varie selon les navigateurs et les sessions. Les signaux sans référence crédible s'affichent sans pourcentage plutôt qu'avec un chiffre inventé. Tout le calcul s'exécute dans votre navigateur puis est oublié : rien n'est envoyé, stocké, ni mis dans une URL.