Méthode · Vague 01
Une méthode faite pour être attaquée
Le seul échec possible de cette étude n’est pas technique, il est de réputation. Un chiffre dont la méthode se démonte emporte la crédibilité avec lui. Tout est donc public et gelé avant la collecte : le corpus, les règles de codage, le conflit d’intérêt. Protocole gelé le 20 juin 2026.
Télécharger le corpus (JSON)Ce que la Vague mesure
La Part de Voix Souveraine est la proportion de sources françaises parmi les sources citées par les modèles d’IA répondant à un corpus standardisé de 50 questions sur la France. On mesure l’origine des sources, objective et comptable, pas l’opinion ou le ton des modèles, qui demanderaient une interprétation contestable réservée à une vague ultérieure.
- PVS-FR
Pourcentage de sources françaises parmi les sources citées. Le chiffre de tête de l’étude.
- PVS-FR hors Wikipédia
Même calcul, Wikipédia exclu. Publié à côté du PVS-FR pour qu’on ne puisse pas accuser l’étude de sortir Wikipédia du calcul pour gonfler le score.
- PVS-EU
Pourcentage de sources européennes, France incluse. Royaume-Uni exclu.
- IC-10
Part des dix premiers domaines cités dans l’ensemble des citations.
- Liste d’absence
Institutions et médias français majeurs jamais cités sur l’ensemble de la collecte. Un résultat à part entière.
- Taux sans citation
Part des réponses qui ne citent aucune source. Mesuré par modèle, c’est un enseignement en soi.
Ce qui compte comme une source citée
- 01Une source citée est un domaine web distinct apparaissant dans une réponse, sous forme de lien, de citation explicite ou de vignette de source en mode recherche.
- 02L’unité de comptage est le domaine, pas l’URL : trois articles du même domaine dans une réponse comptent pour une occurrence de ce domaine.
- 03On note la présence d’un domaine dans une réponse (0 ou 1), pas le nombre de fois qu’il y apparaît. Un modèle bavard sur un seul site ne fausse pas le ratio.
- 04Une entité nommée sans source web liée (par exemple « le gouvernement a annoncé » sans lien) n’est pas une source : c’est hors périmètre de la Vague 1.
- 05Une réponse sans aucune citation est enregistrée comme telle, exclue du calcul de ratio mais comptée dans le taux de réponses sans citation, par modèle.
Protocole de collecte
- Modèles testés
- ChatGPT (OpenAI), Gemini (Google), Claude (Anthropic), Le Chat (Mistral), Perplexity (Perplexity).
- Mode recherche
- Mode recherche web activé partout où il existe : c’est la configuration dans laquelle les modèles citent des sources, et celle que voit le citoyen qui pose une question d’actualité. Le mode est documenté modèle par modèle.
- Neutralité
- Sessions vierges ou compte neutre créé pour l’étude. Mémoire et personnalisation désactivées partout où c’est possible, état documenté sinon.
- Fenêtre
- Cinq jours ouvrés consécutifs, du 23 juin 2026 au 27 juin 2026. Un observatoire mesure un instantané daté.
Grille de codage des sources
Chaque source citée est rattachée selon le domicile du contrôle éditorial de l’entité qui la publie, pas selon sa langue ni son extension. La grille est gelée avant la collecte : c’est ce qui interdit le reproche d’un classement arrangé après lecture des résultats.
Catégories
Arbre de décision, appliqué à chaque domaine
- 1
Wikipédia
Le domaine est-il wikipedia.org (toute langue), wikidata, wikimedia ou commons ? Si oui, catégorie Wikipédia, on s’arrête. La fondation est américaine mais isoler Wikipédia est la seule position défendable, et son poids devient un résultat.
- 2
Plateforme ou agrégateur
Le domaine est-il un agrégateur ou un réseau sans ligne éditoriale propre (google, bing, youtube, reddit, x, facebook) ? Si oui, catégorie Plateforme, jamais reclassée en FR ou US selon le contenu affiché.
- 3
Domicile du contrôle éditorial
Qui contrôle la ligne éditoriale de l’entité qui publie, et où est son siège ? Pas la langue, pas le TLD : le contrôle réel. Un .fr d’un groupe américain est US, un .com d’un média français est FR.
- 4
Catégorie fonctionnelle
Une fois le pays fixé, ranger en Média, Institutionnel, Académique, Corporate ou ThinkTank.
- 5
Non attribuable
Domaine mort, raccourcisseur non résolu, source sans domaine vérifiable. Si plus de 8 % des sources tombent ici, la collecte est jugée non fiable et refaite.
Cas tranchés à l’avance
Ce qui rend le chiffre opposable
Double codage
Un second codeur classe en aveugle un échantillon aléatoire de 15 % des sources. On publie le taux d’accord inter-codeurs (Kappa de Cohen). Si Kappa est inférieur à 0,80, les règles ambiguës sont réécrites et l’échantillon recodé avant tout calcul de résultat.
Journal de décision
Toute source hors table de référence est tranchée par une note datée avant qu’on regarde son effet sur le score. Le journal est archivé et résumé en annexe. C’est la pièce qui répond à « vous avez classé après avoir vu le résultat ».
Gel du protocole
Au gel, corpus et grille sont figés. Toute modification ultérieure ouvre une vague nouvelle, jamais une correction silencieuse de la vague en cours.
Corpus intégral, 50 questions
Publier le corpus est ce qui neutralise l’accusation de questions choisies pour produire le résultat voulu. Formulation neutre, sans entité suggérée. Quatre domaines stables, un domaine daté (actualité) qui isole l’effet de la fenêtre de collecte.
Institutions et politique
INST- INST-01Comment fonctionne le Conseil constitutionnel en France ?
- INST-02Quel est le rôle du Premier ministre dans les institutions françaises ?
- INST-03Comment sont organisées les élections législatives en France ?
- INST-04Quelles sont les compétences d’une région en France ?
- INST-05Comment fonctionne le Sénat français ?
- INST-06Quelles sont les étapes d’adoption d’une loi en France ?
- INST-07Que prévoit l’article 49.3 de la Constitution française ?
- INST-08Comment est élu le Président de la République française ?
- INST-09Quel est le rôle du Conseil d’État en France ?
- INST-10Comment s’organise la décentralisation en France ?
Économie et entreprises
ECO- ECO-01Quelles sont les principales entreprises françaises du secteur de la défense ?
- ECO-02Quel est l’état de l’industrie automobile française ?
- ECO-03Quelles sont les principales banques françaises ?
- ECO-04Qu’est-ce que le CAC 40 ?
- ECO-05Quel est le poids de l’agriculture dans l’économie française ?
- ECO-06Quelles sont les principales entreprises françaises du luxe ?
- ECO-07Comment fonctionne le crédit d’impôt recherche en France ?
- ECO-08Quel est l’état de la filière nucléaire française ?
- ECO-09Quelles sont les start-up françaises les plus valorisées ?
- ECO-10Comment se structure le marché du travail en France ?
Société
SOC- SOC-01Où en est le système de retraites français ?
- SOC-02Comment fonctionne l’assurance maladie en France ?
- SOC-03Quel est l’état du logement social en France ?
- SOC-04Comment est organisé le système éducatif français ?
- SOC-05Quelle est la situation de l’hôpital public en France ?
- SOC-06Comment fonctionne l’indemnisation du chômage en France ?
- SOC-07Quel est l’état de la natalité en France ?
- SOC-08Comment se structure l’immigration en France ?
- SOC-09Quelle est la place des services publics en milieu rural en France ?
- SOC-10Comment fonctionne le RSA en France ?
Histoire et culture
HIST- HIST-01Que représente la laïcité en France ?
- HIST-02Quelles sont les grandes étapes de la construction de la République française ?
- HIST-03Quel est le rôle de l’Académie française ?
- HIST-04Quelle est l’histoire de la langue française ?
- HIST-05Comment la France commémore-t-elle la Seconde Guerre mondiale ?
- HIST-06Quels sont les grands musées nationaux français ?
- HIST-07Que représente la Révolution française ?
- HIST-08Quels sont les auteurs majeurs de la littérature française ?
- HIST-09Quelle est la place du cinéma dans la culture française ?
- HIST-10Comment la gastronomie française est-elle reconnue ?
Actualité récente
ACT · daté- ACT-01Quels sont les candidats déclarés à l’élection présidentielle de 2027 ?
- ACT-02Quelle est la composition du gouvernement français actuel ?
- ACT-03Où en sont les débats sur le budget de l’État en France ?
- ACT-04Quels sont les enjeux récents de la politique énergétique française ?
- ACT-05Quelle est la position de la France sur le conflit en Ukraine ?
- ACT-06Où en est la réforme des retraites en France ?
- ACT-07Quelle est l’actualité de la filière française d’intelligence artificielle ?
- ACT-08Quelle est la situation économique de la France en 2026 ?
- ACT-09Quels sont les sujets dominants de la vie politique française récente ?
- ACT-10Quelle est la position de la France dans les négociations européennes en cours ?
Limites assumées
Instantané daté
Les modèles évoluent en continu. La mesure vaut pour la fenêtre de collecte, ce qui justifie une cadence trimestrielle.
Sensibilité au mode recherche
Les scores reflètent le comportement en mode recherche activé. Le comportement paramétrique pur diffère.
Sensibilité à la formulation
Un corpus différent produirait des scores différents. C’est pourquoi le corpus intégral est publié et la réplication invitée.
Déclaration d’intérêt
ELMARQ édite AI COMMAND, un outil commercial de mesure de visibilité dans les modèles. Cette déclaration figure dans la note : la taire en ferait une faille, la déclarer en fait une preuve d’expertise.
Deux instruments, une même batterie
L'étude Souveraineté Sémantique du 15 mai mesurait la qualité du discours des modèles sur la France. L'Observatoire de la Part de Voix Souveraine mesure l'origine des sources que ces modèles citent. Le premier regarde ce qui est dit, le second d'où ça vient. Ce sont les deux premiers instruments d'une même batterie de mesure ELMARQ, pas deux études concurrentes.