La scène est connue. Un DirCom d’ETI industrielle reçoit en avril 2026 trois plaquettes commerciales sur le même sujet : le GEO, Generative Engine Optimization. La première vient d’une agence SEO historique qui a ajouté trois slides à son offre. La deuxième vient d’une agence RP parisienne qui annonce une offre dédiée à la visibilité des marques sur les IA génératives. La troisième vient d’un freelance qui promet la première position sur ChatGPT en quinze jours. Les trois prix sont compatibles avec son budget. Les trois discours sont cohérents. Aucun des trois ne propose de méthode pour mesurer le résultat. Six mois plus tard, l’ETI a publié quarante articles, le rapport mensuel parle de « croissance de la citabilité », et personne dans le comité de direction n’est capable de dire si la marque est citée par Claude quand un acheteur tape la requête métier critique.
Ce scénario n’est pas hypothétique. Il est en train de se produire dans les ETI françaises au moment où le GEO bascule de registre. Jusqu’en 2025, le sujet relevait de la veille technologique, traité en marge par les équipes SEO. En mai 2026, il devient une ligne budgétaire réelle dans les plans de communication. Selon Goodfirms, 65 % des professionnels du marketing citent les changements IA dans la recherche comme leur défi numéro un, et 43 % implémentent activement des stratégies GEO (Goodfirms, 2026). L’offre Matr·IA·chka lancée par Matriochka Influences en avril 2026 (CB News, 28 avril 2026) confirme l’entrée des agences RP établies dans ce segment. Le marché se densifie en quelques mois. La fenêtre pour se structurer avant que le bruit ne devienne assourdissant est ouverte. Elle ne le sera pas indéfiniment.
Le problème pour le DirCom ETI sans équipe dédiée n’est plus de savoir s’il faut faire du GEO. Il est de savoir comment auditer un prestataire GEO sans se faire vendre une prestation de production éditoriale repeinte aux couleurs de l’IA. Sans grille de qualification, le choix se fait à la confiance. Or à la confiance, en mai 2026, c’est exactement ce que veulent les vendeurs opportunistes.
Pourquoi le marché GEO ressemble à un marché de l’architecture sans permis de construire
Choisir une agence GEO sans grille d’évaluation, c’est comme choisir un architecte sur la beauté de sa plaquette. Le bâtiment peut quand même s’effondrer. Personne ne demande à un architecte combien de murs porteurs il a déjà calculés. On regarde son book. C’est le mécanisme exact du marché GEO en 2026 : on regarde le book, on signe, et on découvre dans douze mois que la marque n’apparaît dans aucune réponse générative sur ses requêtes métier.
Le constat terrain ELMARQ est sans appel. Sur les cinq derniers entretiens menés en mars et avril 2026 avec des DirCom ETI ayant déjà testé un prestataire GEO, quatre ne disposaient d’aucun rapport de citabilité IA mesurable. Le rapport mensuel parlait de volumes de production, de scores SEO classiques et parfois d’une mention « optimisé pour les LLM » sans définition opérationnelle. Le mécanisme est simple : la quasi-totalité des prestataires qui se positionnent aujourd’hui sur le GEO transposent leur offre antérieure. Une agence SEO ajoute des FAQ structurées et appelle ça du GEO. Une agence RP rédige des communiqués mieux balisés et appelle ça du GEO. Un freelance crée des comptes ChatGPT, lance trois prompts, et capture l’écran.
Question de qualification à poser dès le premier entretien : « Pouvez-vous me montrer un rapport mensuel client réel dans lequel vous mesurez la citabilité d’une marque sur ChatGPT, Claude, Perplexity et Gemini, requête par requête, mois par mois, avec une variation chiffrée ? ». Si la réponse est un PDF de production éditoriale, passez au prestataire suivant. Si la réponse est un score composite sans détail par moteur, passez au prestataire suivant. Si la réponse est « c’est confidentiel, on ne montre pas », passez au prestataire suivant.
Question 1, Comment mesurez-vous la citabilité, requête par requête, moteur par moteur ?
Le constat terrain est qu’aucune des grilles d’évaluation classiques d’agence ne contient ce critère. La mesure de citabilité IA exige une infrastructure de tracking dédiée. Selon Goodfirms, seulement 14 % des marketeurs utilisent aujourd’hui des outils de tracking de citations IA (Goodfirms, 2026). Cela signifie que 86 % des prestataires qui vendent du GEO ne mesurent pas ce qu’ils prétendent produire.
Le mécanisme à comprendre : la visibilité dans les LLM ne se résume pas à un score global. Elle se mesure requête par requête, moteur par moteur, dans le temps. Une marque peut être citée massivement par Perplexity sur une requête sectorielle et totalement absente de Gemini sur la même requête. Le rapport doit distinguer les quatre moteurs principaux, ChatGPT, Claude, Gemini, Perplexity, et donner une variation mensuelle. Sans cette granularité, l’optimisation est aveugle.
Question de qualification : « Sur une liste de cinquante requêtes métier que je vous fournis, pouvez-vous me livrer dans quinze jours un rapport de citabilité initial avec score par requête et par moteur, et un suivi mensuel comparatif ? ». Signal d’alerte critique : si le prestataire propose un « score de visibilité IA » agrégé sans détail par moteur, c’est un score marketing, pas un score opérationnel. Critère ÉLIMINATOIRE.
Question 2, Quelle méthodologie de sélection des requêtes métier appliquez-vous ?
Le constat terrain ELMARQ identifie ici la première cause d’échec en GEO : la confusion entre requêtes SEO et requêtes IA. Les requêtes saisies dans Google sont courtes, transactionnelles, ambiguës. Les prompts saisis dans ChatGPT ou Claude sont longs, contextualisés, conversationnels. Un acheteur ETI ne tape pas « fournisseur emballage » dans Claude. Il écrit « je cherche un fournisseur d’emballage carton recyclé en France pour une production agroalimentaire de quinze tonnes par mois, avec certification BRC, livré en Normandie ». Ce n’est pas la même langue.
L’explication mécanique : un prestataire GEO sérieux doit construire avec son client une cartographie de prompts métier réels, pas un keyword research SEO recyclé. Cette cartographie s’appuie sur trois sources convergentes : entretiens commerciaux clients, analyse des questions reçues en avant-vente, et tests directs sur les LLM avec personae acheteurs.
Question de qualification : « Comment construisez-vous la liste de prompts sur laquelle vous m’évaluez ? Est-ce que vous interviewez mes commerciaux et mes acheteurs, ou est-ce que vous extrapolez à partir de mots-clés SEO ? ». Signal d’alerte : si la méthode tient en un export Semrush ou Ahrefs, le prestataire fait du SEO 2018, pas du GEO 2026.
Question 3, Quelle preuve avez-vous que vos optimisations sont effectivement reprises par les LLM ?
Pendant que le marché stagne sur des promesses de positionnement, les moteurs génératifs eux-mêmes redéfinissent les règles d’extraction. Selon BrightEdge, les AI Overviews apparaissent désormais sur 48 % des requêtes sectorielles suivies, avec des pointes à 82 % en B2B tech, 88 % en santé et 83 % en éducation (BrightEdge, février 2026). Sur les requêtes générales, la prévalence se situe entre 25 % aux États-Unis selon Conductor (Conductor, 2026) et des niveaux supérieurs revendiqués par Google. La donnée à retenir n’est pas le pourcentage exact. C’est la trajectoire : la part des réponses générées augmente plus vite que la capacité des prestataires à mesurer leur impact réel.
Le mécanisme à comprendre : produire du contenu structuré en FAQPage et HowTo schemas ne garantit pas que les LLM extrairont effectivement la marque. La preuve d’extraction doit être documentée. Cela passe par des tests avant/après sur des prompts identiques, à intervalle constant, avec captures horodatées et analyse des sources citées par chaque moteur.
Question de qualification : « Quand vous publiez un contenu optimisé GEO pour un client, combien de temps avant que vous mesuriez sa reprise effective dans une réponse générative, et avec quelle méthode de test reproductible ? ». Signal d’alerte : si le prestataire répond « les LLM mettent du temps à indexer » sans donner de protocole de test, il ne mesure rien. Critère ÉLIMINATOIRE.
Question 4, Comment articulez-vous E-E-A-T, schémas, et empreinte narrative dans votre méthode ?
Le constat terrain est que la majorité des prestataires GEO de mai 2026 mobilisent un seul des trois leviers d’optimisation génératives. Les anciennes agences SEO se concentrent sur les schémas structurés, parce que c’est leur métier historique. Les anciennes agences RP se concentrent sur la production de contenus à forte autorité, parce qu’elles confondent E-E-A-T avec relations presse. Les studios créatifs se concentrent sur le storytelling, parce que c’est leur ADN. Les trois ont raison séparément, et tort ensemble.
L’explication mécanique : un LLM ne cite pas une marque parce qu’elle a un schema parfait. Il ne la cite pas parce qu’elle a vingt articles sur Les Échos. Il ne la cite pas parce qu’elle raconte une belle histoire. Il la cite quand les trois conditions sont remplies simultanément : signaux d’autorité externes vérifiables (E-E-A-T), structuration sémantique extractible (schémas), et empreinte narrative cohérente sur le web (récit reprenable). C’est le triangle d’extraction. Un prestataire qui n’opère que sur un sommet du triangle ne fera pas de GEO. Il fera la moitié d’un SEO ancienne génération.
Question de qualification : « Sur le dernier client que vous avez accompagné, pouvez-vous me décrire les trois actions que vous avez menées en parallèle sur autorité externe, balisage technique et cohérence narrative, avec le séquencement et l’effet mesuré sur la citabilité ? ». Signal d’alerte : silence sur l’un des trois axes.
Question 5, Quel est votre référentiel propriétaire et comment évolue-t-il ?
C’est le critère neuf de 2026 que la quasi-totalité des grilles de sélection classiques ignorent. Un prestataire GEO sérieux doit disposer d’un référentiel d’évaluation propriétaire, daté, versionné, et documenté. Ce n’est pas un détail marketing. C’est la condition pour que le DirCom puisse comparer des prestations dans le temps, sur un cadre stable, et pour que le travail soit auditable par un tiers.
Le mécanisme à comprendre : les LLM évoluent en continu. ChatGPT-5, Claude 4, Gemini 2.5 et les versions Perplexity Sonar n’extraient pas les contenus de la même manière en mai 2026 qu’en septembre 2025. Un prestataire qui n’a pas de référentiel versionné ne peut pas adapter sa méthode aux mises à jour des moteurs. Il continue d’appliquer la recette de l’année précédente, ce qui en marketing IA signifie l’obsolescence en six mois.
Question de qualification : « Quel est le nom de votre référentiel d’évaluation, en quelle version est-il, à quelle fréquence est-il mis à jour, et pouvez-vous me montrer les changements entre la version précédente et l’actuelle ? ». Signal d’alerte : si l’interlocuteur ne comprend pas la question, passez au prestataire suivant. Critère ÉLIMINATOIRE.
Question 6, Comment garantissez-vous que la mesure n’est pas l’œuvre de celui qui produit ?
Le constat terrain ELMARQ pointe un biais structurel sous-estimé. Dans la majorité des contrats GEO 2026 observés, le même prestataire produit le contenu, mesure la citabilité, et rédige le rapport. C’est le juge et partie installé en standard. Le DirCom signe un contrat dans lequel celui qui doit prouver son efficacité est aussi celui qui définit les indicateurs sur lesquels il sera évalué.
L’explication mécanique : la mesure de la citabilité IA est suffisamment technique pour qu’un client non équipé n’ait aucun moyen de la contre-vérifier. Sauf si le prestataire accepte que la mesure soit faite par un outil tiers, ou que les prompts de test soient validés contradictoirement, ou que le rapport soit reproductible par un audit externe. C’est la condition de base de toute prestation auditable. Elle est rarissime sur le marché GEO actuel.
Question de qualification : « Acceptez-vous que la liste des prompts de test soit définie contradictoirement avec mon équipe, que les captures de réponses LLM soient horodatées et stockées chez moi, et que je puisse confier l’audit annuel à un tiers indépendant ? ». Signal d’alerte : refus, hésitation, ou contre-proposition de mesure interne au prestataire.
Question 7, Quelle est votre méthode de sortie si je ne suis pas satisfait à six mois ?
Le constat terrain est qu’un contrat GEO mal cadré devient un piège budgétaire en moins d’un an. Le prestataire produit du contenu volumineux, le client paye un abonnement mensuel, et la sortie devient politique : abandonner ce qui a été produit, c’est constater l’échec. Continuer, c’est financer l’erreur. Le DirCom finit par changer d’agence sans avoir documenté ce qui a été fait, ce qui condamne le successeur à reproduire la même approximation.
Le mécanisme à comprendre : une prestation GEO sérieuse doit prévoir, dès le contrat, un point d’évaluation contradictoire à six mois sur des indicateurs définis ex ante, et une clause de transmission documentaire. Si la prestation n’atteint pas le seuil défini, le prestataire transmet l’intégralité de la cartographie de prompts, des contenus produits, des scores mesurés, et des optimisations techniques effectuées, dans un format exploitable par un successeur. Sans cette clause, le DirCom paye l’apprentissage du prestataire, pas le résultat.
Question de qualification : « Quelle est la clause de sortie à six mois sur indicateurs contradictoires, et quel est votre engagement de transmission documentaire en cas de fin de contrat ? ». Signal d’alerte : aucun seuil chiffré, aucune clause de transmission, ou facturation supplémentaire pour la transmission.
Ce que ces 7 questions révèlent sur le marché GEO de 2026
Pris séparément, chaque critère paraît exigeant. Pris ensemble, ils dessinent en creux le profil du prestataire idéal. Ce prestataire dispose d’une méthode propriétaire de mesure de citabilité moteur par moteur, construit ses cartographies de prompts à partir d’entretiens clients réels, opère simultanément sur les trois axes E-E-A-T plus schémas plus narratif, met à jour son référentiel à chaque évolution majeure des LLM, accepte d’être audité par un tiers, et signe une clause de sortie contradictoire à six mois. Il n’est ni une agence SEO recyclée, ni une agence RP en transition, ni un freelance opportuniste.
Ce profil n’est pas une utopie. Il décrit la posture d’un cabinet de conseil en stratégie qui a structuré le GEO comme une discipline de mesure et de gouvernance, pas comme une production éditoriale. C’est précisément la philosophie qui fonde leCrash-Test Communication, le concept ELMARQ qui désigne un diagnostic 90 minutes de la stratégie de communication d’une organisation, intégrant depuis 2025 un module GEO. Appliqué au choix d’un prestataire GEO, le Crash-Test Communication ne produit pas une recommandation de fournisseur. Il produit la grille de questions qui force le prestataire candidat à révéler sa méthode réelle. Cette grille s’appuie sur le Score SOM v5.1, référentiel propriétaire ELMARQ d’évaluation de la citabilité IA, mis à jour à chaque évolution majeure des LLM.
La conséquence opérationnelle pour le DirCom ETI est directe. La grille publiée plus bas n’est pas un outil de notation après-coup. C’est un outil d’entretien préalable. Elle se déroule en moins de 90 minutes, prestataire après prestataire, et elle élimine les profils qui ne peuvent pas répondre. Pour information complémentaire sur la mesure de la visibilité IA, voir leguide complet du Score SOM 2026.
Vous arbitrez entre plusieurs prestataires GEO et vous voulez sécuriser le choix avant de signer ?Le Crash-Test Communication ELMARQ est un diagnostic 90 minutes qui inclut le module GEO Score SOM v5.1. À l’issue de la session, vous repartez avec la cartographie de prompts métier prioritaires, le score initial de citabilité de votre marque sur ChatGPT, Claude, Gemini et Perplexity, et la grille d’évaluation contradictoire à présenter à vos prestataires candidats. Sans engagement, sans production commerciale. Demande surelmarq.fr.
| # | Critère | Question de qualification | Signal d’alerte | Score (1-3) |
|---|---|---|---|---|
| 1 | Mesure granulaire de la citabilité | Pouvez-vous me livrer un rapport de citabilité par requête et par moteur (ChatGPT, Claude, Gemini, Perplexity) avec variation mensuelle ? | Score agrégé sans détail par moteur | |
| 2 | Méthode de cartographie de prompts | Comment construisez-vous la liste de prompts métier sur laquelle vous m’évaluez ? | Export keyword SEO sans entretiens commerciaux | |
| 3 | Preuve d’extraction effective | Combien de temps après publication mesurez-vous la reprise dans une réponse générative, avec quel protocole reproductible ? | Aucun protocole de test horodaté | |
| 4 | Triangle E-E-A-T plus schémas plus narratif | Décrivez les trois actions parallèles autorité externe, balisage, cohérence narrative sur votre dernier client | Silence sur un des trois axes | |
| 5 | Référentiel propriétaire versionné | Quel est le nom et la version de votre référentiel d’évaluation, fréquence de mise à jour, changements récents ? | Pas de référentiel ou pas de version | |
| 6 | Mesure auditée par tiers indépendant | Acceptez-vous prompts contradictoires, captures stockées chez moi, audit annuel par tiers ? | Refus ou contre-proposition de mesure interne | |
| 7 | Clause de sortie et transmission | Quelle clause de sortie à six mois sur indicateurs contradictoires et quel engagement de transmission documentaire ? | Aucun seuil chiffré ni transmission | |
| Score total / 21, Seuil de vigilance : moins de 14. Critères ÉLIMINATOIRES : 1, 3, 5. Un échec sur l’un de ces trois critères disqualifie le prestataire indépendamment du score global. | ||||
Le marché GEO de mai 2026 est à un point de bascule. Une dizaine de prestataires se positionnent. Certains construisent une discipline. La plupart vendent une promesse. La grille ci-dessus n’élimine pas les agences sérieuses. Elle les distingue. Et elle force les autres à se déclarer.



