Comment notre IA évalue-t-elle réellement votre startup ?

La plupart des outils d'IA sont des boîtes noires. Vous y mettez quelque chose, vous obtenez un chiffre et vous êtes censé lui faire confiance.

Nous ne pensons pas que ce soit suffisant, surtout lorsque vous évaluez l'œuvre d'une vie.

Cet article explique comment GemScore évalue les startups : les agents, la recherche, le débat, la notation. Pas de marketing. Pas de poudre aux yeux. Juste le système.

L'aperçu en 60 secondes

Lorsque vous soumettez une idée pour évaluation, voici ce qui se passe :

Cinq agents d'IA spécialisés analysent votre startup en parallèle, chacun étant axé sur une dimension différente
Chaque agent exécute un processus en deux phases : d'abord une recherche Web, puis une analyse structurée
Un agent de validation vérifie les cinq agents pour détecter les contradictions et les affirmations non vérifiées
Un optimiste et un pessimiste débattent des mérites de votre startup
Un juge final évalue le débat et produit des scores calibrés
Votre rapport est généré avec des chaînes de preuves, des intervalles de confiance et une note de type IC

Durée totale : 8 à 15 minutes pour une évaluation complète. Chaque affirmation est rattachée à une source. Chaque score est justifié.

Voici à quoi ressemble le rapport final (vous pouvez consulter un exemple de rapport en direct pour le voir en action) :

┌─────────────────────────────────────────────────────────────────┐
│  RAPPORT D'ÉVALUATION GEMSCORE                                      │
│  Projet : AcmeHealth — Triage des patients basé sur l'IA                 │
│  Évalué : 9 février 2026                                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│   POTENTIEL           PRÉPARATION            RECOMMANDATION         │
│   ┌─────────┐        ┌─────────┐          ┌──────────────┐      │
│   │   78    │        │   52    │          │    OUI       │      │
│   │  /100   │        │  /100   │          │              │      │
│   └─────────┘        └─────────┘          └──────────────┘      │
│   plage : 72-84        plage : 44-60                               │
│   confiance : Moyenne  confiance : Moyenne                          │
│                                                                   │
│   TL ;DR : Solide équipe fondatrice possédant une expertise dans le domaine de la santé.  │
│   TAM vérifié à 8,2 milliards de dollars. MVP en phase pilote avec 3 hôpitaux.          │
│   Principal risque : voie réglementaire incertaine, aucun responsable de la conformité.      │
│   Recommandation : embaucher un responsable de la conformité, obtenir 2 autres pilotes.      │
│                                                                   │
│   [Rapport complet]  [Note d'investissement]  [Graphiques]  [Salle de données]       │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Les cinq agents

Chaque agent est un spécialiste. Ils s'exécutent en parallèle (et non séquentiellement), car une nouvelle perspective est plus importante qu'un consensus.

Agent	Focus	Ce qu'il évalue
Équipe	Personnes	Antécédents des fondateurs, expertise du domaine, expérience en matière d'exécution, équipe complète
Marché	Opportunité	Validation de TAM/SAM/SOM, tendances de croissance, paysage concurrentiel, signaux de demande
Entreprise	Modèle	Modèle de revenus, économie d'unité, évolutivité, efficacité du capital
Produit	Solution	Adéquation problème-solution, faisabilité technique, clarté du MVP, défendabilité, UVP
Risque	Menaces	Menaces concurrentielles, risques d'exécution, échecs historiques dans l'espace

Les pondérations sont calibrées pour refléter les priorités d'investissement en phase de démarrage. L'équipe est la plus importante, ce qui correspond à la façon dont la plupart des VC évaluent en pré-amorçage et en phase d'amorçage. Au fur et à mesure que les startups mûrissent, le produit et le modèle d'entreprise deviennent naturellement plus importants. La pondération exacte fait partie de notre modèle de notation exclusif et est continuellement ajustée en fonction des résultats réels.

Voici à quoi ressemble la répartition par agent dans un rapport :

┌─────────────────────────────────────────────────────────────────┐
│  RÉPARTITION DES SCORES PAR AGENT                                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  ÉQUIPE        ████████████████████░░░░  Potentiel : 8,2 / 10      │
│              ██████████████░░░░░░░░░░  Préparation : 6,1 / 10      │
│              Confiance : Élevée — 3 fondateurs vérifiés par le biais de sources publiques   │
│              enregistrements. Le CTO a 2 sorties antérieures confirmées.           │
│                                                                   │
│  MARCHÉ      ████████████████░░░░░░░░  Potentiel : 7,4 / 10      │
│              ██████████████████░░░░░░  Préparation : 6,8 / 10      │
│              Confiance : Moyenne — TAM vérifié par Gartner.      │
│              Estimation de SAM non vérifiée (réclamation de l'utilisateur uniquement).          │
│                                                                   │
│  ENTREPRISE    ██████████████░░░░░░░░░░  Potentiel : 6,5 / 10      │
│              ████████░░░░░░░░░░░░░░░░  Préparation : 3,8 / 10      │
│              Confiance : Faible — Économie d'unité non fournie.      │
│              Modèle de revenus basé sur des références SaaS comparables.  │
│                                                                   │
│  PRODUIT     ██████████████████░░░░░░  Potentiel : 7,8 / 10      │
│              ██████████░░░░░░░░░░░░░░  Préparation : 4,5 / 10      │
│              Confiance : Moyenne — Le MVP existe, mais aucune donnée d'utilisation.  │
│              L'architecture technique semble saine.                │
│                                                                   │
│  RISQUE        ████████████░░░░░░░░░░░░  Potentiel : 5,6 / 10      │
│              ██████████████░░░░░░░░░░  Préparation : 6,2 / 10      │
│              Confiance : Élevée — 4 concurrents directs identifiés. │
│              Le risque réglementaire est signalé comme principale préoccupation.          │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Modèle à double agent : recherche + analyse

C'est là que ça devient intéressant. Chacun des cinq agents est en fait deux agents travaillant en séquence.

Phase 1 : Le chercheur (recherche Web)

Le premier agent recherche des preuves sur le Web ouvert. Il ne fait pas confiance à vos affirmations, il les vérifie.

Pour l'Agent Équipe, cela signifie :

Vérifier les affirmations des fondateurs par recoupement avec les registres publics, la presse et les profils professionnels
Vérifier les entreprises précédentes et les rôles revendiqués
Valider les affirmations relatives à l'expertise du domaine

Pour l'Agent Marché :

Valider vos affirmations TAM/SAM/SOM par recoupement avec les rapports de l'industrie et les données des analystes
Vérifier les tendances de croissance dans votre secteur à partir de sources actuelles
Cartographier le paysage concurrentiel à partir de données en direct, et non de bases de données obsolètes

Pour l'Agent Risque :

Trouver des concurrents que vous n'avez pas mentionnés
Rechercher les échecs historiques dans votre espace
Identifier les risques réglementaires et d'exécution spécifiques à votre marché

Le chercheur fournit des conclusions en langage naturel : des preuves brutes, pas des scores.

Au-delà de la recherche Web : sources de données vérifiées

La recherche Web est la base de référence, pas le plafond. Nous élargissons continuellement la couche de recherche avec des intégrations API directes qui renvoient des données structurées vérifiées, et non des extraits Web :

Profils professionnels : API LinkedIn pour l'historique de l'emploi, l'éducation et les recommandations
Données financières : Stripe, processeurs de paiement pour la vérification des revenus
Analyse de l'utilisation : Google Analytics, Mixpanel pour les mesures de traction
Activité du code : GitHub pour la vitesse de développement et les signaux de la taille de l'équipe
Registres des entreprises : Registres des entreprises, bases de données de brevets, documents SEC
Données de marché : API d'analystes de l'industrie pour la validation et les références de TAM

Chaque intégration ajoute une couche source au-dessus de la recherche Web. Lorsque l'Agent Équipe peut vérifier le rôle d'un fondateur par le biais d'une API professionnelle plutôt que d'une mention de blog, le niveau de confiance augmente, tout comme la fiabilité du score.

Nous ajoutons de nouvelles sources vérifiées chaque trimestre. L'objectif : réduire la dépendance à l'égard de la recherche Web au fil du temps et évoluer vers un monde où la plupart des affirmations sont vérifiées par programme.

Phase 2 : L'analyste (notation structurée)

Le deuxième agent prend les résultats de la recherche et produit une analyse structurée :

Scores sur deux axes : Chaque dimension reçoit un score de potentiel (0-10) et un score de préparation (0-10)
Intervalles de confiance : Chaque score comprend des bornes basses/hautes en fonction de la qualité des preuves
Chaînes de preuves : Chaque affirmation est liée à sa source avec un niveau de confiance
Justification : Justification écrite pour chaque score

Pourquoi deux agents distincts ? Différents modèles d'IA excellent dans différentes tâches. Les modèles optimisés pour la recherche Web ne sont pas les mêmes que ceux qui produisent la meilleure analyse structurée. Nous avons donc divisé le travail : un agent rassemble, un agent raisonne. Chacun utilise le bon modèle pour son travail.

Notation sur deux axes : potentiel et préparation

La plupart des systèmes de notation vous donnent un seul chiffre. C'est comme évaluer un restaurant sur une échelle de 1 à 10 : cela regroupe trop de dimensions en une seule.

GemScore utilise deux axes :

Potentiel (0-100) : Quelle pourrait être l'ampleur de ce projet si tout se passait bien ?

Taille et croissance du marché
Plafond de la capacité de l'équipe
Évolutivité du modèle économique
Potentiel de différenciation technique

Préparation (0-100) : Dans quelle mesure cette startup est-elle prête à exécuter dès maintenant ?

Complétude et disponibilité de l'équipe
Validation et traction du marché
Clarté du modèle économique et économie d'unité
Étape de développement du produit

Cela crée quatre quadrants significatifs :

                         PRÉPARATION
                   Faible              Élevée
              ┌──────────────┬──────────────┐
              │              │              │
    Élevé      │  Grande Vision  │   Solide     │
              │  A besoin d'aide  │   Candidat  │
 POTENTIEL    │              │              │
              ├──────────────┼──────────────┤
              │              │              │
    Faible       │   Repenser    │   Entreprise solide  │
              │   Nécessaire     │   Faible potentiel de hausse │
              │              │              │
              └──────────────┴──────────────┘

Une idée naissante obtiendra naturellement un score élevé en potentiel et un score plus faible en préparation, ce qui est prévu. Une startup mature devrait obtenir un score élevé dans les deux domaines. Les axes racontent des histoires différentes à différents publics : les fondateurs se soucient des lacunes en matière de préparation qu'ils peuvent corriger ; les investisseurs se soucient du potentiel de hausse sur lequel ils peuvent parier.

Le test Airbnb 2008

Nous calibrons notre système par rapport aux startups historiques évaluées comme si nous les avions vues à leur premier stade. Prenons l'exemple d'Airbnb en 2008 :

Potentiel : Devrait obtenir un score élevé : marché massif (voyage), effets de réseau, économie de plateforme
Préparation : Devrait obtenir un score faible : pas de traction, concept non prouvé, équipe réduite

Si notre système avait noté Airbnb 2008 comme « faible potentiel », comme l'ont fait de nombreux VC à l'époque, ce serait un échec de calibration. Le système à deux axes empêche l'erreur courante de pénaliser les grandes idées pour leur précocité.

Intervalles de confiance : honnêteté concernant l'incertitude

Chaque score d'un rapport GemScore comprend une plage de confiance :

┌─────────────────────────────────────────────────────────────────┐
│  VISUALISATION DE LA CONFIANCE — Potentiel du marché                     │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│    0        25        50        75       100                     │
│    ├─────────┼─────────┼─────────┼─────────┤                     │
│                              [====●====]                          │
│                              68   74   80                         │
│                                                                   │
│    Score : 74        Plage : 68 — 80        Confiance : Moyenne     │
│                                                                   │
│    Interprétation : Nous sommes raisonnablement certains que le score réel     │
│    se situe entre 68 et 80. La largeur reflète la qualité des preuves.    │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Plage étroite (par exemple, 72-76) : Preuves solides provenant de plusieurs sources vérifiées. Confiance élevée. Plage large (par exemple, 55-80) : Preuves limitées, plus d'incertitude. La position réelle de la startup pourrait varier considérablement.

Nous préférons vous montrer une incertitude honnête plutôt qu'une fausse précision.

Niveaux de preuve

Toutes les preuves ne sont pas égales. Nous classons les preuves en niveaux de confiance :

Niveau	Types de sources	Signal
Vérifié par l'API	Données d'API directes (revenus Stripe, API LinkedIn, Google Analytics)	Le plus élevé : vérifié par la machine, inviolable
Vérifié	Documents publics, communiqués de presse confirmés, registres gouvernementaux, bases de données de brevets	Très élevé : vérifiable indépendamment
Corroboré	Plusieurs sources Web indépendantes s'accordant	Élevé : vérifié par recoupement
Partiel	Profils professionnels, mentions d'une seule source	Modéré : plausible, mais non confirmé
Revendiqué	Soumis par l'utilisateur sans preuve externe	Ligne de base : accepté, mais réduit
Absent	Aucune preuve trouvée pour ou contre	Minimal : données insuffisantes

Le système réduit considérablement les affirmations non vérifiées. Nous ne traitons pas les fondateurs de menteurs, mais les affirmations extraordinaires ont besoin d'au moins quelques preuves pour avoir un poids significatif. Notre pipeline de vérification utilise plusieurs stratégies de référence croisée que nous améliorons continuellement.

Voici à quoi ressemblent les chaînes de preuves dans le rapport :

┌─────────────────────────────────────────────────────────────────┐
│  CHAÎNE DE PREUVES — Agent Équipe                                     │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  AFFIRMATION : « Le CTO a 12 ans d'expérience dans l'IA des soins de santé »           │
│  ┌─────────────────────────────────────────────────────────────┐ │
│  │  Preuve n° 1 : Profil LinkedIn (public)                     │ │
│  │  → Confirmé : Ingénieur principal en apprentissage automatique chez MedTech Inc (2018-2023) │ │
│  │  → Confirmé : Doctorat en biologie computationnelle, Stanford        │ │
│  │  → Niveau : Corroboré                                       │ │
│  ├─────────────────────────────────────────────────────────────┤ │
│  │  Preuve n° 2 : Mention dans la presse                                 │ │
│  │  → TechCrunch (2022) : « Embauche de l'équipe d'IA dirigée   │ │
│  │    par [nom] de MedTech »                                               │ │
│  │  → Niveau : Vérifié                                           │ │
│  ├─────────────────────────────────────────────────────────────┤ │
│  │  Preuve n° 3 : Registres de brevets                                │ │
│  │  → 3 brevets en PNL pour les données cliniques (USPTO)              │ │
│  │  → Niveau : Vérifié                                           │ │
│  └─────────────────────────────────────────────────────────────┘ │
│                                                                   │
│  VERDICT : Affirmation vérifiée avec une confiance élevée                    │
│  Impact sur le score de l'équipe : +1,2 potentiel, +1,8 préparation           │
│                                                                   │
│  AFFIRMATION : « 2 000 utilisateurs actifs quotidiens sur le pilote »                      │
│  ┌─────────────────────────────────────────────────────────────┐ │
│  │  Preuve : Aucune preuve trouvée                                       │ │
│  │  → Aucune donnée d'utilisation publique, aucune présence dans les magasins d'applications              │ │
│  │  → Niveau : Revendiqué (soumis par l'utilisateur uniquement)                      │ │
│  └─────────────────────────────────────────────────────────────┘ │
│                                                                   │
│  VERDICT : Affirmation non vérifiée — poids considérablement réduit        │
│  Remarque : Connectez l'analyse (Stripe, GA) dans la V4 pour une vérification automatique      │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

L'agent de validation : détecter les contradictions

Une fois que les cinq agents ont terminé leur analyse, un agent de validation examine leur production combinée :

Vérification par recoupement : Le paysage concurrentiel de l'agent Marché correspond-il à ce que l'agent Risque a trouvé ?
Détection des contradictions : L'agent Équipe a-t-il déclaré un « solide bagage technique » alors que l'agent Produit a signalé des « préoccupations quant à la faisabilité » ?
Affirmations non vérifiées à fort impact : Si un score clé dépend d'une affirmation avec une faible confiance, cela est signalé
Domaines d'intérêt du débat : L'agent de validation indique au système de débat sur quoi se concentrer

Cette étape permet de détecter les cas où chaque agent a fait des hypothèses raisonnables qui entrent en conflit une fois combinées.

Le débat : Optimiste contre Pessimiste

C'est la partie que les gens trouvent la plus intéressante.

Une fois que les agents ont noté et que l'agent de validation a vérifié les recoupements, deux débatteurs synthétiques argumentent sur votre startup :

L'optimiste présente l'argument le plus solide possible :

Souligne les signaux les plus prometteurs
Plaide en faveur de scénarios haussiers
Remet en question les évaluations des risques qui semblent trop prudentes
Souligne les succès comparables

Le pessimiste met tout à l'épreuve :

Identifie les hypothèses les plus faibles
Plaide en faveur de scénarios baissiers
Remet en question les projections optimistes
Souligne les échecs comparables

Ils font des allers-retours, chacun répondant aux arguments de l'autre. Le débat est structuré, pas un argument libre, chaque tour portant sur des dimensions spécifiques.

Voici à quoi ressemble le résumé du débat dans le rapport :

┌─────────────────────────────────────────────────────────────────┐
│  RÉSUMÉ DU DÉBAT                                                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  L'OPTIMISTE a soutenu :                                                │
│  « Le marché de l'IA des soins de santé croît à un TCAC de 42 %. L'équipe possède une combinaison rare    │
│  d'expertise clinique + technique. 3 pilotes hospitaliers sont un signal fort  │
│  pour une entreprise en pré-amorçage. Le rempart réglementaire une fois atteint    │
│  crée une défendabilité que la plupart des SaaS ne peuvent égaler. »                   │
│                                                                   │
│  LE PESSIMISTE a soutenu :                                               │
│  « La voie réglementaire est la grande inconnue critique. Aucune conformité      │
│  responsable de la conformité dans l'équipe : ce n'est pas un avantage, c'est existentiel.    │
│  2 des 3 pilotes hospitaliers sont avec le même système de santé,         │
│  réduisant la force du signal. Taux d'épuisement non divulgué. »             │
│                                                                   │
│  RÉSOLUTION :                                                      │
│  La préoccupation réglementaire du pessimiste était convaincante : le potentiel        │
│  a été légèrement réduit, la préparation a été considérablement réduite            │
│  de manière significative. L'argument de la croissance du marché de l'optimiste a tenu bon : TAM      │
│  les données ont été vérifiées indépendamment. Effet net : le potentiel est stable,      │
│  la préparation a diminué en raison du manque de conformité.                      │
│                                                                   │
│  Ajustements de score appliqués : Potentiel ─, Préparation ↓             │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Pourquoi le débat est important

Le système de débat existe parce que chaque agent a un mode de défaillance connu : il s'ancre à son évaluation initiale. Si l'Agent Équipe a fortement noté un fondateur, il ne tiendra pas naturellement compte d'un score inférieur.

Le débat oblige les deux cas à être argumentés explicitement. Le juge final évalue ensuite ces arguments par rapport aux scores des agents d'origine, en ajustant à la hausse ou à la baisse en fonction du débatteur qui a présenté les arguments les plus solides, soutenus par des preuves.

Les ajustements sont significatifs, mais limités : le débat affine les scores plutôt que de les annuler. C'est la différence entre « Peut-être » et « Oui », ou entre « Oui » et « Oui fort ».

Le juge final : notation calibrée

Le juge final prend tout :

Cinq scores d'agents avec des intervalles de confiance
Signalements de l'agent de validation
Transcription complète du débat
Chaînes de preuves de tous les agents

Et produit le rapport final :

┌─────────────────────────────────────────────────────────────────┐
│  JUGEMENT FINAL                                                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  ┌──────────────────────────────────────────────────────────┐   │
│  │  RECOMMANDATION : OUI                                     │   │
│  │                                                           │   │
│  │  Potentiel :  78 / 100   (plage : 72-84, confiance : Moy.)   │   │
│  │  Préparation :  52 / 100   (plage : 44-60, confiance : Moy.)   │   │
│  │                                                           │   │
│  │  Pourcentage : Top 22 % dans HealthTech (Potentiel)            │   │
│  │              Top 45 % dans HealthTech (Préparation)            │   │
│  └──────────────────────────────────────────────────────────┘   │
│                                                                   │
│  RÉSUMÉ (TL ;DR) :                                      │
│  AcmeHealth présente une opportunité intéressante dans un marché vaste et        │
│  d'IA des soins de santé à croissance rapide. L'équipe fondatrice a         │
│  une forte expertise du domaine vérifiée par le biais de documents publics,        │
│  y compris un CTO avec des brevets publiés en PNL clinique.         │
│  Trois pilotes hospitaliers démontrent un premier attrait du marché. Le        │
│  principal risque est réglementaire : aucun responsable de la conformité dans l'équipe      │
│  et une voie FDA peu claire. L'économie d'unité du modèle commercial       │
│  n'a pas été fournie, ce qui limite notre capacité à évaluer le capital       │
│  l'efficacité. Recommandez l'embauche d'un responsable de la conformité en premier      │
│  priorité et obtention d'au moins 2 pilotes en dehors de l'actuel     │
│  système de santé pour élargir le signal.                            │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Le juge est calibré par rapport à notre ensemble de données historique de résultats connus. Il sait, par exemple, que les startups de la santé sans expertise réglementaire sont historiquement confrontées à des délais plus longs et ajuste les attentes en conséquence.

La note d'investissement

Chaque rapport GemScore complet génère également une note d'investissement de type IC, le genre qu'un associé VC écrirait pour son comité d'investissement :

┌─────────────────────────────────────────────────────────────────┐
│  NOTE D'INVESTISSEMENT — AcmeHealth                                    │
│  Générée : 9 février 2026                                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  RÉSUMÉ                                               │
│  AcmeHealth construit un système de triage des patients basé sur l'IA      │
│  pour les services d'urgence des hôpitaux. L'entreprise est en pré-amorçage     │
│  avec 3 pilotes hospitaliers (2 au sein d'un même système de santé).       │
│                                                                   │
│  THÈSE D'INVESTISSEMENT                                               │
│  Le marché de l'IA des soins de santé est de 8,2 milliards de dollars (Gartner, 2025) et croît à       │
│  un TCAC de 42 %. L'équipe possède une combinaison clinique + technique rare.       │
│  Le rempart réglementaire de la FDA crée une défendabilité à long terme.            │
│                                                                   │
│  PRINCIPALES FORCES                                                    │
│  1. CTO : 12 ans d'IA des soins de santé, 3 brevets, doctorat de Stanford            │
│  2. Marché : Grand TAM avec un fort vent arrière séculaire               │
│  3. Traction : 3 pilotes hospitaliers actifs                           │
│                                                                   │
│  PRINCIPAUX RISQUES                                                        │
│  1. Aucun responsable de la réglementation/conformité (essentiel pour la voie FDA)        │
│  2. 2/3 pilotes au sein du même système de santé                         │
│  3. Économie d'unité non fournie                                  │
│                                                                   │
│  RECOMMANDATION                                                   │
│  Passer à l'étape suivante. Sous réserve d'une embauche réglementaire.          │
│                                                                   │
│  [Télécharger le PDF]  [Partager avec des co-investisseurs]                       │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

La note est structurée pour un usage professionnel : partagez-la avec des co-investisseurs, utilisez-la pour votre IC ou remettez-la à un LP dans le cadre de votre documentation de diligence raisonnable.

Le pipeline complet

Voici le flux complet de la soumission au rapport :

┌──────────────────────────────────────────────────────────────┐
│                    PIPELINE D'ÉVALUATION GEMSCORE                │
├──────────────────────────────────────────────────────────────┤
│                                                                │
│  1. INGESTION                                                  │
│     └─ Analyser l'entrée structurée / les documents / la transcription vocale   │
│                                                                │
│  2. AGENTS PARALLÈLES (5 en cours d'exécution simultanément)                 │
│     ┌─────────────────┐  ┌─────────────────┐                  │
│     │  Equipe           │  │  Marché         │                  │
│     │  Recherche → ◆   │  │  Recherche → ◆   │                  │
│     │  Analyse  → ◆  │  │  Analyse  → ◆  │                  │
│     └─────────────────┘  └─────────────────┘                  │
│     ┌─────────────────┐  ┌─────────────────┐                  │
│     │  Entreprise       │  │  Produit        │                  │
│     │  Recherche → ◆   │  │  Recherche → ◆   │                  │
│     │  Analyse  → ◆  │  │  Analyse  → ◆  │                  │
│     └─────────────────┘  └─────────────────┘                  │
│     ┌─────────────────┐                                       │
│     │  Risque           │                                       │
│     │  Recherche → ◆   │                                       │
│     │  Analyse  → ◆  │                                       │
│     └────────┬────────┘                                       │
│              ▼                                                 │
│  3. VALIDATION                                                 │
│     └─ Vérifier tous les résultats des agents pour détecter les contradictions        │
│              ▼                                                 │
│  4. DÉBAT                                                     │
│     ├─ L'optimiste construit un scénario haussier                               │
│     ├─ Le pessimiste construit un scénario baissier                              │
│     └─ Plusieurs séries d'arguments structurés                  │
│              ▼                                                 │
│  5. JUGEMENT FINAL                                             │
│     └─ Scores calibrés + recommandation + TL ;DR              │
│              ▼                                                 │
│  6. GÉNÉRATION DE RAPPORTS                                          │
│     ├─ Rapport complet avec chaînes de preuves                        │
│     ├─ Note d'investissement de type IC                                │
│     └─ Analyse visuelle (graphiques, cartes concurrentielles)             │
│                                                                │
│  Total : 8-15 minutes. Tous les agents parallèles autant que possible.      │
│                                                                │
└──────────────────────────────────────────────────────────────┘

Que se passe-t-il quand quelque chose ne va pas

Les systèmes d'IA échouent. Nous l'avons conçu pour cela.

Si un agent échoue pendant l'évaluation :

L'ensemble de l'évaluation s'arrête immédiatement : pas de résultats partiels
Votre crédit est remboursé automatiquement
Un rapport d'erreur est enregistré pour le débogage
Vous êtes averti et pouvez réessayer

Nous ne produisons pas de rapports avec des données manquantes. Si l'agent Marché échoue et que les quatre autres réussissent, vous n'obtenez pas de rapport avec une section de marché vide. Vous obtenez un remboursement et des excuses.

Il s'agit d'un compromis délibéré. Nous préférons ne rien vous donner plutôt que de vous donner quelque chose de trompeur.

Complet contre Lite : Ce qui change

Nous offrons une validation rapide gratuite chaque mois. Voici en quoi elle diffère de l'évaluation complète :

Dimension	Validation rapide (gratuite)	GemScore complet
Agents	4 (Équipe, Marché, Entreprise, Risque)	5 (+ Produit)
Notation	Potentiel uniquement	Potentiel + Préparation
Débat	Non	Oui (Optimiste contre Pessimiste)
Profondeur des preuves	Recherche Web de base	Vérification approfondie de plusieurs sources
Intervalles de confiance	Non	Oui
Temps