L'ancien modèle est mort.
Pendant des décennies, l'évaluation des startups a suivi un scénario prévisible : l'équipe a-t-elle un PDG, un CTO et un expert dans le domaine ? Le TAM se trouve-t-il dans un rapport Gartner ? Ont-ils un bureau ? Combien de personnes ont-ils embauchées ?
En 2026, ce scénario produit les mauvaises réponses. Un fondateur solo avec des outils natifs de l'IA et une thèse claire livre plus rapidement qu'une équipe de 10 personnes de 2022. Les marchés qui n'existent pas dans les rapports d'analystes — le commerce agent-à-agent, l'infrastructure native de l'IA, les outils de travail décentralisés — sont là où se forment les prochaines entreprises valant mille milliards de dollars.
GemScore V3.1 est notre réponse à ce changement. Nous avons recalibré chaque dimension de notation pour évaluer les startups à travers le prisme de la direction que prend le monde, et non de celle qu'il a prise.
Ce N'est Pas un Cycle de Surmédiatisation. C'Est un Changement Vertical.
Soyons directs sur quelque chose.
Il existe un récit récurrent selon lequel l'IA n'est « qu'une bulle » — que les LLM sont surmédiatisés, que la technologie va plafonner, que nous regarderons cette période comme nous regardons la spéculation sur les cryptomonnaies.
Nous ne sommes pas d'accord. Fondamentalement.
Même si les architectures LLM actuelles s'avèrent être un tremplin plutôt que la forme finale, les capacités qu'elles ont déjà débloquées ne vont pas disparaître. Génération de code, raisonnement en langage naturel, analyse multimodale, agents autonomes — ceux-ci sont livrés dans des systèmes de production aujourd'hui, gérant de vraies charges de travail, générant une vraie valeur. Ce n'est pas un livre blanc. C'est une infrastructure.
Ce que nous vivons n'est pas un cycle de surmédiatisation. C'est un changement vertical dans ce qui est possible — dans la façon dont les logiciels sont construits, dont les entreprises fonctionnent, dont les marchés se forment et dont la valeur est créée. Les spécificités de la technologie évolueront. Le paradigme ne s'inversera pas.
GemScore V3.1 est construit sur cette conviction. Nous évaluons les startups non seulement sur ce que l'IA peut faire aujourd'hui, mais sur la réalité structurelle que l'exécution native de l'IA est un avantage concurrentiel permanent — quel que soit l'architecture de modèle qui prévaut.
Ce Qui A Changé (et Pourquoi)
1. Levier D'Exécution et Non Nombre D'Employés
Avant : « Fondateur solo = risque. CTO manquant = problème. Petite équipe = faible préparation. »
Maintenant : Nous évaluons le levier d'exécution — la capacité de livrer, d'itérer et de mettre à l'échelle. Un fondateur solo natif de l'IA qui a construit et lancé un produit en trois semaines démontre plus de capacité d'exécution qu'une équipe de cinq personnes qui est « en mode furtif » depuis un an.
L'évaluation reconnaît désormais :
- Flux de travail natifs de l'IA — les fondateurs qui construisent avec des outils de développement, de conception et de distribution de l'IA
- Vitesse de livraison comme preuve — lancer rapidement est un point de données, pas un raccourci
- Capacité "full-stack" via l'IA — une personne couvrant les produits, l'ingénierie et la conception
- Combinaison domaine + IA — connaissance approfondie de l'industrie amplifiée par l'exécution de l'IA
Un fondateur solo ayant de solides antécédents, une maîtrise démontrée de l'IA et une expertise dans le domaine peut obtenir autant de points qu'une équipe fondatrice traditionnelle de trois personnes. Pas de plafonds arbitraires. La question n'est pas « combien de personnes ? » — c'est « combien cette personne peut-elle accomplir ? »
2. Marchés Futurs, Pas Seulement les Rapports TAM
Avant : « Aucune donnée TAM dans les rapports d'analystes = faible score de marché ».
Maintenant : Si une startup cible un marché qui n'existe pas encore dans les bases de données des analystes, nous ne la pénalisons pas automatiquement. Au lieu de cela, nous évaluons la qualité de la thèse :
- Quels vents arrière structurels créent ce marché ?
- Quels marchés adjacents servent de substituts pour le dimensionnement ?
- Quels signaux d'adoption précoce existent ? (Tendances de financement, croissance de l'écosystème des développeurs, accélération de l'utilisation des API)
L'économie agentique — où les agents d'IA effectuent des transactions, exécutent des tâches et opèrent au nom des humains — est réelle et en croissance. Notre moteur d'évaluation reconnaît désormais les marchés émergents et natifs de l'IA comme une catégorie légitime, notée sur la qualité de la thèse et la logique structurelle plutôt que pénalisée pour l'absence de données traditionnelles.
3. Économie Native de l'IA
Les références SaaS traditionnelles supposent des marges brutes de 70 à 80 %, une acquisition axée sur les ventes et des processus exploités par l'homme. Les entreprises natives de l'IA ont des structures de coûts fondamentalement différentes :
- Marges plus élevées lorsque les fonctions de base sont augmentées par l'IA
- Distribution programmatique via les écosystèmes d'API et les réseaux d'agents
- Opérations automatisées — l'IA gérant le support, l'intégration, l'assurance qualité
L'évaluation de l'entreprise comprend désormais ces aspects économiques. Elle ne pénalisera pas une startup native de l'IA pour ne pas avoir respecté les références de 2020. Elle évalue la capacité de l'approche native de l'IA à créer un avantage structurel.
Nous avons également ajouté la sensibilisation aux nouveaux modèles commerciaux : tarification de l'IA basée sur l'utilisation, commerce d'agent à agent, services hybrides humain + IA et distribution API-first.
4. La Dépendance à l'IA comme Risque de Première Importance
Construire avec l'IA crée un effet de levier. Cela crée également une dépendance.
V3.1 introduit le risque technologique comme une dimension de notation dédiée. Elle évalue la concentration des fournisseurs de modèles, la durabilité des coûts de l'API, le risque de réplication open source et la résilience de l'architecture.
Dans le même temps, elle reconnaît que l'exécution native de l'IA réduit certains risques traditionnels. Il est plus facile de transférer les connaissances lorsque les outils d'IA font partie du flux de travail. Les cycles d'itération se compressent lorsque vous livrez quotidiennement au lieu de trimestriellement.
L'évaluation ne considère pas l'IA comme universellement bonne ou mauvaise. Elle évalue le compromis risque/levier spécifique pour chaque idée.
5. Évaluation Plus Intelligente de la Défendabilité
Nous avons mis à jour la façon dont nous évaluons les avantages concurrentiels (moats) pour refléter ce qui crée réellement un avantage durable à l'ère de l'IA :
- Roue de données — des produits qui s'améliorent avec chaque utilisateur (composés, autoréalisateurs)
- Écosystèmes d'agents — des plateformes où les agents d'IA s'intègrent, réalisent des transactions et créent un effet de verrouillage
- Données propriétaires — des ensembles de données uniques qui ne peuvent pas être reproduits avec des informations accessibles au public
- Verrouillage API — l'adoption par les développeurs qui crée des coûts de basculement au fil du temps
- Effets de réseau — toujours puissants, désormais amplifiés par la mise en relation et la recommandation basées sur l'IA
« Nous utilisons l'IA » n'est pas un avantage concurrentiel. Un avantage de données combinant qui s'améliore à chaque interaction en est un.
6. Notation Calibrée
Les systèmes d'IA ont un biais de positivité bien documenté. Ils regroupent les scores dans la fourchette confortable de 5 à 7.
V3.1 ajoute des ancres de calibration explicites :
- 5/10 = médiane. La moitié de toutes les idées se situent en dessous. Ce n'est pas « bien » — c'est moyen.
- 7/10 = 15 % supérieur. Nécessite des preuves vérifiées, pas seulement un récit convaincant.
- 8+/10 = 5 % supérieur. Plusieurs points de preuve indépendants et sourcés.
- 9+/10 = 1 % supérieur. Exceptionnel. Traction vérifiée, avantages concurrentiels prouvés, exécution démontrée.
Lorsque les preuves sont ambiguës, le système diminue par défaut. « Cela semble prometteur » n'est pas un point de données.
7. Suivi de la Version et de la Compilation
Chaque rapport porte désormais un identifiant de version : v3.1 plus une empreinte de compilation.
La version est la génération de l'algorithme. L'empreinte de compilation change chaque fois qu'un composant d'évaluation est mis à jour. Cela signifie que vous pouvez toujours retracer exactement quelle version du moteur a produit un rapport donné.
Cela est important pour la reproductibilité, la piste d'audit et la confiance. Cela fait également partie de notre travail en cours vers l'attestation SOC 2 — la construction de l'infrastructure de transparence et de responsabilité que les utilisateurs institutionnels attendent. Chaque évaluation est traçable, chaque version est documentée, chaque changement est auditable.
Portée et Impact sur la Plateforme
Cette mise à jour de calibration affecte la plateforme publique d'Athanor et toutes les instances partenaires dépendantes exécutant les paramètres d'évaluation par défaut.
Si vous exploitez une plateforme white-label avec des invites personnalisées, des pondérations de notation personnalisées ou des profils de calibration personnalisés, votre comportement d'évaluation n'est pas affecté par cette mise à jour. Les configurations personnalisées restent indépendantes — c'est par conception.
Si vous souhaitez adopter la calibration V3.1 sur votre instance white-label, contactez-nous et nous vous expliquerons les changements.
Façonné par de Vrais Commentaires
V3.1 n'a pas été conçu dans le vide. Chaque modification apportée à cette mise à jour remonte aux modèles que nous avons observés lors de notre programme pilote initial — de vraies évaluations, de vrais commentaires de fondateurs et d'investisseurs, de vrais résultats que nous pouvions mesurer.
Lorsque les fondateurs solos recevaient systématiquement des scores inférieurs malgré une livraison plus rapide que les équipes plus importantes, c'était un signal. Lorsque les startups natives de l'IA étaient pénalisées pour avoir ciblé des marchés sans rapports d'analystes, c'était un signal. Lorsque les risques de dépendance technologique n'étaient pas mis en évidence dans les rapports pour les produits fortement axés sur l'IA, c'était un manque.
Nous construisons GemScore en étroite collaboration avec nos premiers utilisateurs. Leurs commentaires façonnent directement la façon dont le moteur d'évaluation évolue.
Si vous voulez faire partie de cette boucle de rétroaction, rejoignez le programme pilote. Les premiers utilisateurs bénéficient d'un accès direct à l'équipe, d'une priorité sur les demandes de fonctionnalités et de la possibilité d'influencer le fonctionnement de la prochaine génération d'évaluation.
La Route vers la V4
V3.1 est une mise à jour intermédiaire — significative, mais toujours une étape sur la voie de quelque chose de plus grand.
GemScore V4 est un saut générationnel : des rapports statiques à l'intelligence vivante. Modélisation de scénarios. Questions et réponses interactives avec votre évaluation. Projections financières. Surveillance en direct qui se met à jour au fur et à mesure de l'évolution de votre startup.
| V3.1 (Aujourd'hui) | V4 (À venir) | |
|---|---|---|
| Type de rapport | Instantané ponctuel | Document vivant et mis à jour |
| Notation | Double axe avec intervalles de confiance | + Modélisation de scénarios (meilleur/base/pire) |
| Interaction | Lecture seule (avec notes) | Questions et réponses interactives avec l'IA |
| Données de marché | Recherche au moment de l'évaluation | Surveillance continue |
| Modèle financier | Prochaines étapes et jalons | Projections financières complètes |
V3.1 pose les bases philosophiques — évaluation native de l'IA, notation tournée vers l'avenir, calibration basée sur des preuves. V4 construit l'architecture par-dessus.
Ce que Cela Signifie Pour Vous
Si vous êtes un fondateur natif de l'IA : Vous serez évalué sur ce que vous pouvez faire, pas sur le nombre de personnes que vous avez embauchées. Livrez quelque chose. Montrez que cela fonctionne. Le score reflétera votre levier d'exécution.
Si vous construisez sur un marché émergent : Vous ne serez pas pénalisé pour opérer dans un espace sans rapports d'analystes. Rendez votre thèse claire, pointez les vents arrière structurels et laissez l'évaluation évaluer la logique.
Si vous êtes un investisseur : Les rapports font désormais apparaître des signaux natifs de l'IA, des risques de dépendance technologique et un positionnement sur le marché futur, ainsi que des mesures traditionnelles. Chaque rapport est versionné et traçable.
Si vous avez soumis avant V3.1 : Vos rapports précédents portent leur propre identifiant de version. Vous pouvez demander une réévaluation pour voir comment votre idée est notée selon la calibration mise à jour.
La Philosophie
Nous avons construit GemScore V3.1 autour d'une seule question :
Ce fondateur a-t-il le levier, l'adaptabilité et le positionnement nécessaires pour capturer la valeur future ?
Pas : « Est-ce que cela coche les cases traditionnelles des VC ? »
Pas : « Est-ce que cela ressemble à ce qui a fonctionné en 2019 ? »
Le monde change plus vite que les cadres d'évaluation ne peuvent suivre. Les fondateurs natifs de l'IA construisent des choses qui étaient impossibles il y a deux ans. Les marchés se forment autour de changements technologiques qui n'ont pas encore été catalogués. Les anciennes heuristiques — taille de l'équipe, emplacement du bureau, organigrammes traditionnels — sont du bruit.
Le signal est le suivant : Pouvez-vous livrer ? Avez-vous une thèse ? Votre avantage se compose-t-il ?
GemScore V3.1 est conçu pour trouver ce signal.
Vous voulez évaluer votre idée avec V3.1 ? Soumettez votre évaluation ou rejoignez le programme pilote pour obtenir un accès anticipé à V4 et influencer directement l'évolution du moteur.