Das alte Drehbuch ist tot.
Jahrzehntelang folgte die Startup-Bewertung einem vorhersehbaren Schema: Hat das Team einen CEO, CTO und Fachexperten? Befindet sich der TAM in einem Gartner-Bericht? Haben sie ein Büro? Wie viele Leute haben sie eingestellt?
Im Jahr 2026 liefert dieses Drehbuch die falschen Antworten. Ein Solo-Gründer mit KI-nativen Tools und einer klaren These liefert schneller als ein 10-köpfiges Team aus dem Jahr 2022. Märkte, die in Analystenberichten nicht existieren — Agent-to-Agent-Handel, KI-native Infrastruktur, dezentrale Arbeitswerkzeuge — sind der Ort, an dem die nächsten Billionen-Dollar-Unternehmen entstehen.
GemScore V3.1 ist unsere Antwort auf diese Verschiebung. Wir haben jede Bewertungsdimension neu kalibriert, um Startups durch die Linse zu bewerten, wohin sich die Welt entwickelt — nicht wo sie war.
Dies ist kein Hype-Zyklus. Dies ist eine vertikale Verschiebung.
Seien wir direkt.
Es gibt ein wiederkehrendes Narrativ, dass KI "nur eine Blase" ist — dass LLMs überbewertet sind, dass die Technologie stagnieren wird, dass wir auf diese Periode so zurückblicken werden, wie wir auf die Krypto-Spekulation zurückblicken.
Wir sind anderer Meinung. Grundsätzlich.
Selbst wenn sich die aktuellen LLM-Architekturen als ein Sprungbrett und nicht als die endgültige Form herausstellen, werden die Fähigkeiten, die sie bereits freigesetzt haben, nicht verschwinden. Code-Generierung, natürliche Sprachverarbeitung, multimodale Analyse, autonome Agenten — diese werden bereits heute in Produktionssystemen ausgeliefert, die reale Arbeitslasten bewältigen und realen Mehrwert generieren. Dies ist kein Whitepaper. Es ist Infrastruktur.
Was wir gerade erleben, ist kein Hype-Zyklus. Es ist eine vertikale Verschiebung dessen, was möglich ist — wie Software erstellt wird, wie Unternehmen arbeiten, wie Märkte entstehen und wie Wert geschaffen wird. Die Einzelheiten der Technologie werden sich weiterentwickeln. Das Paradigma wird sich nicht umkehren.
GemScore V3.1 basiert auf dieser Überzeugung. Wir bewerten Startups nicht nur danach, was KI heute kann, sondern auch nach der strukturellen Realität, dass KI-native Ausführung ein dauerhafter Wettbewerbsvorteil ist — unabhängig davon, welche Modellarchitektur sich durchsetzt.
Was sich geändert hat (und warum)
1. Execution Leverage, nicht Mitarbeiterzahl
Vorher: "Solo-Gründer = Risiko. Fehlender CTO = Problem. Kleines Team = geringe Bereitschaft."
Jetzt: Wir bewerten Execution Leverage — die Fähigkeit zu liefern, zu iterieren und zu skalieren. Ein KI-nativer Solo-Gründer, der in drei Wochen ein Produkt gebaut und auf den Markt gebracht hat, beweist mehr Ausführungsfähigkeit als ein fünfköpfiges Team, das seit einem Jahr "im Stealth-Modus" ist.
Die Bewertung erkennt nun Folgendes an:
- KI-native Workflows — Gründer, die mit KI-Entwicklungs-, Design- und Vertriebstools entwickeln
- Shipping Speed als Beweis — schnelles Launching ist ein Datenpunkt, keine Abkürzung
- Full-Stack-Fähigkeit via KI — eine Person, die Produkt, Engineering und Design abdeckt
- Domain + KI-Kombination — tiefes Branchenwissen, das durch KI-Ausführung verstärkt wird
Ein Ein-Personen-Gründer mit einer starken Erfolgsbilanz, nachgewiesener KI-Kompetenz und Fachwissen kann genauso gut abschneiden wie ein traditionelles dreiköpfiges Gründerteam. Keine willkürlichen Obergrenzen. Die Frage ist nicht "wie viele Leute?", sondern "wie viel kann diese Person erledigen?"
2. Zukünftige Märkte, nicht nur TAM-Berichte
Vorher: "Keine TAM-Daten in Analystenberichten = niedrige Marktbewertung."
Jetzt: Wenn ein Startup auf einen Markt abzielt, der in Analystendatenbanken noch nicht existiert, bestrafen wir es nicht automatisch. Stattdessen bewerten wir die Qualität der These:
- Welche strukturellen Rückenwinde schaffen diesen Markt?
- Welche angrenzenden Märkte dienen als Proxys für die Grössenbestimmung?
- Welche frühen Adoptionssignale gibt es? (Finanzierungstrends, Wachstum des Entwicklerökosystems, beschleunigte API-Nutzung)
Die Agenten-Ökonomie — in der KI-Agenten im Namen von Menschen Transaktionen durchführen, Aufgaben ausführen und arbeiten — ist real und wächst. Unsere Bewertungs-Engine erkennt nun aufkommende und KI-native Märkte als legitime Kategorie an, die anhand der Qualität der These und der strukturellen Logik bewertet wird und nicht für fehlende traditionelle Daten bestraft wird.
3. KI-native Ökonomie
Traditionelle SaaS-Benchmarks gehen von Bruttomargen von 70-80 %, vertriebsgetriebener Akquisition und von Menschen betriebenen Prozessen aus. KI-native Unternehmen haben grundlegend andere Kostenstrukturen:
- Höhere Margen, wenn Kernfunktionen KI-gestützt sind
- Programmatische Verteilung über API-Ökosysteme und Agentennetzwerke
- Automatisierte Abläufe — KI übernimmt Support, Onboarding, Qualitätssicherung
Die Unternehmensbewertung versteht diese Wirtschaftlichkeit nun. Sie wird ein KI-natives Startup nicht dafür bestrafen, dass es nicht mit den Benchmarks von 2020 übereinstimmt. Sie bewertet, ob der KI-native Ansatz einen strukturellen Vorteil schafft.
Wir haben auch das Bewusstsein für neue Geschäftsmodellmuster hinzugefügt: nutzungsbasierte KI-Preise, Agent-to-Agent-Handel, hybride Mensch+KI-Dienste und API-First-Distribution.
4. KI-Abhängigkeit als erstklassiges Risiko
Das Bauen mit KI schafft Hebelwirkung. Es schafft auch Abhängigkeit.
V3.1 führt Technologierisiko als dedizierte Bewertungsdimension ein. Es bewertet die Konzentration der Modellanbieter, die Nachhaltigkeit der API-Kosten, das Risiko der Open-Source-Replikation und die Widerstandsfähigkeit der Architektur.
Gleichzeitig wird erkannt, dass KI-native Ausführung bestimmte traditionelle Risiken reduziert. Wissenstransfer ist einfacher, wenn KI-Tools Teil des Workflows sind. Iterationszyklen werden komprimiert, wenn Sie täglich statt vierteljährlich liefern.
Die Bewertung behandelt KI nicht als durchweg gut oder schlecht. Sie bewertet den spezifischen Risiko-/Leverage-Tradeoff für jede Idee.
5. Intelligentere Defensibility-Bewertung
Wir haben aktualisiert, wie wir Moats bewerten, um widerzuspiegeln, was im KI-Zeitalter tatsächlich einen dauerhaften Vorteil schafft:
- Daten-Flywheels — Produkte, die mit jedem Benutzer besser werden (aufbauend, sich selbst verstärkend)
- Agenten-Ökosysteme — Plattformen, auf denen KI-Agenten integrieren, Transaktionen durchführen und Lock-in erzeugen
- Proprietäre Daten — einzigartige Datensätze, die nicht mit öffentlich verfügbaren Informationen repliziert werden können
- API-Lock-in — Entwicklerakzeptanz, die im Laufe der Zeit Wechselkosten verursacht
- Netzwerkeffekte — immer noch mächtig, jetzt verstärkt durch KI-gestütztes Matching und Empfehlung
"Wir nutzen KI" ist kein Moat. Ein sich verstärkender Datenvorteil, der sich mit jeder Interaktion verbessert, ist es.
6. Kalibrierte Bewertung
KI-Systeme haben eine gut dokumentierte Positivitätsverzerrung. Sie clustern Scores im komfortablen Bereich von 5-7.
V3.1 fügt explizite Kalibrierungsanker hinzu:
- 5/10 = Median. Die Hälfte aller Ideen schneidet darunter ab. Es ist nicht "okay" — es ist durchschnittlich.
- 7/10 = Top 15 %. Erfordert verifizierte Beweise, nicht nur eine überzeugende Erzählung.
- 8+/10 = Top 5 %. Mehrere unabhängige, nachgewiesene Beweispunkte.
- 9+/10 = Top 1 %. Aussergewöhnlich. Verifizierte Traktion, nachgewiesene Moats, demonstrierte Ausführung.
Wenn die Beweislage uneindeutig ist, wird das System niedriger eingestellt. "Klingt vielversprechend" ist kein Datenpunkt.
7. Version + Build-Tracking
Jeder Bericht trägt nun eine Versionskennung: v3.1 plus einen Build-Fingerabdruck.
Die Version ist die Algorithmus-Generation. Der Build-Fingerabdruck ändert sich, wenn eine Bewertungskomponente aktualisiert wird. Das bedeutet, dass Sie immer genau nachvollziehen können, welche Version der Engine einen bestimmten Bericht erstellt hat.
Dies ist wichtig für Reproduzierbarkeit, Audit Trail und Vertrauen. Es ist auch Teil unserer laufenden Arbeit in Richtung SOC 2 Attestation — Aufbau der Transparenz- und Verantwortlichkeitsinfrastruktur, die institutionelle Nutzer erwarten. Jede Bewertung ist nachvollziehbar, jede Version ist dokumentiert, jede Änderung ist auditierbar.
Geltungsbereich und Plattformauswirkungen
Dieses Calibration Update betrifft die öffentliche Plattform von Athanor und alle abhängigen Partnerinstanzen, die Standardbewertungseinstellungen ausführen.
Wenn Sie eine Whitelabel-Plattform mit benutzerdefinierten Prompts, benutzerdefinierten Score-Gewichtungen oder benutzerdefinierten Calibration-Profilen betreiben, wird Ihr Bewertungsverhalten durch dieses Update nicht beeinträchtigt. Benutzerdefinierte Konfigurationen bleiben unabhängig — das ist so gewollt.
Wenn Sie die V3.1-Calibration auf Ihrer Whitelabel-Instanz übernehmen möchten, kontaktieren Sie uns und wir werden die Änderungen durchgehen.
Geprägt durch echtes Feedback
V3.1 wurde nicht in einem Vakuum entwickelt. Jede Änderung in diesem Update geht auf Muster zurück, die wir während unseres frühen Pilotprogramms beobachtet haben — reale Bewertungen, echtes Feedback von Gründern und Investoren, reale Ergebnisse, die wir messen konnten.
Wenn Solo-Gründer trotz schnellerer Lieferung als grössere Teams durchweg niedrigere Punktzahlen erhielten, war das ein Signal. Wenn KI-native Startups dafür bestraft wurden, dass sie auf Märkte ohne Analystenberichte abzielten, war das ein Signal. Wenn Technologierisiken in Berichten für KI-lastige Produkte nicht auftauchten, war das eine Lücke.
Wir bauen GemScore in enger Zusammenarbeit mit unseren frühen Nutzern auf. Ihr Feedback prägt direkt, wie sich die Bewertungs-Engine entwickelt.
Wenn Sie Teil dieser Feedbackschleife sein möchten, treten Sie dem Pilotprogramm bei. Frühe Nutzer erhalten direkten Zugang zum Team, Priorität bei Feature-Anfragen und die Möglichkeit, Einfluss darauf zu nehmen, wie die nächste Generation der Bewertung funktioniert.
Der Weg zu V4
V3.1 ist ein Zwischen-Update — ein sinnvolles, aber immer noch ein Schritt auf dem Weg zu etwas Grösserem.
GemScore V4 ist ein Generationssprung: von statischen Berichten zu lebendiger Intelligenz. Szenario-Modellierung. Interaktives Q&A mit Ihrer Bewertung. Finanzprognosen. Live-Überwachung, die sich mit der Entwicklung Ihres Startups aktualisiert.
| V3.1 (Heute) | V4 (Kommt) | |
|---|---|---|
| Berichtstyp | Point-in-Time-Snapshot | Lebendiges, aktualisiertes Dokument |
| Bewertung | Dual-Achse mit Konfidenzintervallen | + Szenario-Modellierung (best/base/worst) |
| Interaktion | Nur lesen (mit Notizen) | Interaktives Q&A mit der KI |
| Marktdaten | Recherche zum Bewertungszeitpunkt | Kontinuierliche Überwachung |
| Finanzmodell | Nächste Schritte & Meilensteine | Vollständige Finanzprognosen |
V3.1 legt das philosophische Fundament — KI-native Bewertung, zukunftsgerichtete Bewertung, evidenzbasierte Calibration. V4 baut die Architektur darauf auf.
Lesen Sie die vollständige V4-Vision
Was das für Sie bedeutet
Wenn Sie ein KI-nativer Gründer sind: Sie werden nach dem bewertet, was Sie tun können, nicht danach, wie viele Leute Sie eingestellt haben. Bringen Sie etwas auf den Markt. Zeigen Sie, dass es funktioniert. Die Punktzahl spiegelt Ihren Execution Leverage wider.
Wenn Sie in einem aufstrebenden Markt aufbauen: Sie werden nicht dafür bestraft, dass Sie in einem Raum ohne Analystenberichte tätig sind. Stellen Sie Ihre These klar dar, weisen Sie auf strukturelle Rückenwinde hin und lassen Sie die Bewertung die Logik beurteilen.
Wenn Sie ein Investor sind: Berichte zeigen jetzt KI-native Signale, Technologierisiken und zukünftige Marktpositionierung neben traditionellen Kennzahlen auf. Jeder Bericht ist versioniert und nachvollziehbar.
Wenn Sie sich vor V3.1 angemeldet haben: Ihre vorherigen Berichte tragen ihre eigene Versionskennung. Sie können eine Neubewertung anfordern, um zu sehen, wie Ihre Idee unter der aktualisierten Calibration abschneidet.
Die Philosophie
Wir haben GemScore V3.1 um eine einzige Frage herum aufgebaut:
Hat dieser Gründer den Leverage, die Anpassungsfähigkeit und die Positionierung, um zukünftigen Wert zu generieren?
Nicht: "Erfüllt dies traditionelle VC-Kriterien?"
Nicht: "Sieht das so aus, wie es 2019 funktioniert hat?"
Die Welt verändert sich schneller, als Bewertungsrahmen mithalten können. KI-native Gründer bauen Dinge, die vor zwei Jahren unmöglich waren. Märkte bilden sich um technologische Verschiebungen herum, die noch nicht katalogisiert wurden. Die alten Heuristiken — Teamgrösse, Bürolage, traditionelle Organigramme — sind Rauschen.
Signal ist: Können Sie ausliefern? Haben Sie eine These? Verstärkt sich Ihr Vorteil?
GemScore V3.1 wurde entwickelt, um dieses Signal zu finden.
Möchten Sie Ihre Idee unter V3.1 bewerten? Reichen Sie Ihre Bewertung ein oder treten Sie dem Pilotprogramm bei, um frühzeitig auf V4 zugreifen und direkten Einfluss auf die Entwicklung der Engine nehmen zu können.