Старий сценарій мертвий.
Протягом десятиліть оцінка стартапів базувалася на передбачуваному сценарії: Чи є в команді CEO, CTO та експерт у відповідній галузі? Чи є TAM у звіті Gartner? Чи є у них офіс? Скільки людей вони найняли?
У 2026 році цей сценарій дає неправильні відповіді. Соло-засновник з AI-native інструментами та чіткою тезою працює швидше, ніж команда з 10 осіб з 2022 року. Ринки, яких не існує в аналітичних звітах — комерція між агентами, AI-native інфраструктура, децентралізовані інструменти для роботи — це ті місця, де формуються наступні компанії-трильйонники.
GemScore V3.1 — це наша відповідь на цей зсув. Ми перекалібрували кожен параметр оцінювання, щоб оцінювати стартапи через призму того, куди рухається світ — а не де він був.
Це не цикл ажіотажу. Це вертикальний зсув.
Давайте будемо відвертими щодо однієї речі.
Існує поширена розповідь про те, що AI — це "просто бульбашка" — що LLM переоцінені, що технологія досягне плато, що ми озирнемося на цей період так само, як ми озираємося на криптоспекуляції.
Ми не згодні. Фундаментально.
Навіть якщо поточні LLM архітектури виявляться сходинкою, а не кінцевою формою, можливості, які вони вже відкрили, не зникнуть. Генерація коду, аргументація природною мовою, багатомодальний аналіз, автономні агенти — все це постачається у виробничих системах сьогодні, обробляючи реальні робочі навантаження, генеруючи реальну вартість. Це не whitepaper. Це інфраструктура.
Те, що ми переживаємо, — це не цикл ажіотажу. Це вертикальний зсув у тому, що можливо — в тому, як створюється програмне забезпечення, як працює бізнес, як формуються ринки і як створюється вартість. Специфіка технології буде розвиватися. Парадигма не зміниться на зворотну.
GemScore V3.1 побудований на цьому переконанні. Ми оцінюємо стартапи не лише за тим, що AI може робити сьогодні, а й за структурною реальністю того, що AI-native виконання є постійною конкурентною перевагою — незалежно від того, яка архітектура моделі переважає.
Що змінилося (і чому)
1. Важіль виконання, а не кількість працівників
Раніше: "Соло-засновник = ризик. Відсутність CTO = проблема. Мала команда = низька готовність".
Зараз: Ми оцінюємо важіль виконання — здатність постачати, ітерувати та масштабувати. Соло-засновник AI-native, який створив і запустив продукт за три тижні, демонструє більшу здатність до виконання, ніж команда з п'яти осіб, яка "в стелс режимі" протягом року.
Оцінювання тепер розпізнає:
- AI-native робочі процеси — засновники, які будують з інструментами AI розробки, дизайну та дистрибуції
- Швидкість постачання як доказ — швидкий запуск є точкою даних, а не скороченням шляху
- Повна стекова здатність за допомогою AI — одна людина, що охоплює продукт, інжиніринг та дизайн
- Комбінація галузі + AI — глибокі знання галузі посилені AI виконанням
Соло-засновник з сильним послужним списком, продемонстрованою AI грамотністю та експертизою в галузі може отримати стільки ж балів, скільки традиційна команда засновників з трьох осіб. Жодних довільних обмежень. Питання не в тому, "скільки людей?" — а в тому, "скільки ця людина може зробити?"
2. Ринки майбутнього, а не лише TAM звіти
Раніше: "Відсутність даних TAM в аналітичних звітах = низький ринковий бал".
Зараз: Якщо стартап націлений на ринок, який ще не існує в аналітичних базах даних, ми не автоматично його штрафуємо. Натомість ми оцінюємо якість тези:
- Які структурні попутні вітри створюють цей ринок?
- Які суміжні ринки служать проксі для оцінки розміру?
- Які існують ранні сигнали прийняття? (Тенденції фінансування, зростання екосистеми розробників, прискорення використання API)
Агентна економіка — де AI агенти здійснюють транзакції, виконують завдання та діють від імені людей — реальна та зростає. Наша система оцінювання тепер визнає ринки, що розвиваються, і AI-native ринки як легітимну категорію, оцінювану за якістю тези та структурною логікою, а не штрафовану за відсутність традиційних даних.
3. AI-Native Економіка
Традиційні SaaS бенчмарки припускають 70-80% валової маржі, залучення через продажі та процеси, що виконуються людьми. AI-native бізнеси мають фундаментально іншу структуру витрат:
- Вища маржа, коли основні функції доповнені AI
- Програмний дистрибутив через API екосистеми та мережі агентів
- Автоматизовані операції — AI обробляє підтримку, адаптацію, забезпечення якості
Оцінка бізнесу тепер розуміє цю економіку. Вона не буде штрафувати AI-native стартап за те, що він не відповідає бенчмаркам 2020 року. Вона оцінює, чи створює AI-native підхід структурну перевагу.
Ми також додали обізнаність про нові зразки бізнес-моделей: ціноутворення AI на основі використання, комерція між агентами, гібридні послуги людина + AI та дистрибутив API-first.
4. AI Залежність як першочерговий ризик
Побудова з AI створює важіль (leverage). Вона також створює залежність.
V3.1 представляє технологічний ризик як окремий параметр для оцінювання. Він оцінює концентрацію постачальників моделей, стійкість витрат на API, ризик реплікації з відкритим кодом та стійкість архітектури.
У той же час, він визнає, що AI-native виконання зменшує певні традиційні ризики. Передача знань легша, коли AI інструменти є частиною робочого процесу. Цикли ітерацій стискаються, коли ви відправляєте щодня, а не щоквартально.
Оцінка не розглядає AI як універсальне добро чи зло. Вона оцінює конкретні компроміси ризику/важеля для кожної ідеї.
5. Розумніша оцінка захищеності
Ми оновили те, як ми оцінюємо рови (moats), щоб відобразити те, що насправді створює довготривалу перевагу в епоху AI:
- Data flywheels — продукти, які стають кращими з кожним користувачем (збільшення, самопідсилення)
- Агентські екосистеми — платформи, де AI агенти інтегруються, здійснюють транзакції та створюють lock-in (прив'язку до продукту)
- Власні дані — унікальні набори даних, які не можна відтворити з загальнодоступною інформацією
- API lock-in — прийняття розробниками, що створює витрати на перехід з часом
- Мережеві ефекти — все ще потужні, тепер посилені AI-driven підбором та рекомендацією
"Ми використовуємо AI" не є ровом. Посилення переваг даних, які покращуються з кожною взаємодією, є ним.
6. Відкалібрована оцінка
AI системи мають добре задокументоване упередження позитивності. Вони кластеризують бали в комфортному діапазоні 5-7.
V3.1 додає явні якорі калібрування:
- 5/10 = медіана. Половина всіх ідей отримує нижчу оцінку. Це не "добре" — це середнє.
- 7/10 = топ 15%. Вимагає підтверджених доказів, а не лише переконливого опису.
- 8+/10 = топ 5%. Багато незалежних, отриманих з джерел доказів.
- 9+/10 = топ 1%. Винятково. Перевірена тяга, доведені рови, продемонстроване виконання.
Коли докази неоднозначні, система за замовчуванням знижує оцінку. "Звучить багатообіцяюче" не є точкою даних.
7. Відстеження версій + збірок
Кожен звіт тепер має ідентифікатор версії: v3.1 плюс відбиток збірки.
Версія — це покоління алгоритму. Відбиток збірки змінюється кожного разу, коли оновлюється будь-який компонент оцінювання. Це означає, що ви завжди можете відстежити саме те, яка версія двигуна створила даний звіт.
Це важливо для відтворюваності, аудиторського сліду та довіри. Це також частина нашої поточної роботи над атестацією SOC 2 — побудовою інфраструктури прозорості та підзвітності, яку очікують інституційні користувачі. Кожна оцінка піддається відстеженню, кожна версія задокументована, кожна зміна піддається аудиту.
Область застосування та вплив на платформу
Це оновлення калібрування впливає на публічну платформу Athanor та всі залежні партнерські instance, які працюють з налаштуваннями оцінювання за замовчуванням.
Якщо ви керуєте whitelabel платформою з власними prompt'ами, власними ваговими коефіцієнтами оцінювання або власними профілями калібрування, на вашу поведінку оцінювання це оновлення не впливає. Власні конфігурації залишаються незалежними — це зроблено навмисно.
Якщо ви хочете прийняти калібрування V3.1 у вашому whitelabel instance, зв'яжіться з нами, і ми обговоримо зміни.
Сформовано на основі реального зворотного зв'язку
V3.1 не був розроблений у вакуумі. Кожна зміна в цьому оновленні пов'язана зі зразками, які ми спостерігали під час нашої ранньої пілотної програми — реальні оцінювання, реальний зворотний зв'язок від засновників та інвесторів, реальні результати, які ми могли виміряти.
Коли соло-засновники постійно отримували нижчі бали, незважаючи на швидшу доставку, ніж більші команди, це був сигнал. Коли AI-native стартапи штрафували за націлювання на ринки без аналітичних звітів, це був сигнал. Коли ризики технологічної залежності не з'являлися у звітах про продукти з інтенсивним використанням AI, це була прогалина.
Ми будуємо GemScore у тісній співпраці з нашими першими користувачами. Їх відгуки безпосередньо формують те, як розвивається система оцінювання.
Якщо ви хочете бути частиною цього циклу зворотного зв'язку, приєднайтеся до пілотної програми. Перші користувачі отримують прямий доступ до команди, пріоритет у запитах на функції та можливість впливати на те, як працюватиме наступне покоління оцінювання.
Шлях до V4
V3.1 — це проміжне оновлення — значуще, але все ще крок на шляху до чогось більшого.
GemScore V4 — це покоління стрибка: від статичних звітів до живого інтелекту. Моделювання сценаріїв. Інтерактивні запитання та відповіді з вашою оцінкою. Фінансові прогнози. Живий моніторинг, який оновлюється в міру розвитку вашого стартапу.
| V3.1 (Сьогодні) | V4 (Незабаром) | |
|---|---|---|
| Тип звіту | Знімок на певний момент часу | Живий, оновлюваний документ |
| Оцінювання | Двовісний з довірчими інтервалами | + Моделювання сценаріїв (найкращий/базовий/найгірший) |
| Взаємодія | Лише для читання (з примітками) | Інтерактивні запитання та відповіді з AI |
| Ринкові дані | Дослідження під час оцінювання | Постійний моніторинг |
| Фінансова модель | Наступні кроки та етапи | Повні фінансові прогнози |
V3.1 закладає філософський фундамент — AI-native оцінювання, перспективне оцінювання, калібрування на основі доказів. V4 будує архітектуру зверху.
Що це означає для вас
Якщо ви AI-native засновник: Вас будуть оцінювати за те, що ви можете робити, а не за те, скільки людей ви найняли. Відправте щось. Покажіть, що це працює. Оцінка відображатиме ваш важіль виконання.
Якщо ви будуєте на ринку, що розвивається: Вас не будуть штрафувати за роботу в просторі без аналітичних звітів. Зробіть свою тезу чіткою, вкажіть на структурні попутні вітри та дозвольте оцінюванню оцінити логіку.
Якщо ви інвестор: Звіти тепер відображають AI-native сигнали, ризики технологічної залежності та позиціонування на ринку майбутнього поряд із традиційними показниками. Кожен звіт версіонований та піддається відстеженню.
Якщо ви подали заявку до V3.1: Ваші попередні звіти мають власний ідентифікатор версії. Ви можете запросити повторне оцінювання, щоб побачити, як ваша ідея оцінюється з оновленим калібруванням.
Філософія
Ми побудували GemScore V3.1 навколо одного питання:
Чи має цей засновник важіль, адаптивність та позиціонування, щоб захопити майбутню цінність?
Не: "Чи відповідає це традиційним параметрам VC?"
Не: "Чи виглядає це так, як те, що працювало в 2019 році?"
Світ змінюється швидше, ніж встигають оновлюватися рамки оцінювання. AI-native засновники будують речі, які були неможливими два роки тому. Ринки формуються навколо технологічних змін, які ще не було каталогізовано. Стара евристика — розмір команди, розташування офісу, традиційні організаційні схеми — це шум.
Сигнал: Чи можете ви організувати постачання? Чи є у вас теза? Чи є у вас перевага, що збільшується?
GemScore V3.1 створений для пошуку цього сигналу.
Хочете оцінити свою ідею за допомогою V3.1? Подайте заявку на оцінювання або приєднайтеся до пілотної програми, щоб отримати ранній доступ до V4 і безпосередній вплив на те, як розвивається двигун.