Athanor Team 11 min de lectura

Cómo Nuestra IA Evalúa Realmente Tu Startup

Cinco agentes de IA especializados, investigación web en tiempo real, un debate estructurado y un juez final. Aquí está exactamente cómo funciona GemScore por dentro, sin cajas negras.

AI evaluation GemScore startup scoring dual-axis scoring confidence intervals investment memo
Cómo Nuestra IA Evalúa Realmente Tu Startup

La mayoría de las herramientas de IA son cajas negras. Introduces algo, obtienes un número y se supone que debes confiar en él.

No creemos que eso sea suficiente, especialmente cuando estás evaluando el trabajo de la vida de alguien.

Esta publicación explica cómo GemScore evalúa las startups: los agentes, la investigación, el debate, la puntuación. Sin marketing. Sin dar rodeos. Solo el sistema.


La Visión General de 60 Segundos

Cuando envías una idea para su evaluación, esto es lo que sucede:

  1. Cinco agentes de IA especializados analizan tu startup en paralelo, cada uno centrado en una dimensión diferente.
  2. Cada agente ejecuta un proceso de dos fases: primero investigación web, luego análisis estructurado.
  3. Un Agente de Validación verifica los cinco agentes en busca de contradicciones y afirmaciones no verificadas.
  4. Un Optimista y un Pesimista debaten los méritos de tu startup.
  5. Un Juez Final sopesa el debate y produce puntuaciones calibradas.
  6. Tu informe se genera con cadenas de evidencia, intervalos de confianza y un memorando al estilo IC (Investment Committee).

Tiempo total: 8-15 minutos para una evaluación completa. Cada afirmación rastreada hasta una fuente. Cada puntuación justificada.

Así es como se ve el informe final (puedes ver un informe de demostración en vivo para verlo en acción):

┌─────────────────────────────────────────────────────────────────┐
│  INFORME DE EVALUACIÓN DE GEMSCORE                                      │
│  Proyecto: AcmeHealth — Triaje de Pacientes Impulsado por IA                 │
│  Evaluado: 9 de feb. de 2026                                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│   POTENCIAL           PREPARACIÓN            RECOMENDACIÓN         │
│   ┌─────────┐        ┌─────────┐          ┌──────────────┐      │
│   │   78    │        │   52    │          │    SÍ       │      │
│   │  /100   │        │  /100   │          │              │      │
│   └─────────┘        └─────────┘          └──────────────┘      │
│   rango: 72-84        rango: 44-60                               │
│   confianza: Media  confianza: Media                          │
│                                                                   │
│   TL;DR: Un equipo fundador fuerte con experiencia en el dominio de la salud.  │
│   TAM verificado en $8.2B. MVP en piloto con 3 hospitales.          │
│   Riesgo clave: vía regulatoria poco clara, sin líder de cumplimiento.      │
│   Recomendación: contratar un oficial de cumplimiento, asegurar 2 pilotos más.      │
│                                                                   │
│   [Informe Completo]  [Memorándum de Inversión]  [Gráficos]  [Sala de Datos]       │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Los Cinco Agentes

Cada agente es un especialista. Se ejecutan en paralelo, no secuencialmente, porque una perspectiva fresca importa más que el consenso.

Agente Enfoque Qué Evalúa
Equipo Personas Antecedentes de los fundadores, experiencia en el dominio, historial de ejecución, integridad del equipo
Mercado Oportunidad Validación TAM/SAM/SOM, tendencias de crecimiento, panorama competitivo, señales de demanda
Negocio Modelo Modelo de ingresos, economía unitaria, escalabilidad, eficiencia de capital
Producto Solución Ajuste problema-solución, factibilidad técnica, claridad del MVP, defensa, UVP (Propuesta Única de Valor)
Riesgo Amenazas Amenazas competitivas, riesgos de ejecución, fracasos históricos en el espacio

Los pesos están calibrados para reflejar las prioridades de inversión en las primeras etapas. El equipo tiene el mayor peso, lo cual es consistente con cómo la mayoría de los VC evalúan en pre-semilla y semilla. A medida que las startups maduran, el producto y el modelo de negocio se vuelven naturalmente más importantes. El peso exacto es parte de nuestro modelo de puntuación propietario y se ajusta continuamente en función de los resultados reales.

Así es como se ve el desglose por agente en un informe:

┌─────────────────────────────────────────────────────────────────┐
│  DESGLOSE DE PUNTUACIONES DE LOS AGENTES                                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  EQUIPO        ████████████████████░░░░  Potencial: 8.2 / 10      │
│              ██████████████░░░░░░░░░░  Preparación: 6.1 / 10      │
│              Confianza: Alta — 3 fundadores verificados a través de   │
│              registros públicos. El CTO tiene 2 salidas previas confirmadas.           │
│                                                                   │
│  MERCADO      ████████████████░░░░░░░░  Potencial: 7.4 / 10      │
│              ██████████████████░░░░░░  Preparación: 6.8 / 10      │
│              Confianza: Media — TAM verificado a través de Gartner.      │
│              Estimación de SAM sin verificar (solo afirmación del usuario).          │
│                                                                   │
│  NEGOCIO    ██████████████░░░░░░░░░░  Potencial: 6.5 / 10      │
│              ████████░░░░░░░░░░░░░░░░  Preparación: 3.8 / 10      │
│              Confianza: Baja — Economía unitaria no proporcionada.      │
│              Modelo de ingresos basado en puntos de referencia SaaS comparables.  │
│                                                                   │
│  PRODUCTO     ██████████████████░░░░░░  Potencial: 7.8 / 10      │
│              ██████████░░░░░░░░░░░░░░  Preparación: 4.5 / 10      │
│              Confianza: Media — Existe MVP pero no hay datos de uso.  │
│              La arquitectura técnica parece sólida.                │
│                                                                   │
│  RIESGO        ████████████░░░░░░░░░░░░  Potencial: 5.6 / 10      │
│              ██████████████░░░░░░░░░░  Preparación: 6.2 / 10      │
│              Confianza: Alta — 4 competidores directos identificados. │
│              El riesgo regulatorio se señala como la principal preocupación.          │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

El Patrón de Doble Agente: Investigación + Análisis

Aquí es donde se pone interesante. Cada uno de los cinco agentes es en realidad dos agentes que trabajan en secuencia.

Fase 1: El Investigador (Búsqueda Web)

El primer agente busca evidencia en la web abierta. No confía en tus afirmaciones, las verifica.

Para el Agente del Equipo, esto significa:

  • Cruzar las reclamaciones de los fundadores con los registros públicos, la prensa y los perfiles profesionales
  • Comprobar empresas anteriores y funciones reclamadas
  • Validar las afirmaciones de experiencia en el dominio

Para el Agente del Mercado:

  • Validar tus afirmaciones TAM/SAM/SOM contrastándolas con informes de la industria y datos de analistas.
  • Comprobar las tendencias de crecimiento en tu sector a partir de fuentes actuales
  • Mapear el panorama competitivo a partir de datos en vivo, no de bases de datos obsoletas

Para el Agente de Riesgo:

  • Encontrar competidores que no mencionaste
  • Investigar los fracasos históricos en tu espacio
  • Identificar los riesgos regulatorios y de ejecución específicos de tu mercado

El investigador entrega hallazgos en lenguaje natural, evidencia pura, no puntuaciones.

Más allá de la Búsqueda Web: Fuentes de Datos Verificadas

La búsqueda web es la línea de base, no el techo. Estamos ampliando continuamente la capa de investigación con integraciones directas de API que devuelven datos verificados y estructurados, no web scrapes:

  • Perfiles profesionales: API de LinkedIn para historial de empleo, educación y endosos.
  • Datos financieros: Stripe, procesadores de pago para la verificación de ingresos.
  • Análisis de uso: Google Analytics, Mixpanel para métricas de tracción.
  • Actividad del código: GitHub para velocidad de desarrollo y señales del tamaño del equipo.
  • Registros corporativos: Registros de empresas, bases de datos de patentes, presentaciones de la SEC.
  • Datos de mercado: API de analistas de la industria para la validación de TAM y puntos de referencia.

Cada integración añade una capa de fuente por encima de la búsqueda web. Cuando el Agente del Equipo puede verificar el rol de un fundador a través de una API profesional en lugar de una mención en un blog, el nivel de confianza aumenta, y también lo hace la fiabilidad de la puntuación.

Estamos añadiendo nuevas fuentes verificadas cada trimestre. El objetivo: reducir la dependencia de la búsqueda web con el tiempo y avanzar hacia un mundo en el que la mayoría de las afirmaciones se verifiquen programáticamente.

Fase 2: El Analista (Puntuación Estructurada)

El segundo agente toma los resultados de la investigación y produce un análisis estructurado:

  • Puntuaciones de doble eje: Cada dimensión obtiene una puntuación de Potencial (0-10) y una puntuación de Preparación (0-10).
  • Intervalos de confianza: Cada puntuación incluye límites bajo/alto basados en la calidad de la evidencia.
  • Cadenas de evidencia: Cada afirmación vinculada a su fuente con un nivel de confianza.
  • Justificación: Justificación escrita para cada puntuación.

¿Por qué dos agentes separados? Diferentes modelos de IA sobresalen en diferentes tareas. Los modelos optimizados para la búsqueda web no son los mismos que producen el mejor análisis estructurado. Así que dividimos el trabajo: un agente recopila, un agente razona. Cada uno utiliza el modelo adecuado para su trabajo.


Puntuación de Doble Eje: Potencial vs. Preparación

La mayoría de los sistemas de puntuación te dan un solo número. Eso es como calificar un restaurante en una escala de 1-10: colapsa demasiadas dimensiones en una.

GemScore utiliza dos ejes:

Potencial (0-100): ¿Qué tan grande podría ser esto si todo sale bien?

  • Tamaño y crecimiento del mercado
  • Techo de capacidad del equipo
  • Escalabilidad del modelo de negocio
  • Potencial de diferenciación técnica

Preparación (0-100): ¿Qué tan preparada está esta startup para ejecutar ahora mismo?

  • Integridad y disponibilidad del equipo
  • Validación del mercado y tracción
  • Claridad del modelo de negocio y economía unitaria
  • Etapa de desarrollo del producto

Esto crea cuatro cuadrantes significativos:

                         PREPARACIÓN
                   Baja              Alta
              ┌──────────────┬──────────────┐
              │              │              │
    Alta      │  Gran Visión  │   Candidato  │
              │  Necesita Ayuda  │   Fuerte     │
 POTENCIAL    │              │              │
              ├──────────────┼──────────────┤
              │              │              │
    Baja       │   Repensar    │   Negocio Sólido  │
              │   Necesario     │   Bajo Potencial │
              │              │              │
              └──────────────┴──────────────┘

Una idea en etapa temprana naturalmente tendrá una puntuación alta en Potencial y más baja en Preparación, eso es de esperar. Una startup madura debería tener una puntuación alta en ambos. Los ejes cuentan diferentes historias a diferentes audiencias: los fundadores se preocupan por las brechas de Preparación que pueden solucionar; los inversores se preocupan por el potencial alcista en el que pueden apostar.

La Prueba de Airbnb 2008

Calibramos nuestro sistema con startups históricas evaluadas como si las hubiéramos visto en su etapa más temprana. Tomemos Airbnb en 2008:

  • Potencial: Debería tener una puntuación alta, mercado masivo (viajes), efectos de red, economía de plataforma
  • Preparación: Debería tener una puntuación baja, sin tracción, concepto no probado, equipo delgado

Si nuestro sistema puntuara a Airbnb 2008 como "Bajo Potencial", como muchos VCs hicieron en ese momento, eso sería un fallo de calibración. El sistema de doble eje evita el error común de penalizar las grandes ideas por ser tempranas.


Intervalos de Confianza: Honestidad Sobre la Incertidumbre

Cada puntuación en un informe GemScore incluye un rango de confianza:

┌─────────────────────────────────────────────────────────────────┐
│  VISUALIZACIÓN DE CONFIANZA — Potencial de Mercado                     │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│    0        25        50        75       100                     │
│    ├─────────┼─────────┼─────────┼─────────┤                     │
│                              [====●====]                          │
│                              68   74   80                         │
│                                                                   │
│    Puntuación: 74        Rango: 68 — 80        Confianza: Media     │
│                                                                   │
│    Interpretación: Estamos razonablemente seguros de que la puntuación verdadera     │
│    está entre 68 y 80. El ancho refleja la calidad de la evidencia.    │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Rango estrecho (ej., 72-76): Evidencia sólida de múltiples fuentes verificadas. Alta confianza. Rango amplio (ej., 55-80): Evidencia limitada, más incertidumbre. La verdadera posición de la startup podría variar significativamente.

Preferimos mostrarte incertidumbre honesta que precisión falsa.

Niveles de Evidencia

No todas las evidencias son iguales. Clasificamos la evidencia en niveles de confianza:

Nivel Tipos de Fuentes Señal
API-Verificado Datos directos de API (ingresos de Stripe, API de LinkedIn, Google Analytics) Más alta: verificado por la máquina, resistente a la manipulación
Verificado Presentaciones públicas, prensa confirmada, registros gubernamentales, bases de datos de patentes Muy alta: verificable independientemente
Corroborado Múltiples fuentes web independientes que están de acuerdo Alta: referencia cruzada
Parcial Perfiles profesionales, menciones de una sola fuente Moderada: plausible pero no confirmada
Afirmado Enviado por el usuario sin evidencia externa Línea de base: aceptado pero descontado
Ausente No se encontró evidencia a favor o en contra Mínima: datos insuficientes

El sistema descuenta significativamente las afirmaciones no verificadas. No llamamos mentirosos a los fundadores, pero las afirmaciones extraordinarias necesitan al menos alguna evidencia para tener un peso significativo. Nuestra tubería de verificación utiliza múltiples estrategias de referencia cruzada que mejoramos continuamente.

Así es como se ven las cadenas de evidencia en el informe:

┌─────────────────────────────────────────────────────────────────┐
│  CADENA DE EVIDENCIA — Agente del Equipo                                     │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  AFIRMACIÓN: "El CTO tiene 12 años de experiencia en IA para el cuidado de la salud"           │
│  ┌─────────────────────────────────────────────────────────────┐ │
│  │  Evidencia #1: Perfil de LinkedIn (público)                     │ │
│  │  → Confirmado: Ingeniero Senior de ML en MedTech Inc (2018-2023) │ │
│  │  → Confirmado: Doctorado en Biología Computacional, Stanford        │ │
│  │  → Nivel: Corroborado                                       │ │
│  ├─────────────────────────────────────────────────────────────┤ │
│  │  Evidencia #2: Mención en la prensa                                 │ │
│  │  → TechCrunch (2022): "Adquisición de MedTech del equipo de IA liderado   │ │
│  │    por [nombre]"                                               │ │
│  │  → Nivel: Verificado                                           │ │
│  ├─────────────────────────────────────────────────────────────┤ │
│  │  Evidencia #3: Registros de patentes                                │ │
│  │  → 3 patentes en PNL para datos clínicos (USPTO)              │ │
│  │  → Nivel: Verificado                                           │ │
│  └─────────────────────────────────────────────────────────────┘ │
│                                                                   │
│  VEREDICTO: Afirmación verificada con alta confianza                    │
│  Impacto en la puntuación del equipo: +1.2 Potencial, +1.8 Preparación           │
│                                                                   │
│  AFIRMACIÓN: "2,000 usuarios activos diarios en piloto"                      │
│  ┌─────────────────────────────────────────────────────────────┐ │
│  │  Evidencia: Ninguna encontrada                                       │ │
│  │  → Sin datos de uso públicos, sin presencia en la tienda de aplicaciones              │ │
│  │  → Nivel: Afirmado (solo enviado por el usuario)                      │ │
│  └─────────────────────────────────────────────────────────────┘ │
│                                                                   │
│  VEREDICTO: Afirmación no verificada — peso significativamente reducido        │
│  Nota: Conectar el análisis (Stripe, GA) en V4 para verificar automáticamente      │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

El Agente de Validación: Detectando Contradicciones

Después de que los cinco agentes completan su análisis, un Agente de Validación revisa su salida combinada:

  • Referencia cruzada: ¿El panorama competitivo del Agente del Mercado coincide con lo que encontró el Agente de Riesgo?
  • Detección de contradicciones: ¿El Agente del Equipo dijo "sólido trasfondo técnico" mientras que el Agente del Producto señaló "preocupaciones de viabilidad"?
  • Afirmaciones no verificadas de alto impacto: Si una puntuación clave depende de una afirmación con baja confianza, eso se señala.
  • Áreas de enfoque del debate: El Agente de Validación le dice al sistema de debate dónde enfocarse.

Este paso detecta los casos en los que los agentes individuales hicieron suposiciones razonables que entran en conflicto cuando se combinan.


El Debate: Optimista vs. Pesimista

Esta es la parte que a la gente le parece más interesante.

Después de que los agentes puntúan y el Agente de Validación realiza la verificación cruzada, dos polemistas sintéticos discuten sobre tu startup:

El Optimista construye el caso más sólido posible:

  • Destaca las señales más prometedoras
  • Argumenta a favor de escenarios alcistas
  • Desafía las evaluaciones de riesgo que parecen demasiado conservadoras
  • Señala éxitos comparables

El Pesimista pone a prueba todo:

  • Identifica las suposiciones más débiles
  • Argumenta a favor de escenarios bajistas
  • Desafía las proyecciones optimistas
  • Señala fracasos comparables

Van y vienen, cada uno respondiendo a los argumentos del otro. El debate es estructurado, no un argumento de forma libre, y cada ronda aborda dimensiones específicas.

Así es como se ve el resumen del debate en el informe:

┌─────────────────────────────────────────────────────────────────┐
│  RESUMEN DEL DEBATE                                                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  El OPTIMISTA argumentó:                                                │
│  "El mercado de IA para el cuidado de la salud está creciendo un 42% CAGR. El equipo tiene una rara combinación    │
│  de experiencia clínica + técnica. 3 pilotos de hospitales es una fuerte  │
│  señal para una empresa pre-semilla. La fosa regulatoria una vez lograda    │
│  crea una defensa que la mayoría de SaaS no pueden igualar".                   │
│                                                                   │
│  El PESIMISTA argumentó:                                               │
│  "La vía regulatoria es la incógnita crítica. Sin cumplimiento      │
│  líder en el equipo: esto no es un lujo, es existencial.    │
│  2 de los 3 pilotos de hospitales son con el mismo sistema de salud,         │
│  reduciendo la fuerza de la señal. Tasa de quema no divulgada".             │
│                                                                   │
│  RESOLUCIÓN:                                                      │
│  La preocupación regulatoria del pesimista fue convincente: el potencial        │
│  se ajustó ligeramente a la baja, la preparación se ajustó a la baja más            │
│  significativamente. El argumento del crecimiento del mercado del optimista se mantuvo: TAM      │
│  datos verificados independientemente. Efecto neto: potencial estable,      │
│  preparación disminuida debido a la brecha de cumplimiento.                      │
│                                                                   │
│  Ajustes de puntuación aplicados: Potencial ─, Preparación ↓             │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

Por Qué Importa el Debate

El sistema de debate existe porque los agentes individuales tienen un modo de fallo conocido: se anclan a su evaluación inicial. Si el Agente del Equipo puntuó a un fundador alto, no considerará naturalmente el caso de una puntuación más baja.

El debate obliga a que ambos casos se argumenten explícitamente. El Juez Final luego sopesa estos argumentos contra las puntuaciones originales de los agentes, ajustando hacia arriba o hacia abajo en función de qué polemista hizo puntos más sólidos respaldados por evidencia.

Los ajustes son significativos pero limitados, el debate refina las puntuaciones en lugar de anularlas. Es la diferencia entre "Tal vez" y "Sí", o "Sí" y "Sí Fuerte".


El Juez Final: Puntuación Calibrada

El Juez Final toma todo:

  1. Cinco puntuaciones de agentes con intervalos de confianza
  2. Marcas del Agente de Validación
  3. Transcripción completa del debate
  4. Cadenas de evidencia de todos los agentes

Y produce el informe final:

┌─────────────────────────────────────────────────────────────────┐
│  JUICIO FINAL                                                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  ┌──────────────────────────────────────────────────────────┐   │
│  │  RECOMENDACIÓN:  SÍ                                     │   │
│  │                                                           │   │
│  │  Potencial:  78 / 100   (rango: 72-84, confianza: Media)   │   │
│  │  Preparación:  52 / 100   (rango: 44-60, confianza: Media)   │   │
│  │                                                           │   │
│  │  Percentil: Top 22% en HealthTech (Potencial)            │   │
│  │              Top 45% en HealthTech (Preparación)            │   │
│  └──────────────────────────────────────────────────────────┘   │
│                                                                   │
│  RESUMEN EJECUTIVO (TL;DR):                                      │
│  AcmeHealth presenta una oportunidad convincente en un mercado grande y        │
│  de rápido crecimiento de IA para el cuidado de la salud. El equipo fundador tiene         │
│  una sólida experiencia en el dominio verificada a través de registros públicos,        │
│  incluido un CTO con patentes publicadas en PNL clínica.         │
│  Tres pilotos de hospitales demuestran una temprana demanda del mercado. La        │
│  El principal riesgo es regulatorio: sin líder de cumplimiento en el equipo      │
│  y una vía FDA poco clara. La economía unitaria del modelo de negocio       │
│  no se proporcionó, lo que limitó nuestra capacidad para evaluar el capital       │
│  eficiencia. Se recomienda contratar a un oficial de cumplimiento como primera      │
│  prioridad y asegurar al menos 2 pilotos fuera del actual     │
│  sistema de salud para ampliar la señal.                            │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

El Juez está calibrado con nuestro conjunto de datos histórico de resultados conocidos. Sabe, por ejemplo, que las startups de tecnología de la salud sin experiencia regulatoria históricamente enfrentan plazos más largos, y ajusta las expectativas en consecuencia.


El Memorándum de Inversión

Cada informe completo de GemScore también genera un memorándum de inversión al estilo IC, el tipo que un asociado de VC escribiría para su comité de inversión:

┌─────────────────────────────────────────────────────────────────┐
│  MEMORÁNDUM DE INVERSIÓN — AcmeHealth                                    │
│  Generado: 9 de feb. de 2026                                          │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  RESUMEN EJECUTIVO                                               │
│  AcmeHealth está construyendo un sistema de triaje de pacientes impulsado por IA      │
│  para departamentos de emergencia hospitalaria. La empresa está en pre-semilla     │
│  con 3 pilotos de hospitales (2 dentro de un solo sistema de salud).       │
│                                                                   │
│  TESIS DE INVERSIÓN                                               │
│  El mercado de IA para el cuidado de la salud es de $8.2B (Gartner, 2025) creciendo a       │
│  42% CAGR. El equipo tiene una rara combinación clínica + técnica.       │
│  La fosa regulatoria de la FDA crea una defensa a largo plazo.            │
│                                                                   │
│  FORTALEZAS CLAVE                                                    │
│  1. CTO: 12 años de IA para el cuidado de la salud, 3 patentes, doctorado de Stanford            │
│  2. Mercado: Gran TAM con un fuerte viento favorable secular               │
│  3. Tracción: 3 pilotos de hospitales activos                           │
│                                                                   │
│  RIESGOS CLAVE                                                        │
│  1. Sin líder regulatorio/de cumplimiento (crítico para la vía de la FDA)        │
│  2. 2/3 de los pilotos dentro del mismo sistema de salud                         │
│  3. Economía unitaria no proporcionada                                  │
│                                                                   │
│  RECOMENDACIÓN                                                   │
│  Proceder a la siguiente etapa. Condicional a la contratación regulatoria.          │
│                                                                   │
│  [Descargar PDF]  [Compartir con Co-inversores]                       │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

El memorándum está estructurado para uso profesional: compártelo con co-inversores, utilízalo para tu IC o entrégalo a un LP como parte de tu documentación de diligencia debida.


La Tubería Completa

Aquí está el flujo completo desde el envío hasta el informe:

┌──────────────────────────────────────────────────────────────┐
│                    TUBERÍA DE EVALUACIÓN DE GEMSCORE                │
├──────────────────────────────────────────────────────────────┤
│                                                                │
│  1. INGESTIÓN                                                  │
│     └─ Analizar la entrada estructurada / documentos / transcripción de voz   │
│                                                                │
│  2. AGENTES PARALELOS (5 ejecutándose simultáneamente)                 │
│     ┌─────────────────┐  ┌─────────────────┐                  │
│     │  Equipo           │  │  Mercado         │                  │
│     │  Investigación → ◆   │  │  Investigación → ◆   │                  │
│     │  Análisis  → ◆  │  │  Análisis  → ◆  │                  │
│     └─────────────────┘  └─────────────────┘                  │
│     ┌─────────────────┐  ┌─────────────────┐                  │
│     │  Negocio       │  │  Producto        │                  │
│     │  Investigación → ◆   │  │  Investigación → ◆   │                  │
│     │  Análisis  → ◆  │  │  Análisis  → ◆  │                  │
│     └─────────────────┘  └─────────────────┘                  │
│     ┌─────────────────┐                                       │
│     │  Riesgo           │                                       │
│     │  Investigación → ◆   │                                       │
│     │  Análisis  → ◆  │                                       │
│     └────────┬────────┘                                       │
│              ▼                                                 │
│  3. VALIDACIÓN                                                 │
│     └─ Verificación cruzada de todas las salidas de los agentes en busca de contradicciones        │
│              ▼                                                 │
│  4. DEBATE                                                     │
│     ├─ El optimista construye un caso alcista                               │
│     ├─ El pesimista construye un caso bajista                              │
│     └─ Múltiples rondas de argumento estructurado                  │
│              ▼                                                 │
│  5. JUICIO FINAL                                             │
│     └─ Puntuaciones calibradas + recomendación + TL;DR              │
│              ▼                                                 │
│  6. GENERACIÓN DE INFORMES                                          │
│     ├─ Informe completo con cadenas de evidencia                        │
│     ├─ Memorándum de inversión al estilo IC                                │
│     └─ Análisis visual (gráficos, mapas competitivos)             │
│                                                                │
│  Total: 8-15 minutos. Todos los agentes en paralelo donde sea posible.      │
│                                                                │
└──────────────────────────────────────────────────────────────┘

Qué Sucede Cuando Algo Sale Mal

Los sistemas de IA fallan. Lo diseñamos para ello.

Si algún agente falla durante la evaluación:

  1. Toda la evaluación se detiene inmediatamente, sin resultados parciales
  2. Tu crédito es reembolsado automáticamente
  3. Se guarda un informe de error para la depuración
  4. Se te notifica y puedes volver a intentarlo

No producimos informes con datos faltantes. Si el Agente del Mercado falla y los otros cuatro tienen éxito, no obtienes un informe con una sección de mercado en blanco. Obtienes un reembolso y una disculpa.

Esta es una compensación deliberada. Preferimos no darte nada a darte algo engañoso.


Completo vs. Lite: Qué Cambia

Ofrecemos una Validación Rápida gratuita cada mes. Así es como difiere de la evaluación completa:

Dimensión Validación Rápida (Gratis) GemScore Completo
Agentes 4 (Equipo, Mercado, Negocio, Riesgo) 5 (+ Producto)
Puntuación Solo Potencial Potencial + Preparación
Debate No Sí (Optimista vs. Pesimista)
Profundidad de la evidencia Búsqueda web básica Verificación profunda de múltiples fuentes
Intervalos de confianza No
Tiempo 2-4 minutos 8-15 minutos
Salida Veredicto de Ir/No-Ir + próximos pasos Informe completo + memorándum + gráficos
Costo Gratis (1/mes) Crédito pagado

Así es como se ve la Validación Rápida:

┌─────────────────────────────────────────────────────────────────┐
│  VALIDACIÓN RÁPIDA — AcmeHealth                                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  VEREDICTO:  ● VALE LA PENA PERSEGUIR                                      │
│                                                                   │
│  Puntuación de Potencial:  74 / 100                                      │
│                                                                   │
│  Oportunidad de Mercado:   Fuerte  ●●●●○                             │
│  Ajuste Fundador-Idea:     Bueno    ●●●○○                             │
│  Panorama Competitivo: Emergente (se encontraron 3 competidores directos)    │
│                                                                   │
│  FORTALEZA PRINCIPAL                                                     │
│  El equipo fundador combina la experiencia clínica y de IA: una rara       │
│  combinación que la mayoría de los competidores carecen.                         │
│                                                                   │
│  PROBLEMA CRÍTICO                                                   │
│  Sin estrategia regulatoria o experiencia de cumplimiento en el equipo.         │
│  La IA para el cuidado de la salud sin una vía de la FDA es un fracaso para      │
│  los inversores institucionales.                                    │
│                                                                   │
│  PRÓXIMOS PASOS                                                       │
│  1. Contratar o asesorar con un experto regulatorio/de cumplimiento (Semana 1)  │
│  2. Mapear la vía de la FDA: 510(k) vs De Novo para tu caso de uso        │
│  3. Asegurar 2 pilotos de hospitales adicionales fuera del sistema actual   │
│                                                                   │
│  ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─  │
│  ¿Quieres la imagen completa? Actualiza a GemScore Completo para:            │
│  ✦ Puntuación de preparación  ✦ Análisis de debate  ✦ Memorándum de inversión       │
│  ✦ Intervalos de confianza  ✦ Análisis visual  ✦ Cadenas de evidencia  │
│                                                                   │
│  [Actualizar a GemScore Completo]                                      │
│                                                                   │
└─────────────────────────────────────────────────────────────────┘

El nivel gratuito te da una respuesta real: ¿vale la pena perseguir esto? El nivel pagado te da la imagen completa: ¿qué tan fuerte es, dónde están las brechas y qué diría un memorándum de IC?


Desafiando a la IA: Notas sobre Informes

La IA se equivoca. Esperamos eso, y construimos un sistema para que los fundadores respondan.

Si no estás de acuerdo con algo en tu informe, puedes seleccionar el texto, agregar una nota explicando por qué y solicitar una reevaluación. La IA se vuelve a ejecutar con tu contexto adicional incluido.

┌─────────────────────────────────────────────────────────────────┐
│  NOTAS SOBRE EL INFORME — AcmeHealth                                    │
├─────────────────────────────────────────────────────────────────┤
│                                                                   │
│  NOTA #1 (Análisis del Equipo)                                         │
│  Seleccionado: "Sin evidencia de salidas previas en el cuidado de la salud"               │
│  Tu nota: "Nuestro CTO