Metodología de puntuación

Las matemáticas exactas detrás de cada número del leaderboard de smart money: qué se cuenta, qué se excluye y por qué. Sin cajas negras: cualquier puntuación del sitio puede recalcularse con datos públicos on-chain.

Qué se puntúa

Las métricas de una cartera se calculan sobre su muestra puntuada — solo entradas BUY informativas y resueltas:

  • Solo compras (BUY). Las ventas son salidas, no pronósticos, y quedan fuera de todas las métricas.
  • Solo cuentan los mercados resueltos con un resultado inequívoco — las posiciones abiertas nunca forman parte del historial.
  • Las entradas a 90¢ o más se descartan: pagar ≈$0.99 por un pago de ≈$1.00 es carry, no un pronóstico, y permitiría a las carteras de "apuestas seguras" fabricar un historial perfecto.
  • Se exige un mínimo de 30 entradas puntuadas antes de mostrar ninguna métrica.
  • Los micromercados "Up or Down" (apuestas de dirección cripto de 5 minutos) se excluyen por completo.
  • El historial proviene de la API pública de datos de Polymarket, que limita la actividad recuperable por cartera — las cuentas de altísima frecuencia pueden puntuarse solo con sus operaciones más recientes.

Fórmulas de las métricas

Para cada entrada puntuada, price es el precio de entrada (0–1) y outcome es 1 si ese lado ganó, 0 si perdió. El capital está en USDC.

  • ROI = Σ(outcome − price)·size / Σ(price·size)Retorno realizado sobre el capital desplegado. Ponderado por capital: las posiciones grandes lo mueven más.
  • win rate = wins / nProporción de entradas puntuadas resueltas a favor de la cartera. Solo es legible junto al precio medio de entrada: 5% de aciertos a 1¢ es ventaja positiva; 90% a 95¢ no lo es.
  • edge = mean(outcome − price)Ventaja media por operación en puntos de probabilidad — la métrica honesta de habilidad. A diferencia del ROI, no se apalanca con cuotas de longshot.
  • Brier = mean((price − outcome)²)Calibración del MERCADO en las operaciones de este trader, no del trader. Brier bajo = el mercado ya valoraba bien esas apuestas; un Brier alto con win rate alto significa que el trader batió sistemáticamente el precio de mercado.
  • z = Σ(outcome − price) / √Σ price·(1 − price)Test de significancia contra H₀ "sin ventaja", usando la varianza teórica de Bernoulli de cada entrada. Los niveles exigen un p-value bilateral por debajo de 0.01.

Puntuación compuesta (orden por defecto)

El ROI bruto premia a las carteras de polvo que cultivan longshots de fracciones de centavo, así que el leaderboard ordena por una ventaja descontada por confianza y capital:

composite = 100 · edge · sig · cap · penalty

  • edge = mean(outcome − price)Habilidad con signo por operación — una cartera perdedora sigue en negativo y se ordena por debajo de cero.
  • sig = min(|z| / 4, 1)z
  • cap = min(log10(1 + capital$) / 6, 1)Peso económico: logarítmico en el capital puntuado, saturando en $1M. Un historial de $0 puntúa ≈ 0 por perfecto que sea.
  • penalty = 0.25 if sniper else 1Los francotiradores de resolución conservan un cuarto de su puntuación — visibles, pero nunca por encima de los pronosticadores genuinos.

Ejemplo: ventaja +10pp, z = 4, $10k de capital puntuado, no francotirador → 100 × 0.10 × 1.0 × 0.67 ≈ +6.7. La misma ventaja sobre $50 de polvo → ≈ +2.8 × 0.1 ≈ 0.3.

Niveles

Las etiquetas de nivel se recalculan en cada repuntuación. Las carteras tipo market maker (más de 10 operaciones por apuesta resuelta) nunca califican, y los sospechosos de wash trading quedan excluidos de todas las vistas.

  • Experto p < 0.01 · ROI > 5% · Brier < 0.22 · Brier CI < 0.25 · churn ≤ 10 · no es francotirador de resolución
  • Rentable p < 0.01 · ROI > 3% · churn ≤ 10

El leaderboard por defecto oculta además las microcarteras (entrada media inferior a $10 y capital puntuado total inferior a $500): sus historiales son estadísticamente reales pero no copiables económicamente. El interruptor "incluir microcarteras" levanta el filtro.

Francotiradores de resolución

Algunas carteras "ganan" comprando mercados ya decididos a cotizaciones obsoletas minutos antes del cierre — latencia, no pronóstico. Cuando una cartera tiene al menos 10 entradas con hora de cierre conocida y más de la mitad caen dentro de los últimos 60 minutos, se marca como francotirador: vetada del nivel Sharp, su puntuación compuesta se multiplica por 0.25 y luce una insignia ámbar en el leaderboard.

Frecuencia de actualización

Cada página muestra cuándo se recalcularon sus datos. El pipeline funciona de forma continua:

  • Operaciones on-chain: ingesta cada 15 minutos.
  • Resoluciones de mercados y precios de resultados: cada 6 horas.
  • Captura de posiciones vivas de ballenas (base del historial): cada 10 minutos.
  • Puntuaciones de carteras: las activas se repuntúan cada ~6 horas; el conjunto completo al menos una vez por semana.

Limitaciones conocidas

  • Sesgo de selección en el descubrimiento: algunas carteras entran al seguimiento porque ya ganaron (minería de top traders, leaderboards externos). Su historial pasado está condicionado a la victoria; la señal más limpia es el historial forward que se acumula tras el descubrimiento.
  • La captura de posiciones vivas solo funciona hacia adelante — las apuestas resueltas antes de descubrir una cartera entran a su historial mediante backfill derivado de operaciones, que replica la muestra de puntuación (entradas BUY por debajo de 90¢).
  • Las ventas no se netean contra las entradas: una posición cerrada antes de tiempo cuenta igualmente como victoria o derrota completa en la resolución — exactamente como en las métricas principales.
  • Los resultados se binarizan a un precio de resolución de 0.95 — las resoluciones ambiguas o disputadas, poco frecuentes, se omiten por completo.

Sobre las fuentes de datos, las rutas de descubrimiento de carteras y lo que WhaleGraph no es, consulta Acerca de.