Metodología de puntuación

Las matemáticas exactas detrás de cada número del leaderboard de smart money: qué se cuenta, qué se excluye y por qué. Sin cajas negras: cualquier puntuación del sitio puede recalcularse con datos públicos on-chain.

Qué se puntúa

Las métricas de una cartera se calculan sobre su muestra puntuada — solo entradas BUY informativas y resueltas:

Solo compras (BUY). Las ventas son salidas, no pronósticos, y quedan fuera de todas las métricas.
Solo cuentan los mercados resueltos con un resultado inequívoco — las posiciones abiertas nunca forman parte del historial.
Las entradas a 90¢ o más se descartan: pagar ≈$0.99 por un pago de ≈$1.00 es carry, no un pronóstico, y permitiría a las carteras de "apuestas seguras" fabricar un historial perfecto.
Se exige un mínimo de 30 entradas puntuadas antes de mostrar ninguna métrica.
Los micromercados "Up or Down" (apuestas de dirección cripto de 5 minutos) se excluyen por completo.
El historial proviene de la API pública de datos de Polymarket, que limita la actividad recuperable por cartera — las cuentas de altísima frecuencia pueden puntuarse solo con sus operaciones más recientes.

Fórmulas de las métricas

Para cada entrada puntuada, price es el precio de entrada (0–1) y outcome es 1 si ese lado ganó, 0 si perdió. El capital está en USDC.

ROI = Σ(outcome − price)·size / Σ(price·size)Retorno realizado sobre el capital desplegado. Ponderado por capital: las posiciones grandes lo mueven más.
win rate = wins / nProporción de entradas puntuadas resueltas a favor de la cartera. Solo es legible junto al precio medio de entrada: 5% de aciertos a 1¢ es ventaja positiva; 90% a 95¢ no lo es.
edge = mean(outcome − price)Ventaja media por operación en puntos de probabilidad — la métrica honesta de habilidad. A diferencia del ROI, no se apalanca con cuotas de longshot.
Brier = mean((price − outcome)²)Calibración del MERCADO en las operaciones de este trader, no del trader. Brier bajo = el mercado ya valoraba bien esas apuestas; un Brier alto con win rate alto significa que el trader batió sistemáticamente el precio de mercado.
z = Σ(outcome − price) / √Σ price·(1 − price)Test de significancia contra H₀ "sin ventaja", usando la varianza teórica de Bernoulli de cada entrada. Los niveles exigen un p-value bilateral por debajo de 0.01.

Puntuación compuesta (orden por defecto)

El ROI bruto premia a las carteras de polvo que cultivan longshots de fracciones de centavo, así que el leaderboard ordena por una ventaja descontada por confianza y capital:

composite = 100 · edge · sig · cap · penalty

edge = mean(outcome − price)Habilidad con signo por operación — una cartera perdedora sigue en negativo y se ordena por debajo de cero.
sig = min(|z| / 4, 1)z
cap = min(log10(1 + capital$) / 6, 1)Peso económico: logarítmico en el capital puntuado, saturando en $1M. Un historial de $0 puntúa ≈ 0 por perfecto que sea.
penalty = 0.25 if sniper else 1Los francotiradores de resolución conservan un cuarto de su puntuación — visibles, pero nunca por encima de los pronosticadores genuinos.

Ejemplo: ventaja +10pp, z = 4, $10k de capital puntuado, no francotirador → 100 × 0.10 × 1.0 × 0.67 ≈ +6.7. La misma ventaja sobre $50 de polvo → ≈ +2.8 × 0.1 ≈ 0.3.

Niveles

Las etiquetas de nivel se recalculan en cada repuntuación. Las carteras tipo market maker (más de 10 operaciones por apuesta resuelta) nunca califican, y los sospechosos de wash trading quedan excluidos de todas las vistas.

Experto p < 0.01 · ROI > 5% · Brier < 0.22 · Brier CI < 0.25 · churn ≤ 10 · no es francotirador de resolución
Rentable p < 0.01 · ROI > 3% · churn ≤ 10

El leaderboard por defecto oculta además las microcarteras (entrada media inferior a $10 y capital puntuado total inferior a $500): sus historiales son estadísticamente reales pero no copiables económicamente. El interruptor "incluir microcarteras" levanta el filtro.

Francotiradores de resolución

Algunas carteras "ganan" comprando mercados ya decididos a cotizaciones obsoletas minutos antes del cierre — latencia, no pronóstico. Cuando una cartera tiene al menos 10 entradas con hora de cierre conocida y más de la mitad caen dentro de los últimos 60 minutos, se marca como francotirador: vetada del nivel Sharp, su puntuación compuesta se multiplica por 0.25 y luce una insignia ámbar en el leaderboard.

Frecuencia de actualización

Cada página muestra cuándo se recalcularon sus datos. El pipeline funciona de forma continua:

Operaciones on-chain: ingesta cada 15 minutos.
Resoluciones de mercados y precios de resultados: cada 6 horas.
Captura de posiciones vivas de ballenas (base del historial): cada 10 minutos.
Puntuaciones de carteras: las activas se repuntúan cada ~6 horas; el conjunto completo al menos una vez por semana.

Limitaciones conocidas

Sesgo de selección en el descubrimiento: algunas carteras entran al seguimiento porque ya ganaron (minería de top traders, leaderboards externos). Su historial pasado está condicionado a la victoria; la señal más limpia es el historial forward que se acumula tras el descubrimiento.
La captura de posiciones vivas solo funciona hacia adelante — las apuestas resueltas antes de descubrir una cartera entran a su historial mediante backfill derivado de operaciones, que replica la muestra de puntuación (entradas BUY por debajo de 90¢).
Las ventas no se netean contra las entradas: una posición cerrada antes de tiempo cuenta igualmente como victoria o derrota completa en la resolución — exactamente como en las métricas principales.
Los resultados se binarizan a un precio de resolución de 0.95 — las resoluciones ambiguas o disputadas, poco frecuentes, se omiten por completo.

Sobre las fuentes de datos, las rutas de descubrimiento de carteras y lo que WhaleGraph no es, consulta Acerca de.