Cómo hacer backtesting de una estrategia de trading paso a paso

Aprende a validar cualquier estrategia con backtesting real: datos, métricas clave y cómo conectar cada hallazgo con tu journal de trading.

Abril 2026
19 min lectura

El backtesting tiene mala fama por una razón concreta: la mayoría lo hace mal. No porque sea difícil técnicamente, sino porque hay docenas de formas de engañarse a uno mismo sin darse cuenta. Optimizas parámetros hasta que la curva de equity parece perfecta, la estrategia pasa el filtro y la pones en real — y en tres semanas la cuenta está sangrando.

Este artículo no es una introducción a qué es el backtesting. Es una guía de cómo hacerlo de forma que los resultados signifiquen algo. Eso implica hablar de períodos de prueba, slippage, métricas que importan y, sobre todo, de los sesgos que convierten un proceso riguroso en una validación de confirmación disfrazada de análisis.

Premisa fundamental: Un backtesting bien hecho no te garantiza que la estrategia funcione. Te garantiza que si hubiera funcionado en el pasado, habrías podido detectarlo correctamente. La diferencia es enorme, y entenderla cambia cómo interpretas cada resultado.

Por qué el backtesting mal hecho es peor que no hacer backtesting

Hay algo más peligroso que operar sin un sistema testado: operar con un sistema que crees que está testado pero no lo está. El primero te pone alerta, el segundo te da una falsa confianza que hace que aguantes pérdidas más tiempo del que deberías.

Compara estos dos enfoques sobre la misma estrategia de cruce de medias móviles en EUR/USD (H4), testada durante 2 años:

A
Backtesting riguroso
Datos limpios, sin optimizar
Período In-Sample 2018–2021
Período Out-of-Sample 2022–2024
Profit Factor (IS) 1.48
Profit Factor (OOS) 1.31
Max Drawdown 14.2%
Comisiones incluidas Sí (1.2 pip/op)
Slippage modelado Sí (0.5 pip)
B
Backtesting optimizado
Parámetros ajustados al resultado
Período testado 2022–2024 (solo)
Período Out-of-Sample No existe
Profit Factor 2.87 (overfitted)
PF en ejecución real 0.91 (3 meses)
Max Drawdown 4.1% (irreal)
Comisiones incluidas No
Slippage modelado No

El Trader B no hizo trampa intencionalmente. Simplemente optimizó los parámetros (período de las medias, filtros adicionales) hasta que los números se veían bien en el mismo período de datos que usó para desarrollar la estrategia. Eso es data snooping o sesgo de búsqueda, y es el error número uno en backtesting. La diferencia entre un PF de 2.87 y uno de 0.91 es la diferencia entre una cuenta que crece y una que se destruye.

Regla de oro: Si el mismo conjunto de datos que usas para diseñar la estrategia es el que usas para evaluarla, el resultado no vale nada estadísticamente. Necesitas datos que la estrategia nunca "haya visto".

Qué datos necesitas para un backtesting creíble: período, comisiones y slippage

Antes de ejecutar una sola prueba histórica, necesitas resolver tres variables que determinan si el ejercicio tendrá validez o no.

1. El período de datos: más no siempre es mejor

Una estrategia intradía en scalping de índices no necesita 10 años de datos. Necesita suficientes operaciones en condiciones de mercado diversas (alta volatilidad, baja volatilidad, tendencia, rango). La regla práctica: mínimo 200 operaciones en el backtesting in-sample para que las métricas sean estadísticamente significativas.

Para estrategias swing en forex (EURUSD, GBPUSD), lo recomendable es usar datos de al menos 5 años e incluir períodos como:

  • Crisis de volatilidad (2020, crisis del COVID)
  • Períodos de rango lateral prolongado (2014–2015 en muchos pares)
  • Tendencias fuertes (USD bull run 2022)
  • Eventos de liquidez reducida (navidades, festivos)

La división recomendada es 70% in-sample / 30% out-of-sample. El in-sample es donde desarrollas y calibras. El out-of-sample es donde validas, y no tocas nada en él hasta que el sistema esté cerrado.

2. Comisiones: el coste que arruina estrategias de alta frecuencia

Muchos traders testean sin incluir spreads ni comisiones porque "se olvidaron" o porque el software por defecto no los incluye. El impacto es brutal en estrategias con muchas operaciones:

Impacto de comisiones en Profit Factor — Estrategia scalping (500 ops/año)

Para estrategias de backtesting forex, los valores realistas a modelar son:

  • Spread: 0.8–1.5 pips en pares mayores (EUR/USD, GBP/USD en horario europeo)
  • Comisión de broker: 0.5–1 pip equivalente por operación (brokers ECN)
  • Slippage: 0.3–0.8 pips en condiciones normales; 2–5 pips en noticias
  • Swap (rollover): Crítico si mantienes posiciones overnight en carry trades

3. Slippage: el coste que nadie modela

El slippage es la diferencia entre el precio al que tu sistema señala entrar y el precio al que realmente ejecutas. En backtesting manual, se ignora sistemáticamente. En backtesting automático con MetaTrader, se modela con calidad variable según los datos de ticks disponibles.

Consejo práctico: Si tu estrategia usa stops de 5–10 pips, un slippage no modelado de 1–2 pips puede cambiar una operación ganadora de 5R en una de 3R. Multiplica eso por 300 operaciones anuales y entiendes por qué el slippage destruye resultados.

Herramientas de backtesting: gratuitas vs de pago (y cuándo usar cada una)

No hay una herramienta universal. La elección correcta depende de tu estrategia, tu nivel técnico y lo que necesitas validar.

📊
TradingView Strategy Tester Gratis/Pro
Ideal para estrategias basadas en indicadores o precio en cualquier mercado. Pine Script permite automatizar la lógica. Limitación: datos históricos limitados en plan gratuito y sin modelado de slippage avanzado. Mejor opción para validar estrategias discrecionales rápidamente.
🤖
MetaTrader 4/5 Strategy Tester Gratis
Estándar para backtesting forex. La calidad del test depende completamente de la calidad de los datos de ticks (usa Tickstory o Dukascopy para datos de 99% de calidad). Imprescindible si operas EAs en MT4/MT5. Curva de aprendizaje pronunciada.
🔬
Forex Tester 5 De pago
La mejor opción para backtesting manual con calidad de datos tick a tick. Simulas el mercado en tiempo real, entras y sales manualmente, y obtienes estadísticas completas. Precio elevado pero justificado si tu enfoque es discrecional.
🐍
Python (Backtrader / QuantConnect) Gratis
Máxima flexibilidad y control. Puedes modelar comisiones, slippage y market impact con precisión quirúrgica. Requiere conocimientos de programación. Indispensable para estrategias cuantitativas o portafolios multi-activo.
📋
Excel / Google Sheets Gratis
Subestimado para backtesting manual de patrones discrecionales. Si tu estrategia depende de lectura de velas y contexto, revisar gráficos históricos y registrar operaciones en una hoja de cálculo es más honesto que automatizar algo que no es automatizable.
Recomendación: Para el 80% de traders discrecionales, la combinación óptima es Forex Tester o TradingView para el backtesting, y un trading journal como TradingNote para registrar, analizar y extraer aprendizaje de cada resultado.

Las 5 métricas que realmente importan en tu backtesting

El porcentaje de aciertos no es una métrica de backtesting. Es un dato de contexto. Hay estrategias con 35% de win rate que son más sólidas que otras con 70%. Las métricas que realmente validan (o invalidan) una estrategia son estas cinco:

Métrica Qué mide Umbral mínimo Umbral robusto
Profit Factor Ganancias brutas / Pérdidas brutas > 1.3 > 1.6
Expectativa matemática Ganancia media por operación en R > 0.2R > 0.4R
Max Drawdown Caída máxima desde pico a valle < 25% < 15%
Recovery Factor Beneficio neto / Max Drawdown > 1.5 > 3.0
Racha máxima de pérdidas Operaciones consecutivas en pérdida < 10 < 6

Expectativa matemática: la fórmula que más se ignora

Expectativa = (WR × Avg Win) − ((1 − WR) × Avg Loss)

Ejemplo concreto: una estrategia con 40% de win rate, ganancia media de 2R y pérdida media de 1R tiene una expectativa de (0.4 × 2R) − (0.6 × 1R) = 0.8R − 0.6R = +0.2R por operación. Con 200 operaciones anuales, eso son 40R de beneficio esperado al año. Una estrategia con 65% de win rate pero ratio 1:0.8 tiene expectativa de (0.65 × 0.8) − (0.35 × 1) = 0.52 − 0.35 = +0.17R — peor.

Recovery Factor: la métrica más honesta sobre robustez

Un sistema que genera 50% de retorno pero tiene un drawdown máximo del 40% tiene un Recovery Factor de 1.25. Es débil. Un sistema que genera 30% con un drawdown del 8% tiene un RF de 3.75. Es robusto. La pregunta que el RF responde es: ¿cuánto me hace ganar en relación a lo peor que me puede pasar?

Curva de equity simulada — Backtesting 3 años (In-Sample vs Out-of-Sample)

Del backtesting al journal: cómo convertir hallazgos en aprendizaje continuo

El backtesting te da un modelo. El journal te dice si ese modelo sobrevive en el mercado real. Son dos herramientas complementarias, y la mayoría de traders usa una de las dos pero no las conecta.

El proceso correcto es este:

1
Backtesting in-sample → Definir reglas exactas

Documenta las reglas de entrada, salida, gestión del riesgo y filtros con precisión quirúrgica. Si no puedes describir tu estrategia en 5 reglas claras, no está lista para testarse.

2
Backtesting out-of-sample → Validar sin tocar reglas

Ejecuta el sistema en el período reservado sin modificar ningún parámetro. Si el PF cae más de un 30% respecto al in-sample, hay overfitting. Si se mantiene estable, la estrategia tiene robustez estadística.

3
Forward testing en demo → Registrar en journal

Opera en tiempo real en una cuenta demo durante al menos 50–100 operaciones, registrando cada una en tu diario de trading. El objetivo es detectar si tu ejecución real coincide con las reglas del sistema.

4
Análisis de desviaciones → Ajustar comportamiento, no estrategia

Compara las métricas del forward test con las del backtesting. Si hay diferencias, el problema suele ser de ejecución (entrar tarde, mover stops, cerrar antes de tiempo), no de la estrategia en sí. Tu bitácora de trading debe capturar estos patrones de comportamiento.

5
Cuenta real en tamaño reducido → Monitorización con journal

Empieza con el 25–30% del tamaño de posición que usarás eventualmente. El journal te permite comparar métricas en tiempo real contra el backtesting. Si el PF real se mantiene dentro del margen esperado durante 50 operaciones, escala gradualmente.

La conexión entre backtesting y journal de trading no es opcional: es el mecanismo por el que conviertes datos históricos en mejora real. Sin registrar qué pasa en tu operativa en vivo, el backtesting es un ejercicio académico. Con un registro de operaciones de trading sistemático, el backtesting se convierte en un punto de comparación continuo.

El backtesting te dice dónde estás yendo. El journal te dice dónde estás. Sin ambos, vas a ciegas. — Principio básico de cualquier trader cuantitativo profesional

Para que esta conexión funcione, necesitas un journal que calcule automáticamente las mismas métricas que midiste en el backtesting: Profit Factor, expectativa, drawdown, recovery factor. Si usas un cuaderno de trading en Excel o un formato básico, la comparación se vuelve manual y pierde valor. Una herramienta especializada como TradingNote te permite ver en tiempo real si tu operativa en vivo se está desviando del modelo validado en el backtesting, y actuar antes de que el daño sea irreversible. Puedes aprender más en la guía completa de journal de trading.

Los errores de backtesting que destruyen estrategias ganadoras en cuenta real

Estos no son errores de principiantes. Son errores que cometen traders con años de experiencia que creen estar haciendo backtesting correcto:

❌ Sesgo de anticipación (Look-Ahead Bias)

Usar en el backtesting información que no estaba disponible en el momento de la señal. Ejemplo clásico: usar el cierre de la vela actual para generar la señal, cuando en tiempo real la vela aún no ha cerrado. En backtesting automático es difícil de detectar sin revisar el código línea a línea.

❌ Overfitting (Sobreoptimización)

Ajustar parámetros hasta que el sistema funciona perfectamente en datos históricos. Un sistema con 12 parámetros optimizados sobre 200 operaciones tiene tantos grados de libertad que básicamente ha memorizado el pasado. La señal de alerta: un PF espectacular en el in-sample que colapsa inmediatamente en el out-of-sample.

❌ Sesgo de supervivencia (Survivorship Bias)

Testear únicamente en los activos que "sobrevivieron" hasta hoy. Si testeas una estrategia de acciones en el S&P500 actual usando datos históricos, estás excluyendo todas las empresas que quebraron o fueron eliminadas del índice. Los datos de índices reconstruidos artificialmente hacia atrás tienen este problema.

❌ Ignorar el impacto de mercado

Una estrategia que funciona con 1 lote estándar puede dejar de funcionar con 20 lotes si el mercado no tiene liquidez suficiente para absorberte sin mover el precio en tu contra. Las estrategias de scalping con volumen alto son las más afectadas por este problema.

❌ Ignorar el factor psicológico

Un backtesting automatizado asume ejecución perfecta. En tiempo real, 8 operaciones seguidas en pérdida a las 2am pueden hacerte abandonar el sistema justo antes de la secuencia ganadora. Si el sistema tiene una racha máxima de 12 pérdidas consecutivas en el backtest, debes preguntarte honestamente si psicológicamente podrías aguantarla. Llevar un diario de operaciones en bolsa que incluya el estado emocional de cada sesión te da datos concretos sobre cuánto te afectan las rachas adversas.

❌ No separar régimen de mercado

Un sistema tendencial puede tener un PF de 2.1 en períodos de tendencia y un PF de 0.6 en períodos de rango. Si tu backtesting abarca un período con 70% de tendencia pero el mercado actual lleva 6 meses en rango, el sistema fallará. Segmenta los resultados del backtesting por tipo de mercado para entender en qué condiciones funciona tu estrategia.

La gestión de riesgo en trading también puede verse comprometida si el backtesting no refleja correctamente el tamaño real de las posiciones y el impacto del riesgo compuesto. Un sistema que parece tener un drawdown controlado puede volverse devastador si la gestión del tamaño de posición en cuenta real es más agresiva que en el test.

Regla práctica anti-errores: Antes de declarar que un backtesting es válido, hazte estas tres preguntas: (1) ¿Tiene al menos 30% de datos out-of-sample no tocados? (2) ¿Incluye comisiones y slippage realistas? (3) ¿Ha sido validado en condiciones de mercado diversas (tendencia, rango, alta volatilidad)?. Si alguna respuesta es "no", el resultado no es concluyente.

El backtesting no es el objetivo final. Es el primer filtro. La estrategia que pasa un backtesting riguroso entra en una fase de forward testing documentada con un trading journal de calidad que permita detectar desviaciones entre el modelo y la ejecución real. Sin ese segundo filtro, el backtesting es solo un ejercicio de confianza que puede resultar caro. Si te interesa ver cómo diferentes herramientas de journal se comparan para este proceso, puedes revisar la comparativa TradingNote vs Edgewonk.

Lo que debes llevarte de este artículo

Hacer backtesting correctamente no es tan difícil técnicamente como parece, pero requiere disciplina metodológica que la mayoría no aplica. Los puntos críticos son:

  • Separar siempre datos in-sample y out-of-sample antes de empezar a diseñar
  • Incluir comisiones, spread y slippage realistas en cada test
  • Usar al menos 200 operaciones para que las métricas sean estadísticamente significativas
  • Evaluar el sistema con Profit Factor, expectativa, Max Drawdown y Recovery Factor — no solo con win rate
  • Testear en condiciones de mercado diversas: tendencia, rango, alta y baja volatilidad
  • Conectar los resultados del backtesting con un journal de trading para monitorizar la ejecución real
  • Nunca declarar una estrategia validada sin haber pasado también por forward testing documentado

Un backtesting riguroso no es garantía de éxito. Es garantía de que, si algo falla en cuenta real, sabrás exactamente dónde buscar el problema.

Conecta tu backtesting con tu operativa real

TradingNote calcula automáticamente las mismas métricas de tu backtesting en tu operativa en vivo: PF, expectativa, drawdown y recovery factor. Detecta desviaciones antes de que dañen tu cuenta.

Empezar con TradingNote →

¿Listo para mejorar tu trading con datos?
Registra tus operaciones, analiza tu rendimiento y toma decisiones basadas en métricas reales con TradingNote.

Comienza gratis en TradingNote

Comentarios