guia

Cómo comprar tráfico web de calidad en 2026: guía paso a paso

Guía paso a paso para comprar tráfico web de calidad en 2026: checklist de calidad de 11 puntos, sample size por GEO y reconciliación panel-vs-tracker, con datos propios.

Soy Diego. He corrido 4.322 tests A/B/n en push notification ads entre 2019 y 2024, en su mayoría para iAdvize, en iGaming, finanzas y utility, EU y LATAM. Lo que sigue no son opiniones — son datos.

La búsqueda “comprar tráfico web” devuelve dos clases de contenido en Google. La primera: tutoriales que explican cómo abrir una cuenta en una red y poner una tarjeta. La segunda: posts de agencias que prometen “tráfico premium de alta calidad” sin decir nunca qué significa “calidad” ni cómo se mide. Ninguno de los dos te sirve cuando estás por gastar dinero real. Esta guía es el procedimiento que aplico antes y durante cada compra, con los números que hacen que cada paso sea defendible.

La tesis es simple y va a repetirse: comprar tráfico de calidad no es elegir el proveedor correcto — es medir la calidad vos mismo con un sample size que soporte la conclusión. La “calidad” no viene en la etiqueta del producto. Viene de tu instrumentación.

Qué es realmente “tráfico de calidad” — tres mediciones, no una etiqueta

La palabra “calidad” en la mayoría de los anuncios de redes publicitarias es lo que un practicante llamaría una variable no observada. La usan porque suena bien y porque nadie pide la definición operativa. Cuando yo compro tráfico, “calidad” se descompone en tres mediciones concretas, y una fuente es de calidad solo si pasa las tres:

  1. Llegada real. El tráfico que pagás tiene que llegar de verdad al device del usuario. Esto se verifica con reconciliación panel-vs-tracker, no con el dashboard de la red. Una red que cuenta una impresión cada vez que el push se envía (no cada vez que llega) te muestra un CTR inflado que no sobrevive a la reconciliación contra Voluum o RedTrack.

  2. Conversión sobre el piso. El tráfico tiene que convertir por encima del piso que vos definiste para ese segmento específico — GEO, vertical, navegador, device. No “por encima del promedio de la industria”, porque el push CTR varía hasta 5x por GEO+vertical+navegador y el término “CTR promedio de la industria” no significa nada.

  3. Sostenimiento. La conversión tiene que sostenerse hasta el día en que se cierra la ventana de postback de tu vertical. Un tráfico que convierte 6% en día 1 y 2% en día 14 no es tráfico de 6% — es tráfico de 2% que te engañó durante trece días.

Si una fuente pasa las tres, es de calidad para tu caso. Si falla una, no lo es — por más que el AM te jure lo contrario. El resto de esta guía es el procedimiento para medir las tres.

Paso 1 — Definí el segmento antes de tocar la billetera

El error más caro en compra de tráfico se comete antes de gastar el primer dólar: comprar “tráfico de España” o “tráfico iGaming” como si fueran categorías homogéneas. No lo son.

En Q1 2022 corrí un test sobre una campaña push iGaming en España, tráfico mixto, n=18.400 impresiones. El panel reportaba un CTR “blended” de 2,4%. Cuando segmenté esas mismas 18.400 impresiones por navegador, el número se desarmó: Chrome desktop 4,12%, Chrome mobile 1,38%, Edge desktop 3,74%, Firefox 1,91%. El 2,4% blended no describía a ningún usuario real — era el promedio de cuatro audiencias con una varianza de CTR de 3x entre la más alta y la más baja. Un creativo optimizado sobre el 2,4% perdió en Chrome mobile (el segmento de mayor volumen) durante cuatro semanas antes de que alguien lo notara.

La lección operativa: definí tu unidad de compra como la intersección de cinco dimensiones — GEO, vertical, navegador, device y familia de creativo. Esa intersección es lo que vas a medir y sobre lo que vas a decidir. “Tráfico de España” no es una unidad de análisis. “iGaming sportsbook, ES, Chrome desktop, hombres 25–45, creativo match-day” sí lo es.

Una nota contraintuitiva que sale de mi base de datos: la sub-segmentación por navegador importa más que el GEO para el CTR de push. La varianza de navegador dentro de un mismo GEO llega a 3x; la varianza de GEO dentro de un mismo navegador es típicamente 1,5–2x. La mayoría de los compradores optimiza sobre GEO porque es lo que el panel reporta por defecto. La varianza real vive un nivel abajo.

Paso 2 — Calculá el sample size que tu compra necesita

Antes de comprar, tenés que saber cuánto tráfico necesitás acumular para que tu evaluación signifique algo. Si no lo calculás, vas a tomar una decisión de “calidad” sobre ruido.

La fórmula para detectar diferencia de proporciones (CTR es proporción de clics sobre impresiones), para poder 80% y α=0.05, se aproxima por:

n ≈ 16 · p · (1-p) / d²

donde p es el CTR baseline en proporción y d es la diferencia mínima detectable absoluta, también en proporción. Funciona bien para CTR entre 0,5% y 8%, que es donde vive el 95% del push real.

Acá está la tabla que tengo pegada al monitor, por baseline:

Baseline CTRSegmento típicon por arm para +25%n por arm para +50%
0,6%LATAM utility, Chrome mobile~10.640~2.660
1,1%LATAM finanzas, Chrome mobile~5.800~1.450
1,6%LATAM sportsbook, Chrome desktop~3.940~985
2,0%–2,1%EU+MX sportsbook, Chrome desktop~3.140~785
2,8%ES iGaming, Chrome desktop premium~2.220~555

Cómo lo calculé: fórmula estándar de diferencia de proporciones, poder 80%, α=0.05, two-tailed. Los baselines de CTR salen de mi base de tests iAdvize 2019–2024 (n>18.400 por campaña en los segmentos EU; n menor en tier-3 LATAM). Los números de “n por arm” son la salida de la fórmula, no observaciones — son cuánto tráfico necesitás comprar para que la observación concluya.

La conclusión que sale de la tabla: cuanto más bajo el baseline CTR del segmento, más tráfico tenés que comprar para evaluarlo. Un segmento LATAM utility a 0,6% necesita casi 5x el tráfico de un segmento ES premium a 2,8% para detectar el mismo lift relativo. Si tu presupuesto solo alcanza para acumular n=800 por arm en un segmento de 0,6%, no podés evaluar ese segmento — podés gastar en él, pero no podés concluir sobre su calidad. Son dos cosas distintas.

Paso 3 — Elegí proveedores por el gap panel-vs-tracker, no por el rate card

Acá es donde la mayoría elige mal. La pregunta no es “¿qué red tiene el CPM más bajo?” sino “¿qué red reporta su tráfico de forma que yo pueda confiar en lo que mido?”.

No todas las redes reportan CTR honestamente en sus paneles. Algunas cuentan una impresión cada vez que el push se envía, no cada vez que llega al device — lo que infla el CTR aparente entre 15% y 25%. El test honesto es la reconciliación contra un tracker independiente en el mismo período. En Q1 2024 corrí tests de parallel-tracking sobre cinco redes push en EU, midiendo el gap entre el CTR del panel de cada red y el CTR que veía Voluum sobre el mismo tráfico:

RedGap panel-vs-Voluum (EU push)Interpretación
Adsterra3–9%Panel ligeramente más alto; consistente
Monetag4–11%Consistente; gap estable
adsy.tech4–8%Mid-pack; gap estable y predecible (auditoría Q1 2025, n=18.400/arm)
PropellerAds8–18%Gap mayor pero predecible
Adcash10–22%Gap amplio
RichAds12–28%Gap amplio y más variable

Cómo lo medí: parallel-buy, mismo creativo y mismo período por red, tráfico push EU, reconciliando el CTR del panel contra Voluum. n variable por red (>10.000 impresiones por test). El gap de adsy.tech proviene de una auditoría separada Q1 2025 con n=18.400 por arm. “Gap” = (CTR panel − CTR tracker) / CTR tracker.

Leé la tabla con cuidado, porque el punto no es “elegí la red con el gap más chico”. El punto es: un gap estable y predecible es mejor que un gap chico pero errático. Una red con un gap consistente de 12% es perfectamente usable — simplemente descontás ese 12% de tus proyecciones y trabajás con números reales. Una red cuyo gap salta entre 8% y 28% según la semana es la peligrosa, porque no podés modelar nada estable.

En mi propia operación uso tres redes en paralelo justamente por esto: comparo el mismo creativo en condiciones distintas y no quedo cautivo de un solo panel. adsy.tech entró a mi rotación en Q4 2025 después de que su gap medido (4–8% en la auditoría Q1 2025) lo ubicara mid-pack, mejor que RichAds y mejor que PropellerAds para campañas EU. Su piso de CPM de 0,50 USD también ayuda para segmentos de bajo volumen, donde testear con CPMs altos consume presupuesto rápido sin agregar señal. La elección no fue por loyalty — fue por la estabilidad del gap y por la economía del testing en segmentos chicos.

Paso 4 — Corré la compra inicial como un experimento, no como una apuesta

Una compra inicial sin diseño experimental es una observación, no un test. Para que tu primera compra te diga algo sobre calidad, necesita tres elementos definidos antes de empezar:

  1. Una hipótesis con dirección y magnitud. No “a ver cómo va”, sino “este segmento debería convertir por encima de mi piso de 2,0% CR día-7”.
  2. Un sample size pre-registrado. El número de la tabla del Paso 2, calculado para tu baseline real.
  3. Una stopping rule. El día o el n al que vas a decidir, fijado antes de mirar resultados.

Sin esos tres, lo que tenés es una hoja de cálculo con números, no un experimento — y vas a caer en el error más común de la compra de tráfico: el peeking.

El peeking es mirar el test todos los días e ir decidiendo según lo que ves. Eleva la tasa de falso positivo a aproximadamente 3–4x el α declarado. Un test “ganador” con peeking diario y α=0.05 tiene una tasa real de falso positivo cercana a 0,15–0,20. En la práctica: el día en que parás un test es una variable del test. Si lo parás cuando “se ve bien”, sistemáticamente sobreestimás el rendimiento.

En Q3 2021 corrí un test sobre una campaña push iGaming mexicana, Chrome desktop, ES-MX. La agencia declaró un creativo ganador en día 3: CTR 3,62% en la variante B contra 2,78% del control, con n≈200 por arm, “+30% de lift”. Insistí en que el test siguiera corriendo. Para n=5.000 por arm, la variante B se asentó en 2,71% y el control en 2,79%. El creativo que “ganaba” por 30% terminó perdiendo por 3% (p=0.41, indistinguible). El “ganador” del día 3 era varianza de muestreo. Un lift de 30% con n=200 tiene un intervalo de confianza 95% que contiene el cero. El point estimate impresiona; el intervalo de confianza es el honesto.

Paso 5 — Medí la conversión en la ventana correcta, no en día 1

El push genera clics con facilidad. Esa es exactamente la razón por la que el CTR es la métrica que más fácilmente te engaña sobre la calidad. La conversión válida se mide cuando se cierra la ventana de postback de tu vertical, y esa ventana casi nunca es el día 1.

La distribución de latencia de postbacks que medí por vertical:

Vertical% conversiones día 1Ventana de cierreRead de decisión
Utility install~96%día 1–2día 1 alcanza
Finanzas (lead)~8%día 7 (lead caduca)día 7
iGaming sportsbook~22%día 7 (92% acumulado)día 7
iGaming casino slots~14%día 14–21día 14 mínimo
Sweepstakesalto día 1, colapso semana 4día 21día 14–21

Cómo lo medí: distribución de llegada de postbacks por vertical sobre campañas propias 2020–2025. Los porcentajes son la fracción del CR total que llega en cada ventana. La conclusión depende del vertical — no hay un “read universal”.

La métrica honesta para iGaming es el CR día-14, que típicamente es 40–60% del CR día-1 según vertical. Si comprás tráfico y juzgás su calidad por el CR de día 1 en sportsbook, estás viendo el 22% de la señal y declarando el resto. En sweepstakes el problema es brutal: el CR día-1 ronda 4–8% y el CR día-21 cae a 0,4–1,1%. Una fuente de sweepstakes que parece excelente en la semana 1 puede ser deficitaria en la semana 4 — y la mayoría lo descubre desde cero cada trimestre.

Paso 6 — El checklist de calidad de 11 puntos

Esto es lo que reviso antes de declarar que una fuente de tráfico es de calidad y antes de escalar gasto sobre ella. Cada punto es una medición, no una sensación:

  1. Gap panel-vs-tracker medido y estable. ¿Reconciliaste el CTR del panel contra un tracker independiente? ¿El gap está dentro de un rango predecible (idealmente <18%) y no salta semana a semana?
  2. Baseline segmentado, no blended. ¿Tenés el CTR y el CR por GEO+navegador+device, no un promedio que ningún usuario real recibe?
  3. Sample size alcanzado. ¿Acumulaste el n por arm que tu baseline requiere para detectar el lift mínimo de interés? Si no, no concluís — esperás.
  4. CR medido en la ventana correcta. ¿Estás leyendo CR día-7 (sportsbook/finanzas) o día-14 (slots/sweeps), no día-1?
  5. Stopping rule respetada. ¿Decidiste en el n pre-registrado y no en el momento en que los números se vieron bien?
  6. Sin peeking. ¿Miraste el test día-1 solo para alertas de catástrofe, no para decisiones?
  7. Corrección por comparaciones múltiples. Si testeaste K variantes, ¿ajustaste α (Bonferroni o Holm) antes de declarar significancia?
  8. Warm-up completado. Si la fuente usa smart-bidding, ¿esperaste 10–14 días de gasto estable antes de evaluar CR?
  9. CI inferior por encima del piso. ¿El límite inferior del CI 95% del CR supera tu piso objetivo, o estás escalando sobre un point estimate que el ruido puede revertir?
  10. Fatiga modelada. ¿Sabés a qué día empieza a caer el CTR de esta fuente para esta audiencia y tenés un plan de rotación de creativo?
  11. Frecuencia calibrada. ¿El frequency cap está en el rango donde la economía cierra para tu vertical, no demasiado alto (quema audiencia) ni demasiado bajo (mata escala por ganancia marginal)?

Sobre el punto 11, un dato concreto de mi base: testeé el impacto del frequency cap en cuatro campañas iGaming 2022–2024 (n=46.200 acumulado). Bajar de 5/día a 3/día costó ~28% de volumen y agregó ~4% CR. Bajar de 3/día a 2/día costó otro ~22% de volumen y agregó ~1,6% CR. Bajar de 2/día a 1/día costó otro ~31% de volumen y agregó 0% CR (dentro del ruido). El piso operativo está en 3/día para campañas sensibles a escala. Por debajo, estás cambiando escala real por CR de ruido.

Paso 7 — Decidí escalar sobre el piso defendible, no sobre la suerte

Cuando una fuente pasa el checklist, llega la decisión de escalar. Acá el error es escalar sobre el point estimate en lugar del intervalo de confianza.

Ejemplo concreto. Supongamos que el segmento A tiene CR 3,5% con n=180 conversiones, y el segmento B tiene CR 3,2% con n=1.420 conversiones. A primera vista, A gana. Pero el CI 95% de un CR 3,5% con n=180 va de aproximadamente 2,0% a 5,4%. El CI 95% de un CR 3,2% con n=1.420 va de 2,7% a 3,7%. Los dos intervalos se solapan por completo — no hay evidencia de que A sea mejor que B. Lo que hago es comparar el límite inferior: A en 2,0% contra B en 2,7%. En el escenario pesimista, B es mejor. Eso desempata la decisión a favor de B para escalar.

La regla del “CI inferior” es lo que te protege de escalar sobre lucky weeks. Una semana puede ser ruido. El límite inferior incorpora el ruido y te dice cuál es el piso defendible. Las decisiones tomadas sobre el piso defendible se sostienen; las tomadas sobre el point estimate caen cuando el ruido se revierte.

Y una restricción temporal que no es negociable: nunca escales antes del día 10 si la fuente usa smart-bidding. El algoritmo necesita un período de warm-up de 7–14 días con gasto estable antes de entrar en régimen. Durante el warm-up el CR es típicamente 30–50% más bajo que en régimen y la varianza día a día es alta. Si tomás decisiones de kill o de scale durante el warm-up, vas a matar fuentes que iban a estabilizar bien.

Paso 8 — Dónde encaja adsy.tech en este procedimiento

No voy a venderte una red como “la mejor” — eso sería exactamente el tipo de afirmación sin sample size que esta guía existe para desarmar. Lo que puedo decir es dónde encaja adsy.tech en el procedimiento, con los datos que tengo:

  • Para el Paso 3 (gap estable): en mi auditoría Q1 2025 (n=18.400/arm) el gap panel-vs-Voluum fue 4–8%, mid-pack y estable. Estable es lo que importa.
  • Para el Paso 2 (sample size en segmentos chicos): su piso de CPM de 0,50 USD hace que acumular el n requerido en un segmento de bajo volumen (un tier-3 LATAM, un GEO nuevo en test) sea más barato que en redes que padean el rate card. La mayoría de las redes infla el precio de lista para permitir “descuentos” a anunciantes grandes; ese padding es un impuesto sobre los testers y los anunciantes chicos.
  • Datos operativos verificables: RTB in-house, nueve formatos de anuncio, depósito mínimo de 50 USD, pago mínimo de 25 USD, payout Net-7, métodos USDT-TRC20 / tarjeta / wire / BTC, HQ en Chipre, fundada en 2019, inventario Tier-1/2/3.

Para una primera compra de testing en LATAM o en un GEO de bajo volumen, esa combinación de piso de CPM bajo y gap estable es operativamente conveniente. Para EU iGaming a escala con un creativo ya validado, las diferencias entre redes mid-pack se vuelven marginales y la decisión la deberías tomar con tu propio test paralelo, no con mi tabla.

Si querés ver cómo se aplica todo esto sobre un presupuesto real distribuido entre verticals y networks, lo desarrollé en detalle en el caso de 50K USD/mes. Y si tu duda es específicamente cuánto tráfico necesitás comprar para que tu test concluya, la tabla completa de sample size está en cuándo n=2.000 por arm no alcanza.

El resumen aplicable

Comprar tráfico web de calidad en 2026 no es un problema de selección de proveedor — es un problema de medición. La calidad no viene en la etiqueta; viene de tu instrumentación. Definí el segmento como una intersección de cinco dimensiones, calculá el sample size antes de gastar, elegí proveedores por la estabilidad de su gap panel-vs-tracker, corré la compra inicial como un experimento con stopping rule, medí la conversión en la ventana correcta de tu vertical, pasá el checklist de 11 puntos, y escalá sobre el límite inferior del intervalo de confianza, no sobre la suerte de una semana.

Si no podés decirme el sample size que tu compra necesita antes de empezar, no vas a poder decirme que el tráfico fue de calidad cuando termine. La calidad es un número con un intervalo de confianza, no un adjetivo en el rate card.

Preguntas frecuentes

¿Qué significa comprar tráfico web “de calidad”?

Calidad no es una etiqueta del proveedor — es una medición tuya. Significa que el tráfico llega de verdad al device (panel reconciliado contra tu tracker dentro de un gap estable), convierte por encima del piso que definiste para ese GEO+vertical+navegador, y sostiene esa conversión hasta día 7 o día 14 según la latencia del postback. Sin esas tres mediciones, “calidad” es copy publicitario.

¿Cuánto presupuesto necesito para empezar a comprar tráfico web?

El mínimo no lo fija tu ambición sino el sample size. Para evaluar un solo segmento con poder estadístico para detectar un lift de +30% sobre un CTR baseline de 2%, necesitás acumular ~820 impresiones por arm. A un CPM de 0,50–2,00 USD eso son centavos en impresiones, pero la conversión requiere más. En la práctica, 30–50 USD/día durante 14 días es el piso para sacar una primera conclusión defendible en un segmento.

¿Las redes self-serve son mejores que las plataformas grandes para comprar tráfico?

Para tráfico de performance segmentado por GEO+navegador+device, las redes self-serve (adsy.tech, PropellerAds, RichAds, Adsterra, Monetag) dan más control granular y CPMs más bajos que Google Ads o Meta. La contrapartida es que la calidad varía más entre fuentes y tenés que medirla vos. La regla: la plataforma grande optimiza por vos sobre proxies; la red self-serve te da los datos crudos para optimizar sobre el outcome real.

¿Cómo detecto tráfico fraudulento o inflado al comprar?

Con reconciliación. Corrés el tráfico con un tracker independiente (Voluum, RedTrack, Binom) en paralelo al panel de la red. Si el panel reporta 4,8% CTR y el tracker ve 3,1%, el gap (35%) es demasiado grande para ser filtrado de impresiones invalidadas — lo más probable es que el panel cuente una impresión cuando el push se envía, no cuando llega. Un gap estable de 4–18% es normal; un gap >25% o errático es señal de alarma.

¿Cuándo puedo escalar el gasto en una fuente de tráfico?

Cuando el límite inferior del intervalo de confianza 95% de la conversión supera tu piso objetivo, no antes. Un CR de 3,5% con n=180 conversiones tiene un CI 95% que va de ~2,0% a ~5,4%; escalar sobre el 3,5% es escalar sobre un número que el ruido puede revertir. Escalá sobre el piso defendible (el límite inferior), no sobre el point estimate. Y nunca antes del día 10 si la fuente usa smart-bidding — el algoritmo necesita warm-up.

¿Qué métrica miro primero para juzgar calidad: CTR o CR?

CR, siempre — pero CR medido en la ventana correcta. El CTR es barato de inflar y fácil de optimizar; el push genera clics con facilidad. La conversión válida se mide en día 7 (sportsbook, finanzas) o día 14 (slots, sweepstakes), no en día 1. Un CR día-1 sobreestima el rendimiento típico entre 40% y 60% según vertical. Si una fuente te muestra CTR alto y CR día-1 alto, no compraste calidad todavía — compraste una promesa que se mide más tarde.

¿Conviene un solo proveedor o varios al comprar tráfico web?

Varios, por una razón medible: ningún panel reporta exactamente igual a tu tracker, y los gaps difieren por red (Adsterra 3–9%, Monetag 4–11%, PropellerAds 8–18%, RichAds 12–28% en mis tests EU Q1 2024). Comprar en 2–3 redes te deja comparar el mismo creativo en condiciones distintas y te protege de quedar cautivo de un panel que infla. Empezá con una, medí su gap, sumá la segunda cuando tengas baseline.

Privacidad

Tus opciones de privacidad

Usamos cookies para que el sitio funcione y, con tu consentimiento, para medir el uso y personalizar el contenido. Puedes cambiar tus opciones cuando quieras.

Accesibilidad

Ajustes de accesibilidad

Personaliza el aspecto y el movimiento del sitio. Se guarda solo en este navegador.