O teste A/B de cupons no iFood mostrou aumento significativo de frequência de pedidos (+100%) e gasto total por usuário (+20%), mas sem impacto no ticket médio. O retorno financeiro foi positivo no agregado (ROI 31%), embora segmentos como heavy e não-heavy isolados tenham destruído valor, enquanto Desktop e iOS sustentaram ROI elevado e Android operou no limite. Conclui-se que os cupons são eficazes como alavanca de engajamento, mas demandam segmentação mais inteligente, calibragem de valor/gatilhos e governança de testes para garantir retorno sustentável, com potencial de gerar até R$4,8 milhões de margem incremental anual sob os ajustes propostos.
O iFood testou uma campanha de cupons com um grupo de usuários selecionados (grupo teste), enquanto outro grupo similar não recebeu o benefício (grupo controle).
O objetivo do experimento foi avaliar se o cupom aumentaria o engajamento e o gasto dos usuários, além de verificar a viabilidade financeira da iniciativa.
Período amostrado: Janela inferida de 01-01-2029 a 01-02-2019, desconsiderando registros isolados fora desse período (quantis 1–99%).
Glossário
Tabela 1 – Sumário por grupo (medianas, p95 e heavy users).
| Grupo | Usuários | Mediana GMV | Mediana pedidos | Mediana AOV | p95 GMV | p95 pedidos | p95 AOV | % Heavy Users (≥3) |
|---|---|---|---|---|---|---|---|---|
| Sem Cupom | 357261 | 66.2 | 1 | 40.85 | 457.40 | 9 | 100.6 | 30.71% |
| Com Cupom | 442676 | 79.8★ | 2★ | 41.00 | 507.19 | 10 | 99.80 | 36.93% |
Notas:
★ = diferença estatisticamente significativa versos Controle (teste Mann–Whitney, p < 0,05).
Figura 1 – Medianas por grupo (GMV, Pedidos, AOV).

Figura 2 – Distribuição de pedidos por usuário (controle vs tratamento).

Figura 3 – Boxplots (medianas) por grupo.
a) GMV por usuário

b) Pedidos por usuário

c) AOV por usuário

Interpretação:
O cupom não aumentou o valor de cada pedido, mas levou os usuários a pedirem com mais frequência, elevando o gasto total.
Isso reforça o cupom como alavanca de engajamento e hábito de consumo, e não como impulsionador de ticket médio.
Premissas adotadas:
- Valor do cupom: R$10, pago pelo iFood.
- Taxa de uso do cupom: 30%.
- Comissão média do iFood (take rate): 23% sobre o valor dos pedidos.
Tabela 2 – Indicadores financeiros.
| Métrica | Valor |
|---|---|
| Receita incremental total | R$1,74 milhão |
| Custo total dos cupons | R$1,33 milhão |
| Lucro incremental total | R$416 mil |
| Lucro incremental por usuário | R$0,94 |
| LTV | R$34,6 |
| CAC | R$10 |
| LTV/CAC | 3,5 |
| ROI (%) | 31,35% |
Break-even (geral do A/B)
Necessário: R$ 13,04 | Entregou: R$ 17,13 | Gap: +R$ 4,09
Lucro por usuário: R$ 0,94 | Status: OK
Nota sobre o LTV:
O cálculo do LTV (Lifetime Value) é normalmente utilizado em horizontes mais longos, acompanhando a evolução do cliente ao longo de vários meses ou anos. Na análise, os dados disponíveis cobrem apenas o período do experimento, de modo que o LTV foi aqui estimado a partir desse intervalo restrito.
Ainda assim, a métrica foi incluída porque oferece uma boa referência de potencial de retorno por cliente e permite compará-lo com o CAC. Ou seja, ainda que a estimativa seja mais conservadora e não capture todo o ciclo de vida real do cliente, ela ajuda a reforçar a análise de viabilidade financeira no contexto deste case.
Interpretação:
O investimento em cupons trouxe retorno positivo para o iFood.
Cada real gasto com cupons gerou aproximadamente R$3,50 de valor de cliente a longo prazo, indicando uma estratégia financeiramente sustentável.
Os resultados da análise mostraram que os cupons, da forma como foram aplicados, aumentaram o número de pedidos e o GMV, mas não alteraram o valor médio por pedido (AOV). Além disso, foi observado que usuários com alto engajamento (heavy users) utilizaram os cupons, o que reduz a eficiência da campanha.
Diante disso, recomendam-se ajustes na estratégia antes de repetir a ação:
Para validar essas hipóteses, sugere-se um desenho de experimento com três grupos:
Público-alvo do teste: clientes inativos ou de baixa frequência.
Com essa abordagem, será possível avaliar se os cupons funcionam não apenas como incentivo imediato, mas também como alavanca de crescimento sustentável para o negócio.
Objetivo. Agrupar clientes com comportamentos semelhantes para direcionar benefício, mensagem e canal, aumentando engajamento/retenção e otimizando custo de cupom.
Critérios utilizados:
Frequência (Heavy user):
A análise de frequência de pedidos divide os clientes em dois grupos: não-heavy (menos de 3 pedidos no período) e heavy (3 ou mais pedidos). A ideia é verificar se o cupom tem efeito diferente em clientes ocasionais, que ainda estão em fase de adoção do hábito, em comparação com clientes já engajados, que compram frequentemente. Esse corte simples ajuda a avaliar se os cupons estão incentivando progressão de frequência ou apenas sendo utilizados por usuários que já comprariam de qualquer forma.
Plataforma de origem: Android, iOS e Desktop.
A análise por plataforma de uso considera que o comportamento do cliente pode variar dependendo do canal de compra (app Android, app iOS ou versão Desktop). Fatores como usabilidade, jornada de checkout e perfil socioeconômico influenciam tanto o ticket médio quanto a sensibilidade ao desconto. Avaliar o resultado por plataforma permite entender onde o cupom gera mais retorno financeiro e onde pode estar operando no limite da viabilidade.
RFM (Recency–Frequency–Monetary):
A análise de RFM (Recency, Frequency, Monetary) é uma técnica clássica de segmentação de clientes, que classifica os usuários de acordo com três dimensões: recência da última compra (R), frequência de pedidos (F) e valor gasto (M). Cada dimensão é escalonada de 1 (baixo) a 5 (alto), gerando até 125 combinações possíveis (ex.: 111 = clientes pouco recentes, baixa frequência e baixo gasto; 555 = clientes muito recentes, com alta frequência e alto gasto). Essa granularidade permite identificar quais perfis respondem melhor ao cupom e quais tendem a gerar canibalização. No entanto, como muitas células têm poucos usuários, a análise aqui destaca apenas as cinco células mais populosas do grupo tratado, oferecendo uma visão mais estável e representativa do comportamento observado.
Novo vs recorrente:
A análise de novos vs recorrentes busca entender se os cupons funcionam de forma diferente para quem nunca comprou no iFood (novos) e para quem já tem histórico de pedidos (recorrentes). Essa distinção é importante porque o cupom pode atuar tanto como ferramenta de aquisição (atrair o cliente para a 1ª compra) quanto de retenção (estimular clientes existentes a comprar mais vezes). No entanto, na base deste experimento, não havia clientes totalmente novos, já que os dados contemplavam apenas usuários com pelo menos um pedido anterior. Por isso, essa segmentação aparece aqui apenas como exploratória, a ser aprofundada em futuros testes que incluam de fato usuários sem histórico.
1) Frequência (Heavy vs Não-heavy)
Tabela 3 – Medianas por segmento (Heavy vs Não-heavy) + métricas financeiras
| Segmento | Usuários (Trat., amostra) | Usuários (Trat., base) | GMV mediano (Ctrl → Trat) | Δ GMV | Pedidos medianos (Ctrl → Trat) | Δ Pedidos | AOV mediano (Ctrl → Trat) | Δ AOV | Receita inc. total (R$) | Custo total (R$) | Lucro inc. total (R$) | Lucro por usuário (R$) |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Não-heavy | 34.929 | 279.181 | 47,00 → 50,00 | +3,00★ | 1 → 1 | 0 | 40,09 → 40,45 | +0,37 | 200.754 | 837.543 | -636.789 | -2,28 |
| Heavy | 20.439 | 163.495 | 205,60 → 208,20 | +2,60 | 5 → 5 | 0 | 42,30 → 42,30 | +0,00 | 33.120 | 490.485 | -457.365 | -2,80 |
Notas:
• ★ indica diferença estatisticamente significativa entre Tratamento e Controle dentro do segmento (teste Mann–Whitney, p < 0,05). Em Não-heavy, embora a mediana de pedidos permaneça 1→1, o teste indica diferença na distribuição de pedidos.
• As medianas (GMV/pedidos/AOV) foram calculadas sobre amostras retiradas da base completa; os “Usuários (Trat., amostra)” refletem o tamanho coletado.
• As métricas financeiras (receita, custo, lucro, lucro por usuário) foram calculadas sobre 100% da base por segmento.
Break-even (Frequência)
Não-heavy: Necessário R$ 13,04 | Entregou R$ 3,13 | Gap −R$ 9,91 | Lucro/usuário −R$ 2,28 → NEG
Heavy: Necessário R$ 13,04 | Entregou R$ 0,88 | Gap −R$ 12,16 | Lucro/usuário −R$ 2,80 → NEG
Figura 4 - Mediana GMV/AOV/Pedidos por usuário (Heavy vs Não-heavy)
a) GMV por usuário

b) AOV por usuário

c) Pedidos por usuário

Interpretação:
O cupom não altera de forma relevante o comportamento típico (medianas) dentro de cada grupo:
Composição importa
O grupo Tratamento tem mais heavy (~37% vs ~31% no Controle, +6 p.p.). Essa diferença de mix eleva as médias globais do tratado mesmo quando as medianas por grupo mudam pouco.
Implicações financeiras
Com as premissas atuais (23% de take rate, cupom R$10, resgate 30%), o lucro incremental por usuário é negativo em ambos:
Isto pode indicar canibalização/ineficiência com o valor e/ou gatilho atuais quando apenas a frequência é considerada.
O cupom não move a mediana de pedidos (1 → 1 em não-heavy; 5 → 5 em heavy). O pequeno ganho observado vem de poucos clientes específicos com gasto acima da média, o que é insuficiente para compensar o custo quando olhamos o grupo como um todo.
Como a composição do Tratamento possui mais heavy users, o agregado pode parecer melhor, mas a política por frequência pura (heavy vs não-heavy) não se paga com o desenho atual.
Ações sugeridas:
KPIs a acompanhar:
2) Plataforma (Android / iOS / Desktop)
Tabela 4 – Medianas por segmento (Plataforma) + métricas financeiras
| Plataforma | Usuários (Trat., amostra) | Usuários (Trat., base) | GMV mediano (Ctrl → Trat) | Δ GMV | Pedidos medianos (Ctrl → Trat) | Δ Pedidos | AOV mediano (Ctrl → Trat) | Δ AOV | Receita inc. total (R$) | Custo total (R$) | Lucro inc. total (R$) | Lucro por usuário (R$) |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Android | 23.632 | 189.796 | 59,00 → 69,80 | +10,80★ | 1 → 2 | +1★ | 38,57 → 38,67 | +0,10 | 609.238 | 569.388 | 39.850 | 0,21 |
| Desktop | 7.939 | 63.370 | 63,20 → 73,60 | +10,40★ | 1 → 2 | +1★ | 39,33 → 39,43 | +0,10 | 305.302 | 190.110 | 115.192 | 1,82 |
| iOS | 23.336 | 185.497 | 77,80 → 94,00 | +16,20★ | 2 → 2 | 0 | 44,90 → 45,00 | +0,10 | 808.417 | 556.491 | 251.926 | 1,36 |
Notas:
• ★ indica diferença estatisticamente significativa entre Tratamento e Controle dentro do segmento (teste Mann–Whitney, p < 0,05).
• As medianas (GMV/pedidos/AOV) vêm de amostras da base de dados; “Usuários (Trat., amostra)” reflete o tamanho coletado.
• As métricas financeiras foram calculadas sobre 100% da base.
• Windows Phone: este segmento foi omitido da tabela por ter pouquíssimos usuários no Tratamento/Controle, o que gera estimativas instáveis (alta variância) e risco de leitura equivocada.
Break-even (Plataforma)
Desktop: Necessário R$ 13,04 | Entregou R$ 20,95 | Gap +R$ 7,91 | Lucro/usuário R$ 1,82 → OK
iOS: Necessário R$ 13,04 | Entregou R$ 18,95 | Gap +R$ 5,91 | Lucro/usuário R$ 1,36 → OK
Android: Necessário R$ 13,04 | Entregou R$ 13,96 | Gap +R$ 0,91 | Lucro/usuário R$ 0,21 → No limite
Windows Phone: Entregou R$ 10,46 | Gap −R$ 2,58 | Lucro/usuário −R$ 0,59 → NEG (N pequeno)
Figura 5 - Mediana GMV/AOV/Pedidos por usuário (Plataforma)
a) GMV por usuário

b) AOV por usuário

c) Pedidos por usuário

Figura 6 - Heavy Users por Plataforma

Interpretação
A análise por plataforma mostra que o efeito do cupom não foi homogêneo entre os usuários:
Android: os usuários aumentaram o GMV mediano em cerca de R$10,80, e passaram de 1 para 2 pedidos no período. O ticket médio (AOV) permaneceu estável, e a proporção de heavy users cresceu em torno de +6 p.p.. Apesar desses sinais positivos de engajamento, o retorno financeiro líquido foi praticamente nulo (≈R$0,21 por usuário). Isso indica que, embora o cupom tenha gerado comportamento mais ativo, o ganho incremental ainda é muito baixo para compensar o custo do incentivo.
Desktop: apresentou crescimento consistente, com GMV mediano +R$10,40 e progressão de 1 para 2 pedidos por usuário, além de estabilidade no AOV. O percentual de heavy users também subiu +6,7 p.p.. Diferentemente do Android, o resultado financeiro foi bastante favorável, gerando R$1,82 de lucro incremental por usuário. Ou seja, nesse canal, os cupons se mostraram uma alavanca eficiente tanto de engajamento quanto de retorno financeiro.
iOS: foi a plataforma com maior variação de GMV mediano (+R$16,20, 77,8 → 94,0), mas sem mudança na frequência de pedidos (estável em 2). Ainda assim, a proporção de heavy users aumentou em +6,7 p.p., e o impacto financeiro foi positivo (+R$1,36 por usuário). Isso sugere que, mesmo sem elevação do número típico de pedidos, os usuários iOS responderam ao cupom gastando mais no total, tornando a campanha eficiente também neste segmento.
Os resultados indicam que Desktop e iOS devem ser priorizados nas próximas campanhas, pois além de engajarem os clientes, entregam ROI positivo. Já o Android, apesar de estimular comportamento mais ativo, exige ajustes para que o investimento seja de fato rentável.
Ações sugeridas:
KPIs a acompanhar:
3) RFM (111–555)
Tabela 5 – RFM (Top 5 com mais usuários em Tratamento, medianas + AOV)
| RFM | Usuários (Trat.) | GMV mediano (Ctrl → Trat) | Δ GMV | Pedidos medianos (Ctrl → Trat) | Δ Pedidos | AOV mediano (Ctrl → Trat) | Δ AOV |
|---|---|---|---|---|---|---|---|
| 555 | 5.391 | 409,3 → 415,2 | +5,9 | 9 → 9 | 0 | 47,10 → 46,94 | −0,16 |
| 111 | 3.192 | 25,2 → 25,9 | +0,7 | 1 → 1 | 0 | 25,20 → 25,90 | +0,70 |
| 112 | 2.904 | 44,0 → 44,5 | +0,5 | 1 → 1 | 0 | 44,00 → 44,50 | +0,50 |
| 211 | 2.310 | 25,1 → 25,0 | −0,1 | 1 → 1 | 0 | 25,10 → 25,00 | −0,10 |
| 455 | 2.054 | 343,6 → 332,8 | −10,8 | 7 → 7 | 0 | 46,72 → 45,64 | −1,08 |
Notas:
• A grade RFM tem muitas células (até 125). Várias têm N pequeno, o que torna estimativas de ROI voláteis.
• O objetivo da RFM é direcionamento (quem merece mais/menos incentivo).
• As medianas (GMV/pedidos/AOV) vêm de amostras da base completa; “Usuários (Trat., amostra)” reflete o tamanho coletado.
• Top-5 por população: não houve diferenças estatisticamente significativas entre Tratamento e Controle nas células apresentadas (Mann–Whitney, p ≥ 0,05).
Interpretação
Ações sugeridas
KPIs a acompanhar:
4) Novo vs Recorrente (limitação atual)
Tabela 6 – Medianas (Novo vs Recorrente)
| Segmento | Usuários (Trat.) | GMV mediano (Ctrl → Trat) | Δ GMV | Pedidos medianos (Ctrl → Trat) | Δ Pedidos |
|---|---|---|---|---|---|
| Recorrente | 55.348 | 66,00 → 79,60 | +13,60 | 1 → 2 | +1 |
Interpretação
Clientes novos não existem na amostra, pois a base completa contém apenas usuários com ao menos um pedido anterior ao período de análise, então a “conversão=1,0” é espúria.
Ações sugeridas
Incluir usuários sem pedido na base de teste (grupo de controle e tratado) para medir 1ª compra; só então definir política específica para “novos”.
Frequência (Heavy vs Não-heavy)
Plataforma
RFM
A segmentação completa por RFM gera 125 combinações possíveis, o que torna a análise difícil de escalar e aplicar. Para a operação, recomenda-se trabalhar com tiers agregados (Baixo, Médio e Alto).
Métricas por segmento
Para monitorar a efetividade da estratégia, recomenda-se acompanhar métricas robustas (não sensíveis a outliers) como:
Evitar heavy users: já compram com alta frequência e consomem cupom sem gerar vendas extras, resultando em prejuízo médio de até R$2,80 por usuário (canibalização).
Focar em não-heavy e clientes inativos: maior potencial de progressão de frequência e reativação. Exemplo: clientes que fizeram apenas 1 pedido nos últimos 3 meses podem receber incentivo para chegar a 2–3 pedidos.
Cupom condicional (mínimo de gasto): por exemplo, “R$10 de desconto em compras ≥ R$40”. Esse modelo ajuda a elevar o ticket médio, hoje observado como estável.
Testar frete grátis como alternativa: pode ser mais eficiente em usuários sensíveis ao custo logístico, sobretudo novos clientes.
Priorizar Desktop e iOS: ROI positivo, chegando a R$1,82 de lucro incremental por usuário, como mostra o quadro de break-even (item 4.2).
Android: ROI próximo de zero (R$0,21), mas com sinais de maior engajamento (pedidos 1→2; heavy rate +6 p.p.).
Benefício esperado: comparar formatos de incentivo em condições mais justas, evitar gastos em segmentos onde o ROI já se mostrou negativo e garantir ajustes rápidos quando a campanha destruir valor.
Quadro – Break-even por célula (resumo)
| Célula | Necessário | Entregou | Gap | Lucro/usuário | Status |
|---|---|---|---|---|---|
| Geral | 13,04 | 17,13 | +4,09 | 0,94 | OK |
| Android | 13,04 | 13,96 | +0,91 | 0,21 | No limite |
| Desktop | 13,04 | 20,95 | +7,91 | 1,82 | OK |
| iOS | 13,04 | 18,95 | +5,91 | 1,36 | OK |
| Não-heavy | 13,04 | 3,13 | −9,91 | −2,28 | NEG |
| Heavy | 13,04 | 0,88 | −12,16 | −2,80 | NEG |
Regras práticas
Interpretação atual:
A análise financeira do teste mostra que, no agregado, a campanha gerou retorno positivo. No entanto, os resultados variam bastante por segmento. As plataformas Desktop e iOS apresentaram ROI confortável, sustentando expansão seletiva nesses canais. O segmento Android também mostrou crescimento em engajamento (pedidos 1→2 e aumento da base de heavy users em +6 p.p.), mas o retorno líquido ficou praticamente no zero a zero (R$0,21 por usuário), o que indica necessidade de calibragem no valor e nos gatilhos do cupom. Já os grupos heavy e não-heavy, analisados isoladamente, apresentaram destruição de valor: ambos tiveram prejuízo médio por usuário, confirmando que a política de cupons aplicada de forma ampla não se sustenta sem segmentação. Esses achados reforçam que a eficácia do incentivo depende não apenas do valor oferecido, mas de um direcionamento mais estratégico dos públicos.
Com os ajustes propostos (priorização de segmentos rentáveis e exclusão de grupos deficitários) a projeção é de uma margem incremental anual de aproximadamente R$4,8 milhões. Esse ganho vem de duas frentes principais:
Para garantir que futuras campanhas de cupons sejam sustentáveis e gerem aprendizado confiável, é necessário fortalecer a governança e a instrumentação dos testes. As seguintes práticas são recomendadas:
Checkpoints semanais/quinzenais
Criar uma rotina de monitoramento por segmento. Caso um grupo apresente resultado NEG (lucro/usuário < 0) em duas leituras consecutivas, com base tratada relevante (≥ 1.000 usuários), o cupom deve ser suspenso até redesenho. Essa medida impede que perdas persistam sem correção.
Uso de métricas mais robustas
Além da média, acompanhar indicadores como mediana, p95 e heavy rate. Esses indicadores reduzem a distorção causada por poucos casos extremos e oferecem uma leitura mais fiel do comportamento típico e do potencial de cauda.
Automatização do cálculo de break-even
Já implementada via break_even_table_spark, deve ser consolidada como ferramenta de rotina. Isso permite identificar rapidamente se cada célula se paga ou não, trazendo objetividade e agilidade à decisão.
Dashboards executivos
Construir um painel simples (segmento × ROI × break-even) para stakeholders. Com isso, líderes conseguem acompanhar em tempo quase real onde o incentivo está gerando valor e onde ajustes são necessários, sem depender de análises pontuais.
Em conjunto, essas práticas aumentam a disciplina no acompanhamento e tornam o processo de experimentação mais confiável, rápido e orientado a evidências.
A análise e as projeções aqui apresentadas foram feitas sob premissas claras, que devem ser consideradas na interpretação dos resultados:
Financeiras
Horizonte de análise
Extrapolação de impacto
População de novos clientes