Shadow mode — não altera infraestrutura Dados históricos reais

Quantas réplicas cada serviço precisa antes do apito inicial.

Substituímos a configuração estática de autoscale por perfis calculados a partir do que realmente aconteceu: audiência, RPM, latência, erros e réplicas alinhados ao início de cada jogo. Três perfis distintos — Copa do Mundo (sem Brasil), Brasileirão (Premiere, demanda bem menor) e Seleção Brasil, que puxa mais demanda e mais rápido.

Demanda observada

Curva de audiência ao redor do início do jogo

Sessões ativas simultâneas no canal do evento — globo-fifa26 (sinal aberto) na Copa e na Seleção, Premiere (pfc*) no Brasileirão —, alinhadas ao início real do jogo sobre os jogos isolados do perfil. A linha é a mediana; a faixa é a variação típica entre jogos. A audiência sobe no apito e satura no jogo — como esperado.

Mediana entre jogos Faixa alta (jogos de maior audiência) Início do jogo (minuto 0)
Explorador

Réplicas observadas vs. recomendadas de um serviço no tempo

Réplicas observadas vs. recomendadas minuto a minuto ao redor do apito, incluindo o pós-jogo (até +5h) para enxergar o cooldown — a descida do scale-down. A distância entre as linhas é a discrepância a pré-escalar; o RPM (demanda do serviço) fica ao fundo como contexto. Escolha o serviço para inspecionar.

Réplicas recomendadas Réplicas observadas RPM P95 (demanda, contexto)
Base histórica

Jogos usados neste perfil

Descobertos no EPG e complementados por uma lista curada. Jogos do Brasil ficam isolados no perfil Brasil.

Metodologia

Como ler estes números

Transparência total do cálculo para QA e engenharia. Tudo é observacional e roda em shadow mode — nenhuma decisão automática de infraestrutura é tomada.

📈

Capacidade segura por réplica

Quantil 75% de RPM/réplica nos buckets saudáveis (erro ≤ 1%, latência ≤ 500 ms) e sob carga. Condicionar à carga remove a diluição das horas ociosas, em que o HPA segura o piso de réplicas.

🎯

Réplicas recomendadas

ceil(P95 do RPM × margem ÷ capacidade segura), nunca abaixo do piso observado. Margem de 20% para Copa e Brasileirão, 40% para a Seleção Brasil.

🫁

Headroom demonstrado

Maior RPM/réplica já entregue dentro do SLO (quantil 95%) dividido pela capacidade segura. É diagnóstico: mostra folga para elevar o target do HPA — pendente de load-test. Não reduz réplicas automaticamente.

⏱️

Pré-escala e buffer

Subidas antecipadas em 30 min; reduções só após 30 min de folga. Evita chegar atrasado ao pico e evita oscilar réplicas para baixo cedo demais.

# capacidade sustentada (governa as réplicas) safe_rpm_per_replica = max( quantil75( rpm/réplicas | saudável e sob carga ), quantil75( rpm/réplicas | saudável ) # guarda: nunca subestima ) required_replicas = ceil( P95(rpm) × margem / safe_rpm_per_replica ) # diagnóstico de folga (NÃO altera réplicas) demonstrated = quantil95( rpm/réplicas | saudável ) headroom = demonstrated / safe_rpm_per_replica
⚠️

Limitações honestas

Poucos jogos do Brasil ⇒ menor confiança estatística. A capacidade por réplica é observacional, não substitui teste de carga. O plano ainda não modela warm-up específico de cada app. Automatizar exige manter o HPA como proteção e limites aprovados por serviço.