#189 - DevOps e o outage da AWS

Falha ao colocar no Carrinho.

Tente novamente mais tarde

Falha ao adicionar à Lista de Desejos.

Tente novamente mais tarde

Falha ao remover da Lista de Desejos

Tente novamente mais tarde

Falha ao adicionar à Biblioteca

Tente outra vez

Falha ao seguir podcast

Tente outra vez

Falha ao parar de seguir podcast

Tente outra vez

#189 - DevOps e o outage da AWS

Ouça grátis

Ver detalhes do programa

Sobre este título

Aproveitamos a AWS fora do ar e o linkedin cheio de especialistas para falar um pouco sobre DevOps e SRE: o que realmente falhou, como dependências globais amplificam incidentes e por que comunicação e telemetria mudam o jogo quando o provedor está cambaleando.

Falamos de estratégias de resiliência multi‑região, desenho de failure domains e decisões pragmáticas de RTO/RPO. Discutimos feature flags para degradar funcionalidades com graça, circuit breakers e backoff nos clientes, priorização de runbooks e exercícios de caos que realmente medem MTTR. Também passamos por impactos colaterais em serviços gerenciados (EKS, IAM, KMS, DynamoDB), observabilidade em modo de guerra e os limites do “gerenciado”.

Fechamos com lições acionáveis para times de produto e plataforma: desde budget de disponibilidade e custos até testes de recuperação orientados a cenários. Dois tópicos‑chave que destacamos: resiliência multi‑região na prática e como treinar a organização para incidentes de baixa probabilidade e alto impacto.

Por fim, damos um giro de lições aprendidas para equipes de produto e plataforma: feature flags para fallback de integrações, rotas alternativas para planos de controle, circuit breakers em clientes, e playbooks para comunicação com stakeholders. Dois tópicos que merecem atenção especial neste papo: resiliência multi-região na prática e como preparar sua organização para incidentes “quase improváveis”.

#Links Importantes:
- Lucas Azevedo - https://www.linkedin.com/in/lazevedo-devops/
- Comunidade DevOps no Discord - https://discord.com/invite/k6wPagw4tV
- João Brito - https://www.linkedin.com/in/juniorjbn/
- Assista ao FilmeTEArapia - https://youtu.be/M4QFmW_HZh0?si=HIXBDWZJ8yPbpflM

## Hashtags

#DevOps #SRE #AWS #Outage #DNS #DynamoDB #AltaDisponibilidade #Resiliencia #Observabilidade #ChaosEngineering #IncidentResponse #Runbooks #FeatureFlags #CircuitBreaker #RTO #RPO #Kubernetes #DevSecOps #Kubicast #Containers #Getup

O Kubicast é uma produção da Getup, empresa especialista em Kubernetes e projetos open source para Kubernetes. Os episódios do podcast estão nas principais plataformas de áudio digital e no YouTube.com/@getupcloud.

Ainda não há avaliações

Comece

Listas e Coleções

Categorias

#189 - DevOps e o outage da AWS

Falha ao colocar no Carrinho.

Falha ao adicionar à Lista de Desejos.

Falha ao remover da Lista de Desejos

Falha ao adicionar à Biblioteca

Falha ao seguir podcast

Falha ao parar de seguir podcast

#189 - DevOps e o outage da AWS

Sobre este título