dev vs. ops

DEV VS. OPSDesenvolvendo para operação

Roberto Gaisergaiser@geekbunker.org@rgaiser

SITUAÇÃO ATUAL

“SIMPLES E DE FÁCIL MANUTENÇÃO”

“ISSO FICA PARA A SEGUNDA ENTREGA”

PLANNINGO começo

O COMEÇO

• “É fácil, está pronto na minha maquina”

• “Só fazer um serviço que responde <...>”

• “Colocamos tudo junto para facilitar”

• “Isso fica para a segunda entrega”

• “Depois a gente arruma”

• “Criamos uma <...> a mais no banco”

O QUE FAZER?

COMPONENTES

• “Um sistema é um sistema, outro sistema é outro sistema”

• Automação para criar o ambiente

• Ferramentas/Linguagens mais produtivas

• Isolar problemas e tornar serviços assíncronos

COMPONENTES

• Benefícios a longo prazo

• Flexibilidade para operação na alocação de recursos

• “code outlives its [developers] intentions”

• “All software is permanent”

• Logar tudo

• Log Driven Development

• Logs devem ser evidências de teste

• Syslog

• Formato padrão

• “Vou olhar no código...”

• Stack trace não é log

• Identificador único de transação

• Vários níveis de log

• Em português

• Log deve de ser parte do desenvolvimento, não algo a ser acrescentado depois

DEPLOY

• “É só pegar do <...> e jogar lá”

• Aplicação deve ser construída pensando no deploy

• Resolver dependências/requisitos sem criar conflitos com o repositório da distribuição

• Scripts de inicialização, rotacionar logs, etc

• Servidores de produção não tem acesso a internet

DEPLOY

• Evitar permissões incorretas

• Evitar arquivos em caminhos errados

• Evitar pacotes/arquivos desnecessários em produção

• Evitar versões diferentes dos mesmos módulos em caminhos diferentes

• Criar pacotes

TESTES

•Máquinas de homologação e desenvolvimento na monitoração

• Usar gráficos de monitoração como evidência de teste

•Documentar para que outros possam reproduzir seu resultado

TESTES

• Tempo de teste

• Testar o que não funciona

• Testar com componentes fora do ar

•Quantidade de requests esperados em produção?

TESTES

• TCPDump

•Número de requests X Requests simultâneos

• Evidências de teste

•Métricas úteis, ex: tempo de resposta ao invés de CPU Idle

SEGURANÇA

• Nunca rodar como ROOT

• Nunca colocar no sistema de versionamento informações como: credencias de acesso, logins, senhas, API Keys, etc

• Separação em componentes = Liberdade para Operação utilizar redes distintas

• Logs de auditoria, se necessários

• Regra de Apache != ACL

BANCO DE DADOS

• Utilizar da melhor forma possível, não porque “é mais fácil”

• Separar leitura e escrita

• Utilizar o banco relacional para o que ele faz melhor: integridade e transação

• Envolver AD no projeto

• Stored procedure?

BANCO DE DADOS

• Usar ORM para tudo? (Black Magic)

•Otimizar query. Se o ORM não permitir... você está fazendo errado!

• Sua aplicação deve se adaptar ao modelo de dados

• Índices

• Atenção com colunas “auto increment” + replicação do MySQL

BANCO DE DADOS

• Alternar automaticamente para um banco de Stand-by

• Reconectar automaticamente

• Usar filas, o banco falha!

• Cache e Replicação: “The good, the bad and the ugly”

• “Architectural anti-patterns for data handling” - http://www.slideshare.net/gleicon

CONFIGURAÇÕES

• Fora do jar, war, egg, gem...

• Possibilita automação

• Possibilita auditoria

• Possibilita versionamento

• Flexibilidade para operação

BACKUP

• “Minha aplicação precisa de backup”

•Qual a finalidade? Desastre? Restaurar um único registro?

• Teste de restore

• Segurança

• Tempo de retenção e vida útil da mídia

• dump/restore dentro da aplicação

FALHAS

• Falha elegante e rápida

• Apresentar menos funcionalidade ao invés de “Erro 500”

• Recuperação automática

• Conectar em múltiplos backend

•Distribuir carga

BALANCEAMENTO DE CARGA

• Aplicações que respondam ao teste do SLB

• /status => 200

• Possibilita testar uma máquina sem que ela esteja ativa para o SLB

• Entender os algoritmos disponíveis

INTERFACE PARA OPERAÇÃO

• REST + JSON

• Ferramenta CLI

• Limpar cache

• Reconectar no banco

INTERFACE PARA OPERAÇÃO

• Controlar processamento de fila

• Colocar aplicação em “read-only”

• Controlar recebimento de requests

• Controlar o /status

MONITORAÇÃO

• REST + JSON

• Ferramenta CLI

• Versão da aplicação e das dependências

• Conexões com backend, banco, cache, uptime, etc

• /monit

MONITORAÇÃO

• Usuários ativos

•Operações com erro, sucesso, etc

• Tempo das operações: média e desvio padrão

• Tipos de requisição: get, post, etc

•Número de itens na fila, tempo de processamento, etc

EU NÃO PRECISO SABER...

VOCÊ PRECISA SABER QUE:

• Existe um sistema operacional embaixo do software

• Existe rede e storage fora do software

• “System” e similares somente em situações extremas ou de licença

• “Eu programo em <...>, roda em qualquer coisa”

•Memória, processamento e disco são recursos finitos

• “Bringing a knife to a gunfight”

• Você define os requisitos

• “Quando você só tem martelo, tudo é prego”

• Framework?

•O universo conspira contra você

•Discos mentem

•Memória mente

•Máquinas falham

• VM’s mentem mais ainda

• “Diminishing returns“

• Gerar logs se a aplicação permitir, antes do restart

• Apagar incêndio = restart

• Testes simples: ping, date, route, dig e df identificam a maior parte dos problemas

PERGUNTAS?

dev vs. ops

rest json

interface

isso fica

balanceamento

banco de dados

segunda entrega

ferramenta

banco

Technology

stc-2017 dev-ops based continuous regression...

dev ops 簡介

бурцев dev ops agile

dev ops in 2013

cwin16 - paris - dev ops

dev ops for devs

dockerとdev ops

dev ops intro

dev ops training

dev ops of die (

mtug dev ops

dev ops day (1)

dev ops certificate

dev ops != dev+ops

fortify dev ops (002)

dev ops without the ops

dev ops bootstrap

dev-friendly ops

dev ops-presentation

dev ops ljc 2010