Monitoramento de Data Pipelines (Grafana + Apache Airflow)

Resolvi publicar esse artigo pois vi pouca documentação ou alternativas bem mais complexas dessas duas ferramentas em conjunto.

Diego Lopes
3 min readMay 2, 2020

Partindo do princípio que você já utiliza o Airflow como ferramenta de fluxo de processos para carga do seu datawarehouse ou datalake. O Grafana é uma boa opção para um monitoramento mais visual e em tempo real dos processos que rodam no Airflow.

As ferramentas que iremos utilizar são:

As coleções de tarefas que você necessita rodar de forma organizada e que geram relações e dependências dentro do Airflow são conhecidas como DAGs (Directed Acyclic Graph). Dependendo das necessidades pode haver um número elevado de dags, isso prejudica a visualização, monitoramento e gerenciamento dos seus fluxos de cargas, conforme imagem abaixo, temos inúmeras dags.

Dags on Airflow

Afim de criar um monitoramento simplificado e de forma visual para todas as dags, criei um dashboard no Grafana, onde posso filtrar por dags e nele tenho todas as informações possíveis de cada job.

Chega de teoria, vamos para prática

1 — Subindo o docker grafana

Após a instalação do docker no seu sistema operacional, é só executar o comando abaixo no seu terminal.

docker run -d -p 3000:3000 grafana/grafana

2 — Após isso acessar o browser com o endereço http://localhost:3000/login

Acesso padrão(user: admin pass:admin)

3 — Conectando o Grafana com o postgresql(database do meu airflow)

  • >Add data source
Save and Test

4 — Criar Dashboard, adicionar a conexão do postgre e utilizar as queries.

Queries utilizadas

Dashboard Airflow Monitoring
Dashboard Pesquisa por Tabelaa

Observação -> criei algumas variáveis $Dags e $Pesquisar:

Seguem configurações das duas

Variável $pesquisar
Variável $Dags

Arquivos Json do grafana se preferir apenas importar

Qualquer dúvida ou crítica, estou à disposição. https://www.linkedin.com/in/lopesdiego12/

--

--

Diego Lopes
Diego Lopes

Written by Diego Lopes

Data Architect, soccer addict, bass player, big data lover

No responses yet