A Avra é uma deep tech brasileira que nasceu agora, no começo de 2024, mas que em pouco tempo ganhou tração e está mudando a relação da indústria e bancos com as pequenas e médias empresas do Brasil. Em nosso DNA está o uso de Inteligência Artificial (de verdade) para criar nossos modelos fundacionais proprietários aplicado à crédito, e trazer um impacto direto em receita e qualidade para nossos clientes.
A Avra nasce da união de 2 fundadores referências em seus mercados:
Bruno Alano (CTO) é ex-OpenAI, trabalhou 8 anos como CTO até o exit, é co-fundador da Associação Brasileira de Inteligência Artificial, foi líder em Data Science na isaac e Jusbrasil, e traz todo esse repertório para criarmos um time Tier A em tecnologia no Brasil;
Viviane Meister (CEO) foi líder na idwall por 4 anos cuidando de diversas áreas desde customer success até go-to-market. Também atuou em crédito no Itaú BBA e Santander;
Somos apoiados por investidores de peso, incluindo Maya Capital, Norte Ventures, Sequoia Capital, André Street (ex-CEO da Stone), NVIDIA e outros. Além disso, contamos com advisors com passagens por empresas como Google, Palantir, e Ambev.
Nosso time de engenharia está crescendo, e é responsável por construir nossos modelos fundacionais de inteligência artificial, melhorar nossas APIs e SDKs e construir nossa plataforma de dados que auxiliam grandes nomes da indústria e bancos a operarem melhor com pequenas e médias empresas.
Sobre a vaga
Estamos buscando um Engenheiro de Dados Sênior com experiência em desenvolver e gerenciar pipelines de dados robustos e escaláveis. Como parte do founding team da Avra, você terá um papel essencial na criação e manutenção da nossa infraestrutura de dados, garantindo a qualidade, integridade e conformidade dos dados em toda a organização.
Neste papel, você será responsável por desenvolver e manter nossos pipelines de dados utilizando tecnologias como Kafka e Google Pub/Sub, implementar e gerenciar soluções de integração de dados como Airbyte ou Fivetran, e garantir boas práticas na gestão de dados. Além disso, você colaborará com as equipes de engenharia e ciência de dados para otimizar o uso de dados em nossos produtos, e auxiliará em questões de compliance e governança de dados.
Responsabilidades
Desenvolver e manter pipelines de dados robustos e escaláveis utilizando Kafka, Google Pub/Sub e/ou outras tecnologias referências no campo.
Implementar e gerenciar soluções de integração de dados, como Airbyte ou Fivetran, para garantir a ingestão e sincronização eficiente de dados multi-modais.
Assegurar a qualidade, integridade e segurança dos dados através de boas práticas de engenharia e governança de dados.
Colaborar com as equipes de engenharia e ciência de dados para otimizar a infraestrutura de dados e garantir que os dados estejam disponíveis, acessíveis e utilizáveis para as iniciativas de machine learning e análise.
Auxiliar na implementação e monitoramento de políticas de compliance relacionadas à gestão de dados, garantindo a conformidade com regulamentações e melhores práticas do setor.
Contribuir para a definição e execução das iniciativas estratégicas de dados da Avra.
Qualificações
5+ anos de experiência em engenharia de dados, com um histórico profundo na construção e manutenção de pipelines de dados escaláveis.
Experiência com tecnologias de streaming de dados, como Kafka e Google Pub/Sub.
Familiaridade com ferramentas de integração de dados, como Airbyte, Fivetran ou similares.
Experiência com ferramentas de transformação como dbt e/ou Spark.
Forte conhecimento de boas práticas de governança de dados e compliance.
Experiência com bancos de dados relacionais e não-relacionais, e habilidades de modelagem de dados.
Habilidade para trabalhar de forma autônoma e colaborar em equipe, com foco em qualidade e entrega contínua.
É um diferencial ter conhecimento na implementação de arquitetura de MLOps.
Nossa Stack de Tecnologia
Frontend: Typescript + React + Next.js
Backend: Python + Go
Bancos de dados: PostgreSQL + BigQuery + Clickhouse
Plataformas de Streaming: Kafka + Spark + PubSub
Modelos de AI: PyTorch + Jax
O que oferecemos
Trabalho interessante e desafiador em uma das startups referências em tecnologia no Brasil.
Equilíbrio saudável entre vida pessoal e profissional.
Salário competitivo e participação acionária.
Trabalho 100% remoto, porém temos também um escritório em São Paulo.
Férias ilimitadas e remuneradas (recomendamos no mínimo 4 semanas por ano).
Plano de Saúde com cobertura nacional.
Licença parental de 6 meses para a gestante e 2 meses para os pais.
#J-18808-Ljbffr