Job descriptionQuer fazer a diferença na nova economia e transformar pessoas e negócios para prosperarem? Vem pra Cadastra!Como Engenheiro de Machine Learning, você vai atuar no desenvolvimento de frameworks e ferramentas de LLM para suportar o crescimento acelerado de um dos nossos clientes. Você vai atuar no desenvolvimento e orientar o time nas melhoras práticas de mercado, com objetivo de fornecer dados de maneira sustentável, escalonável e com segurança. Sua atuação vai ser cross com vários times da área de dados.Main responsibilitiesNo nosso Data Hub você terá o desafio de:Projetar e implementar sistemas baseados em LLMs, integrando Retrieval-Augmented Generation (RAG) e bancos de dados vetoriais para melhorar a recuperação de informações e personalização de respostas;Criar pipelines robustos e automatizados para treinamento, ajuste fino (fine-tuning) e deployment de modelos em produção, otimizando desempenho e custo;Desenvolver processos eficientes de ingestão, indexação e consulta de dados estruturados e não estruturados em bancos de dados vetoriais, como Vector Search, Pinecone, Weaviate ou Milvus;Ajustar e testar LLMs para tarefas específicas, utilizando embeddings customizados e técnicas avançadas de aprendizado transferido;Implementar estratégias inovadoras para recuperação eficiente de dados em fluxos RAG, otimizando latência e precisão;Desenvolver métricas e ferramentas para monitorar a performance de modelos em produção, detectando drifts e garantindo confiabilidade;Projetar soluções alinhadas a padrões éticos, regulamentações de privacidade e segurança de dados;Criar documentação técnica clara e prática para facilitar o compartilhamento de conhecimento e a escalabilidade do trabalho;Trabalhar de forma integrada com equipes multidisciplinares (engenharia, produto, ciência de dados) para alinhar soluções de IA aos objetivos de negócio;Requirements and skillsO que a Cadastra espera de você:Graduação ou especialização em Ciência da Computação, Engenharia, Matemática, Estatística ou áreas relacionadas;Domínio no uso de modelos como GPT, BERT, T5 ou similares, e na aplicação de Retrieval-Augmented Generation;Experiência prática com tecnologias como Vector Search, Pinecone, Weaviate, Milvus para gerenciamento de embeddings;Proficiência em Python (Hugging Face, LangChain, PyTorch, TensorFlow) e experiência com ferramentas de MLOps (MLflow, Kubeflow, Vertex AI);Habilidade para processar grandes volumes de dados textuais, realizar indexações eficientes e implementar fluxos de ETL;Forte capacidade analítica para identificar desafios técnicos e propor soluções que gerem valor direto para os negócios;Competência em comunicação, colaboração e organização, com capacidade de trabalhar em equipes multidisciplinares e comunicar conceitos técnicos a públicos diversos;Diferenciais:Experiência em sistemas distribuídos de treinamento e inferência para LLMs;Familiaridade com APIs e integrações para modelos baseados em IA (e.g., OpenAI API, Hugging Face Hub, Anthropic);Vivência em design de sistemas de busca e recuperação de informações;Conhecimento em otimização de desempenho e custos para modelos RAG em produção;Interesse em questões éticas e práticas de mitigação de viés em IA;Contribuições para projetos open-source relacionados a IA, RAG ou bancos de dados vetoriais.Additional informationO que oferecemos:Vale alimentação e refeição no cartão FLASHAuxílio Home Office no cartão FLASHPlano de saúde de acordo com a sua localidadePlano odontológico de acordo com a sua localidadeDay off de aniversário + valor depositado no cartão FLASHLicença-maternidade e paternidade estendidaParticipação nos lucros (PLR)Seguro de vidaAuxílio crecheBônus por indicaçãoVale-transporteClude | Plataforma de SaúdeTotal Pass?CRM Bônus
#J-18808-Ljbffr