Job description
A FCamara está em busca de uma pessoa para atuar como Cientista de Dados LLM - Sênior, para atuar em um de nossos clientes do segmento Health.
Trata-se de uma Startup disruptiva que vem revolucionando a forma de comprar medicamentos manipulados e faz parte de um grupo líder no mercado brasileiro de farmácia, referência em Saúde e Bem-estar com mais de 3.000 lojas em todos os estados brasileiros.
Main responsibilities
Implementar, treinar e ajustar modelos de linguagem de grande escala (como GPT, BERT, T5, etc.)
para atender a diferentes necessidades de negócios.
Avaliar e selecionar frameworks e ferramentas de NLP para otimização de desempenho.
Definir e implementar estratégias e técnicas de tokenização eficientes para diferentes modelos e linguagens.
Desenvolver prompts otimizados para LLMs que maximizem a qualidade das respostas e adaptem o modelo a casos de uso específicos.
Desenvolver pipelines de processamento de texto que otimizem a entrada para modelos de linguagem.
Implementar soluções de OCR para extração precisa de texto em documentos digitalizados, imagens ou PDFs.
Projetar sistemas que combinem informações extraídas de bancos de dados ou documentos (retrieval) com geração de linguagem natural para responder perguntas complexas.
Desenvolver pipelines que integrem mecanismos de recuperação com modelos generativos.
Trabalhar com engenheiros de software, desenvolvedores de backend e equipes de produto para integrar modelos em fluxos de trabalho existentes.
Comunicar insights técnicos e operacionais para equipes não técnicas.
Explorar as tendências e avanços em NLP, aprendizado profundo e sistemas de recuperação para melhorar as soluções da empresa.
Garantir que as soluções estejam alinhadas com as melhores práticas e sejam compatíveis com requisitos éticos e de segurança.
Ser referência em Inteligência Artificial no time.
Requirements and skills
Perfil Especialista em LLM
Experiência em usar LLM em um contexto específico com uma base de conhecimento específica.
Experiência aplicando um modelo LLM em larga escala.
Conhecimento em Prompt Engineering.
Conhecimento de Fine-tuning em LLM.
Experiência com RAG (Retrieval Augmented Generation).
Conhecimento em Meta-Learning e Text embedding.
Experiência com Tokenização.
Experiência com Vector Database.
Conhecimento nas tecnologias e frameworks: LangChain, HuggingFace Transformers, OCR NER, TensorFlow, PyTorch, Pinecone,Streamlit.
Conhecimentos em OpenCV, Pytesseract, Spacy.
Experiência com Lora, QLora e outras estratégias para menor consumo de memória.
Perfil proativo
Mindset de usar Inteligência Artificial para ganho de eficiência.
#J-18808-Ljbffr