Para essa vaga, você atuará nas ações de Curadoria de Dados voltadas à organização, data quality e data handling de grandes bases de dados e elaboração de ETL e sua automação, atuando em projetos multidisciplinar sob a liderança do equipe da Curadoria de Dados do Cidacs.
A curadoria de dados é definida como as atividades realizadas para aprimorar os dados de pesquisa de maneira a apoiar sua capacidade de encontrar, acessibilidade, interoperabilidade e reutilização (geralmente chamados de 'princípios FAIR').
No CIDACS, a Curadoria de Dados é o setor responsável por atuar na área de Governança e Gestão de Dados, implantando e implementando políticas e fluxos de uso de dados e objetos digitais para curto, médio e de longo prazo.
Além de gerir processos de monitoramento de acervos digitais, cuidamos da criação e análise da eficácia de mecanismos e instrumentos internos para acesso e controle de dados.
**Responsabilidades e atribuições**
- Apoiar nos processos de organização e curadoria de dados;
- Aplicar transformações a conjuntos de dados para sua adequação as necessidades dos projetos;
- Apoiar o desenvolvimento de pipeline de dados performáticos em linguagem adequada;
- Aplicar técnicas de QA e Data Handling;
- Documentar dados, procedimentos e fluxos com bases nas melhores práticas (POP);
- Redação de normas, procedimentos e relatórios no que diz respeito as ações realizadas;
- Participação em reuniões de equipe.
**Requisitos e qualificações** O QUE VOCÊ PRECISA CONHECER / POSSUIR PARA SE CANDIDATAR**:
- Graduação completa (em qualquer área) com pós-graduação ou experiência comprovada em Engenharia de Dados/Informática para a Saúde;
- Experiência em cenários de Big Data (Spark, Data Lake, Elastic Search, Airflow);
- Experiência em pipelines para processamento e transformação de dados (ETL);
- Experiência com Python/R;
- Experiência em sistemas de controle de versão (Git);
- Conhecimento em Linux e Bash;
- Conhecimento em análise estatística de dados;
- Capacidade de lidar com time multidisciplinar;
- Disponibilidade de tempo integral e início imediato;
- Inglês Intermediário.
**O QUE GOSTARÍAMOS QUE VOCÊ SOUBESSE**:
- Experiência em utilização de Cluster HPC;
- Experiência com o uso de bases de dados do SUS (Ex: ESUS APS, SIVEP Gripe, SIRAG, SIH);
- Experiência com o uso de bases de dados públicas;
- Conhecimento de ferramentas de orquestração de Big Data;
- Conhecimentos em modelo comum de dados (OMOP/ODSHI e outros);
- Conhecimentos de serviços de Nuvem (AWS, Azure, Google);
- Conhecimento de tecnologias de containers;
- Pós-graduação nas áreas de tecnologia da informação, certificações e/ou cursos em Ciência de Dados.
**Informações adicionais**
Se você, como a gente, é interessado por dados, por tecnologia e inovação essa é a hora de se juntar ao nosso grupo.
Nosso espaço é um coletivo de muitas formações acadêmicas que trabalhar firme em um propósito em um ambiente acolhedor e com muito espaço para crescimento, desenvolvimento e inovação.
O CIDACS é um ambiente inclusivo e respeitoso.
A vaga destinada ao apoio das ações de curadoria na interoperabilidade de dados voltadas a projetos de cooperação internacional que visam usar padrões de interoperabilidade e modelos comuns de dados.
O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população.