Estamos selecionando profissionais para a equipe de Curadoria de Dados do Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS) do IGM-FIOCRUZ, no Parque Tecnológico da Bahia, para suporte às pesquisas. Os nossos novos membros participarão de atividades como: inspeção, validação, descrição, dicionarização, historicidade, qualidade, produção de metadados e relatoria de informações contidas nos dados utilizados para pesquisa.
Responsabilidades e atribuições
Automação de pipelines de dados em ambiente On-Premises para Big Data;
Apoiar o desenvolvimento de pipelines de dados em linguagem adequada;
Auxiliar na elaboração e desenvolvimento de soluções relacionadas à produção de dados (ETL);
Criar metadados guiados por máquinas (data-driven technologies);
Participar das atividades de inspeção, validação, descrição, dicionarização, historicidade, qualidade, mapeamento, avaliação de arquitetura e relatoria dos dados e datasets produzidos para a pesquisa;
Apoiar na produção de conhecimento dos dados através da produção de metadados;
Apoiar a gestão dos dados do ambiente de produção;
Sugerir e implementar novas tecnologias nas atividades de curadoria de dados;
Participar de reuniões e sessões técnicos-científicas;
Elaborar e apresentar relatórios técnicos periódicos.
Requisitos e qualificações
Graduação plena ou tecnológica em Ciência da Computação, Informática ou áreas correlatas;
Experiência com ferramentas para processamento de Big Data e ferramentas de orquestração;
Experiência com jobs Spark e Elasticsearch;
Conhecimento de data lakes, implementados em MinIO e HDFS;
Experiência nas linguagens de programação Python e Shell Script;
Experiência com Linux;
Experiência com versionamento Git;
Inglês intermediário: leitura e interpretação.
Informações adicionais
Conhecimento de bancos de dados SQL e NoSQL;
Pós-graduação plena ou tecnológica em Ciência da Computação, Informática ou áreas correlatas;
Inglês avançado;
O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população.
#J-18808-Ljbffr