Job descriptionEstamos selecionando profissionais para a equipe de Curadoria de Dados do Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS) do IGM-FIOCRUZ, no Parque Tecnológico da Bahia, para suporte às pesquisas.
Os nossos novos membros participarão de atividades como: inspeção, validação, descrição, dicionarização, historicidade, qualidade, produção de metadados e relatoria de informações contidas nos dados utilizados para pesquisa.
Main responsibilitiesAutomação de pipelines de dados em ambiente On-Premises para Big Data;Apoiar o desenvolvimento de pipelines de dados em linguagem adequada;Auxiliar na elaboração e desenvolvimento de soluções relacionadas à produção de dados (ETL);Criar metadados guiados por máquinas (data-driven technologies);Participar das atividades de inspeção, validação, descrição, dicionarização, historicidade, qualidade, mapeamento, avaliação de arquitetura e relatoria dos dados e datasets produzidos para a pesquisa;Apoiar na produção de conhecimento dos dados através da produção de metadados;Apoiar a gestão dos dados do ambiente de produção;Sugerir e implementar novas tecnologias nas atividades de curadoria de dados;Participar de reuniões e sessões técnicos-científicas;Elaborar e apresentar relatórios técnicos periódicos. Requirements and skillsGraduação plena ou tecnológica em Ciência da Computação, Informática ou áreas correlatas;Experiência com ferramentas para processamento de Big Data e ferramentas de orquestração;Experiência com jobs Spark e Elasticsearch;Conhecimento de data lakes, implementados em MinIO e HDFS;Experiência nas linguagens de programação Python e Shell Script;Experiência com Linux;Experiência com versionamento Git;Inglês intermediário: leitura e interpretação. Additional informationConhecimento de bancos de dados SQL e NoSQL;Pós-graduação plena ou tecnológica em Ciência da Computação, Informática ou áreas correlatas;Inglês avançado.
#J-18808-Ljbffr