Exercícios do tópico 3
Questão 1: Importação de bancos de dados
Instale os pacotes readxl e rio e importe os bancos de dados demografico.xlsx, laboratorio.csv, saude_percebida.csv, medidas_fisicas.txt e habitos.xlsx. Use a função adequada para cada formato e salve cada um em um objeto com o nome correspondente ao arquivo.
Sugestão: Lembre-se que
.csvamericano usaread.csv(),.csvbrasileiro usaread.csv2(),.xlsxusaread_excel()e.txtusaread.table()com os argumentosheader = TRUEesep = ";".
Questão 2: Tratamento e inspeção do banco demografico
a) Inspecione o banco demografico e verifique quais classes não estão corretas. Depois, faça as devidas correções de cada classe.
Sugestão: Use
str()para inspecionar e verificar as classes do banco demografico.
Você precisará converter as variáveis sexo e estado_civil para fator, utilizando a função as.factor. Também precisará converter a variável data_nascimento para data, utilizando as.Date.
Sugestão: Use
format = "%d/%m/%Y"dentro deas.Date()para indicar o formato original da data.
b) Verifique se há valores nulos. Caso sim, remova-os do banco de dados.
c) Verifique se há valores duplicados. Caso sim, remova-os do banco de dados.
d) Crie uma variável chamada idade. Com base nas datas de nascimento, calcule quantos anos eles tinham em 01/01/1997.
Sugestão: Faça a diferença entre “1997-01-01” e as datas de nascimento. Você obterá a quantidade de dias de vida de cada um. Após isso, divida por 365 para converter para anos.
e) Qual a idade do indivíduo mais novo do banco de dados? E do mais velho?
Questão 3: Tratamento e inspeção do banco laboratorio
Contém os resultados dos exames de sangue realizados em 1.496 participantes. Os demais não compareceram à coleta.
a) Quais são os nomes das colunas?
b) Qual a classe de cada variável?
c) Normalize sorologia_chagas e converta para fator.
d) Qual o valor mínimo e máximo da variável glicose_mg_dl?
Questão 4: Tratamento e inspeção do banco saude_percebida
Reúne as respostas dos participantes sobre como avaliam a própria saúde, suas condições crônicas e o uso de medicamentos.
Inspecione o banco saude_percebida, normalize e converta as variáveis categóricas para fator.
Questão 5: Tratamento e inspeção do banco medidas_fisicas
Registra as medições corporais e de pressão arterial dos mesmos 1.496 participantes que realizaram os exames laboratoriais.
O banco medidas_fisicas foi importado com os nomes das colunas em letras minúsculas e com underline. Aplique as transformações abaixo em sequência:
a) Deixe todos os nomes em letras maiúsculas
b) Substitua os underlines ’_’ por espaço ’ ’
c) Volte para letras minúsculas
d) Substitua os espaços de volta por ’_’
Sugestão: Ao final, os nomes devem estar exatamente iguais aos originais. Esse exercício mostra como desfazer e refazer transformações.
Questão 6: Tratamento e inspeção do banco habitos
Registra o estilo de vida dos participantes, com informações sobre alimentação, atividade física e consumo de substâncias.
Inspecione o banco habitos, normalize e converta as variáveis categóricas para fator.