Bem-vindo à nossa sexta aula de Python para Ciência de Dados!
Hoje, vamos juntar as últimas aulas e colocar em prática os conhecimentos ao longo do nosso curso realizando análise e pré-processamento de dados! Iremos manusear o famoso dataset do Titanic!!
O que você vai aprender hoje:
Dados nulos – Começaremos vendo diversas maneiras de como tratar os dados faltantes de um dataset.
Heatmap – Iremos fazer ánalises sobre o conjunto de dados através de um heatmap (mapa de calor) para olhar se há dados duplicados e assim descartá-los.
Boxplot – Por fim, veremos como que funciona um boxplot e como analisar possíveis dados outliers para tratá-los.
Ao final desta aula, você será capaz de realizar pré-processamentos e análises sobre conjunto de dados e prepará-lo para fazer predições com o mesmo. Não perca a chance de dar um grande passo na sua jornada de Ciência de Dados!
Se você gostou, inscreva-se e siga a gente no Instagram @data.icmc para adquirir mais conhecimento!