Bem-vindo à nossa sexta aula de Python para Ciência de Dados!

Hoje, vamos juntar as últimas aulas e colocar em prática os conhecimentos ao longo do nosso curso realizando análise e pré-processamento de dados! Iremos manusear o famoso dataset do Titanic!!

O que você vai aprender hoje:

Dados nulos – Começaremos vendo diversas maneiras de como tratar os dados faltantes de um dataset.

Heatmap – Iremos fazer ánalises sobre o conjunto de dados através de um heatmap (mapa de calor) para olhar se há dados duplicados e assim descartá-los.

Boxplot – Por fim, veremos como que funciona um boxplot e como analisar possíveis dados outliers para tratá-los.

Ao final desta aula, você será capaz de realizar pré-processamentos e análises sobre conjunto de dados e prepará-lo para fazer predições com o mesmo. Não perca a chance de dar um grande passo na sua jornada de Ciência de Dados!

Se você gostou, inscreva-se e siga a gente no Instagram @data.icmc para adquirir mais conhecimento!