Bem-vindo à nossa oitava aula de Python para Ciência de Dados!

Hoje, avançaremos no nosso aprendizado, explorando como coletar dados diretamente da web e criar seus próprios datasets, utilizando técnicas fundamentais de Web Scraping!

O que você vai aprender hoje:

Datasets no Kaggle – Começaremos com uma breve introdução ao Kaggle, uma plataforma que oferece diversos datasets para seus projetos de Ciência de Dados. Você aprenderá a acessar e utilizar esses recursos de maneira eficiente.

Básico de HTML e CSS – Em seguida, revisaremos o básico de HTML e CSS, componentes essenciais para entender a estrutura das páginas da web e como podemos extrair informações delas.

Web Scraping com Beautiful Soup e Selenium – Vamos explorar as ferramentas Beautiful Soup e Selenium, fundamentais para coletar dados da web de forma automatizada. Você aprenderá como navegar, filtrar e extrair as informações necessárias para construir seu próprio dataset.

Criação de um Dataset – Por fim, colocaremos em prática todo o aprendizado, criando um dataset personalizado a partir de dados coletados via web scraping. Essa habilidade será crucial para você obter dados de fontes variadas e não estruturadas.

Ao final desta aula, você estará apto a acessar datasets prontos no Kaggle, entender a estrutura das páginas web, utilizar ferramentas de scraping e criar datasets sob demanda. Prepare-se para um passo importante na sua jornada como cientista de dados!

Se você gostou, inscreva-se e siga a gente no Instagram @data.icmc para continuar adquirindo mais conhecimento!