
Olá amigos do Machine Learning e da IA! Bem-vindos à quinta e última parte do Módulo 2 do nosso Curso Gratuito Aplicado de Machine Learning!
Na aula de hoje vamos conhecer uma ferramenta muito útil para todos que querem ingressar no mundo do Machine Learning e da Ciência de Dados: a análise de perfil de dados, ou data profiling.
Tão importante quanto saber como analisar dados é analisar dados que sejam consistentes e coerentes. As ferramentas existentes para esta análise costumam ser caras, lentas e difíceis de aprender e dominar. Existem muitas, mas nem todas tem a popularidade e a reputação da já reconhecida e amada pandas profiling, agora chamada ydata-profiling.
Antes de prosseguirmos vale lembrar que será preciso instalar o pacote ydata-profiling e também atualizar a biblioteca scipy. Para isto, basta seguir estes passos:
abra uma janela do terminal do Windows a partir do Conda Navigator:
na janela aberta, digite: conda install -c conda-forge ydata-profiling <ENTER>
quando perguntado se deseja continuar, tecle Y e <ENTER>
ao concluir-se a instalação, para voltar ao Conda Navigator, digite: exit <ENTER>

Feita a instalação do pacote ydata-profiling, podemos atualizar o pacote SciPy. Para isto:
No canto superior esquerdo, clique em Enviroments
No canto superior direito, onde se lê "Search packages", digite scipy e tecle <ENTER>
Localize a linha que diz scipy e clique na seta, indicando que você quer fazer o update
No canto inferior direito, clique no botão Apply e aguarde a conclusão da atualização
Volte à home do Conda Navigator, localize o Jupyter Notebook e clique em Launch

Então vamos adiante. Baixe a aula de hoje e salve-a no diretório do curso:
Agora você já pode abrir o arquivo da aula de hoje. Continue em frente, siga aprendendo, que vem mais por aí!
Comments