top of page

Módulo 2 – Parte 5: yData-Profiling (ex-Pandas Profiling)

Atualizado: 5 de jun. de 2024

Olá amigos do Machine Learning e da IA! Bem-vindos à quinta e última parte do Módulo 2 do nosso Curso Gratuito Aplicado de Machine Learning!


Na aula de hoje vamos conhecer uma ferramenta muito útil para todos que querem ingressar no mundo do Machine Learning e da Ciência de Dados: a análise de perfil de dados, ou data profiling.


Tão importante quanto saber como analisar dados é analisar dados que sejam consistentes e coerentes. As ferramentas existentes para esta análise costumam ser caras, lentas e difíceis de aprender e dominar. Existem muitas, mas nem todas tem a popularidade e a reputação da já reconhecida e amada pandas profiling, agora chamada ydata-profiling.


Antes de prosseguirmos vale lembrar que será preciso instalar o pacote ydata-profiling e também atualizar a biblioteca scipy. Para isto, basta seguir estes passos:


abra uma janela do terminal do Windows a partir do Conda Navigator:

  1. na janela aberta, digite: conda install -c conda-forge ydata-profiling <ENTER>

  1. quando perguntado se deseja continuar, tecle Y e <ENTER>

  2. ao concluir-se a instalação, para voltar ao Conda Navigator, digite: exit <ENTER>


Feita a instalação do pacote ydata-profiling, podemos atualizar o pacote SciPy. Para isto:

  1. No canto superior esquerdo, clique em Enviroments

  2. No canto superior direito, onde se lê "Search packages", digite scipy e tecle <ENTER>

  3. Localize a linha que diz scipy e clique na seta, indicando que você quer fazer o update

  4. No canto inferior direito, clique no botão Apply e aguarde a conclusão da atualização

  5. Volte à home do Conda Navigator, localize o Jupyter Notebook e clique em Launch




Então vamos adiante. Baixe a aula de hoje e salve-a no diretório do curso:


Agora você já pode abrir o arquivo da aula de hoje. Continue em frente, siga aprendendo, que vem mais por aí!

Comments

Rated 0 out of 5 stars.
No ratings yet

Add a rating
bottom of page