Home
Button Mobile Webdesign em Foco
Newsletter Webdesign em Foco
Support Webdesign em Foco
Contribuition Webdesign em Foco
Doe para a Webdesign em Foco
Suporte da Webdesign em Foco
Fechar

Data Science and Machine Learning - #9 Pandas V - Importação e Exportação de Arquivos

20/05/2021

Nesse tutorial aprenderemos como realizar a importação e exportação de arquivos, tais como csv, sql e outros utilizando a lib Pandas do Python.

Manipulando arquivos com Pandas

Uma das grandes vantagens do Python é a grande facilidade e rapidez na abertura e conversão de formatos de arquivos. Clicando neste link você consegue observar a infinidade de arquivos que são passíveis de conversão com Python e Pandas.

Outro site interessantíssimo que gostaria de compartilhar é o site de repositórios Kaggle. Neste site é possível baixar datasets de diferentes categorias e assuntos para praticar Data Science.

Trabalhando com Data Frame

Na aula de hoje trabalharemos com o Dataset da Netflix.

Importando módulos e Data Frame

import numpy as np
import pandas as pd

df = pd.read_csv("netflix_titles.csv",sep=',')
df.head()
del df['show_id']
df.head()
df.describe()
df.info()

Vamos agora fazer um exemplo de exportação de dados para outro formato utilizando os métodos to_ do Pandas:

print(df.head(20).to_html())
df[df['country']=='Brazil'].head(20).to_html('netflix.html')

Podemos também importar dados vindos de um banco de dados de um site ou blog caso ele esteja no formato mysql. Para isso, instalaremos dois módulos:

!pip install sqlalchemy
!pip install pymysql

E na sequência importá-los no nosso código:

from sqlalchemy import create_engine
import pymysql

Para fazermos a conexão com o MySql precisamos dos dados do banco e de um servidor de MySql. Na aula nós utilizamos o servidor do Wamp Server. Veja um exemplo de conexão abaixo:

db_connection = create_engine("mysql+pymysql://root:@localhost:3306/wef")
df = pd.read_sql('select * from posts',con=db_connection)
df[df['Id']==42].head()

Para exportar os dados para o Excel primeiro importamos um módulo e depois efetivamos a exportação:

!pip install openpyxl
df.to_excel('db.xlsx')

Com Pandas também é possível trazer dados de tabelas de sites externos.

!pip install lxml
df = pd.read_html("https://www.w3schools.com/html/html_tables.asp")
df

Por hoje é só! Sucesso nos códigos e na vida!

Receba as aulas da Webdesign em Foco em Seu Email
Suporte Webdesign em Foco

Posts Relacionados

Data Science and Machine Learning - #8 Pandas IV - União, Filtros e Apply
No video de hoje aprenderemos como realizar a união de DataFrames, filtro e método apply no conjunto de dados exibindo os resultados desejados.
Saiba mais!
Data Science and Machine Learning - #10 Matplotlib - Introdução
Na videoaula de hoje começaremos a trabalhar com disposição visual dos dados através de gráficos. Nessa aula iniciamos pela lib Matplotlib.
Saiba mais!
Python
Nesta seção aprofundaremos os conhecimentos sobre uma das linguagens em maior ascenção no mercado, o Python.
Saiba mais!