Home
Button Mobile Webdesign em Foco
Newsletter Webdesign em Foco
Support Webdesign em Foco
Contribuition Webdesign em Foco
Doe para a Webdesign em Foco
Suporte da Webdesign em Foco
Fechar

Data Science and Machine Learning - #37 Projeto Completo (Preparação dos Dados)

08/04/2022

Nesse tutorial vamos preparar o nosso Data Frame para que apresente dados concretos para o posterior uso do Machine Leaning.

Preparação de Dados - Python

Vamos começar limpando dados vazios e dividir quartos por família, além de transformar a coluna ocean proximity em dados binários.

df[df['total_bedrooms'].isnull()]
df['total_bedrooms'].fillna(df['total_bedrooms'].mean(),inplace=True)
df.info()

Para transormar os dados tipo string em binários podemos fazer assim:

df['ocean_proximity'].value_counts()

idCat,cat = df['ocean_proximity'].factorize()
df['ocean_proximity_cat']=idCat

df.tail()

Agora é só dividir os quartos pelas famílias:

df['total_rooms_per_households']=df['total_rooms']/df['households']
df['total_bedrooms_per_households']=df['total_bedrooms']/df['households']
df.head()

Podemos deletar agora as colunas sem uso:

del df['total_rooms']
del df['total_bedrooms']

Por hoje é só! Sucesso nos códigos e na vida!

Receba as aulas da Webdesign em Foco em Seu Email
Suporte Webdesign em Foco

Posts Relacionados

Data Science and Machine Learning - #36 Projeto Completo (Análise Exploratória)
Neste tutorial vamos iniciar a criação de um projeto completo de Data Science e Machine Learning.
Saiba mais!
Data Science and Machine Learning - #38 Projeto Completo (Plotagem de Dados)
Na aual de hoje aprenderemos como plotar gráficos dos dados através do Seaborn e Matplotlib utilizando como linguagem de programação o Python.
Saiba mais!
Python
Nesta seção aprofundaremos os conhecimentos sobre uma das linguagens em maior ascenção no mercado, o Python.
Saiba mais!