Carica i dati
- Cerca il file “titanic.csv” online…
- Scaricalo in locale nella stessa cartella del codice sorgente
- Importalo in un DataFrame di Pandas
import pandas as pd
titanic=pd.read_csv("titanic.csv")
Osserva i dati
Tipo?
print(type(titanic)) # <class 'pandas.core.frame.DataFrame'>
Tipo di ogni colonna
print(titanic.dtypes)
Le dimensioni del DataFrame
print(titanic.shape) # (891, 12)
Visualizza solo le prime 5 righe
print(titanic.head())
…
Una colonna
Ottieni un oggetto Series
s=titanic["Sex"]
print(type(s)) # <class 'pandas.core.series.Series'>
print(s.shape) # (891,)
print(s.head() # Le prime 5 righe della colonna "Sex"
Più colonne
Ottieni un oggetto DataFrame
df=titanic[["Age", "Sex"]]
print(type(df)) # <class 'pandas.core.frame.DataFrame'>
print(df.shape) # (891,2)
print(df.head() # Le prime 5 righe delle colonne "Age" e "Sex"
…
Vedi
- https://pandas.pydata.org/docs/getting_started/intro_tutorials/02_read_write.html
- Sinan Ozdemir, Data Science, APOGEO – Pag. 52