DataFrame è l’oggetto più comune di pandas.
È una struttura dati bi-dimensionale dove le colonne possono avere tipi diversi
- Assomiglia alle tabelle dei fogli di calcolo o dei database relazionali.
- Può essere vista come un dizionario di Series.
Informazioni
- df.columns
Restituisce un oggetto Index con le etichette delle colonne. - df.count()
- df.describe()
Produce una tabella con informazioni di sintesi su tutti i dati contenuti. - df.dtypes
Restituisce una serie con i tipi di dato per ogni colonna. - df.index
Restituisce un oggetto Index con le etichette delle righe. - df.info
Restituisce una serie di informazioni tecniche. - df.shape
Restituisce una tupla con le dimensioni della tabella: (righe, colonne).
Estrarre i dati
- df.head()
Restituisce le prime 5 righe della tabella - df.head(n)
Restituisce le prime n righe della tabella - df.iloc(), accesso con indici
- df.loc(), accesso con etichette
- df.tail()
Restituisce le ultime 5 righe della tabella - df.tail(n)
Restituisce le ultime n righe della tabella
Elaborare i dati?
- df.apply()
-
df.groupby()
- df.rename()
- df.sort_values()
-
df.value_counts()