Panda DataFrame
Che cos'è un DataFrame?
Un Pandas DataFrame è una struttura di dati bidimensionale, come un array bidimensionale o una tabella con righe e colonne.
Esempio
Crea un semplice DataFrame Pandas:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
Risultato
calories duration 0 420 50 1 380 40 2 390 45
Individua riga
Come puoi vedere dal risultato sopra, DataFrame è come una tabella con righe e colonne.
I panda utilizzano l' loc
attributo per restituire una o più righe specificate
Esempio
Ritorna riga 0:
#refer to the row index:
print(df.loc[0])
Risultato
calories 420 duration 50 Name: 0, dtype: int64
Nota: questo esempio restituisce una serie Pandas .
Esempio
Ritorna la riga 0 e 1:
#use a list of indexes:
print(df.loc[[0, 1]])
Risultato
calories duration 0 420 50 1 380 40
Nota: quando si utilizza []
, il risultato è un Pandas DataFrame .
Ottieni la certificazione!
ISCRIVITI $ 10
Indici denominati
Con l' index
argomento, puoi nominare i tuoi indici.
Esempio
Aggiungi un elenco di nomi per assegnare un nome a ciascuna riga:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
Risultato
calories duration day1 420 50 day2 380 40 day3 390 45
Individua indici denominati
Utilizzare l'indice denominato loc
nell'attributo per restituire le righe specificate.
Esempio
Ritorno "giorno2":
#refer to the named index:
print(df.loc["day2"])
Risultato
calories 380 duration 40 Name: 0, dtype: int64
Carica i file in un DataFrame
Se i tuoi set di dati sono archiviati in un file, Pandas può caricarli in un DataFrame.
Esempio
Carica un file separato da virgole (file CSV) in un DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Imparerai di più sull'importazione di file nei prossimi capitoli.