Panda - Trame
Tracciare
Pandas usa il plot()
metodo per creare diagrammi.
Possiamo usare Pyplot, un sottomodulo della libreria Matplotlib per visualizzare il diagramma sullo schermo.
Maggiori informazioni su Matplotlib nel nostro Tutorial Matplotlib .
Esempio
Importa pyplot da Matplotlib e visualizza il nostro DataFrame:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
Gli esempi in questa pagina utilizzano un file CSV chiamato: 'data.csv'.
Scarica data.csv o Apri data.csv
Trama a dispersione
Specificare che si desidera un grafico a dispersione con l'
kind
argomento:
kind = 'scatter'
Un grafico a dispersione necessita di un asse x e y.
Nell'esempio seguente useremo "Durata" per l'asse x e "Calorie" per l'asse y.
Includi gli argomenti x e y in questo modo:
x = 'Duration', y = 'Calories'
Esempio
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Risultato
Ricorda:
nell'esempio precedente, abbiamo appreso che la correlazione tra "Durata" e "Calorie" era 0.922721
, e abbiamo concluso con il fatto che una durata maggiore significa più calorie bruciate.
Guardando il grafico a dispersione, sono d'accordo.
Creiamo un altro grafico a dispersione, dove c'è una cattiva relazione tra le colonne, come "Durata" e "Maxpulse", con la correlazione 0.009403
:
Esempio
Un grafico a dispersione in cui non ci sono relazioni tra le colonne:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Risultato
Ottieni la certificazione!
ISCRIVITI A $10
Istogramma
Usa l'
kind
argomento per specificare che vuoi un istogramma:
kind = 'hist'
Un istogramma necessita di una sola colonna.
Un istogramma ci mostra la frequenza di ogni intervallo, ad esempio quanti allenamenti sono durati tra 50 e 60 minuti?
Nell'esempio seguente utilizzeremo la colonna "Durata" per creare l'istogramma:
Esempio
df["Duration"].plot(kind = 'hist')
Risultato
Nota: l'istogramma ci dice che ci sono stati oltre 100 allenamenti che sono durati tra i 50 ei 60 minuti.