Scienza dei dati - Tracciare funzioni lineari
Il set di dati dell'orologio sportivo
Dai un'occhiata al nostro set di dati sanitari:
Durata | Impulso_medio | Impulso_max | Calorie_Bruciate | Ore_Lavoro | Ore_Sonno |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Traccia i dati esistenti in Python
Ora, possiamo prima tracciare i valori di Average_Pulse rispetto a Calorie_Burage usando la libreria matplotlib.
La plot()
funzione viene utilizzata per creare un grafico binning esagonale 2D di punti x,y:
Esempio
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Esempio spiegato
- Importa il modulo pyplot della libreria matplotlib
- Traccia i dati da Average_Pulse contro Calorie_Burage
kind='line'
ci dice che tipo di trama vogliamo. Qui, vogliamo avere una linea retta- plt.ylim() e plt.xlim() ci dicono su quale valore vogliamo che inizi l'asse. Qui, vogliamo che l'asse inizi da zero
- plt.show() ci mostra l'output
Il codice sopra produrrà il seguente risultato:
L'output del grafico
Come possiamo vedere, esiste una relazione tra Average_Pulse e Calorie_Burage. Calorie_Burage aumenta proporzionalmente con Average_Pulse. Significa che possiamo usare Average_Pulse per prevedere Calorie_Burnage.
Perché la linea non è completamente disegnata sull'asse y?
Il motivo è che non abbiamo osservazioni in cui Average_Pulse o Calorie_Burage sono uguali a zero. 80 è la prima osservazione di Average_Pulse e 240 è la prima osservazione di Calorie_Burage.
Guarda la linea. Cosa succede al consumo calorico se il polso medio aumenta da 80 a 90?
Possiamo usare la linea diagonale per trovare la funzione matematica per prevedere il consumo calorico.
Come risulta:
- Se l'impulso medio è 80, il consumo calorico è 240
- Se l'impulso medio è 90, il consumo calorico è 260
- Se l'impulso medio è 100, il consumo calorico è 280
C'è un modello. Se l'impulso medio aumenta di 10, il consumo calorico aumenta di 20.