Scienza dei dati - Tracciare funzioni lineari


Il set di dati dell'orologio sportivo

Dai un'occhiata al nostro set di dati sanitari:

Durata Impulso_medio Impulso_max Calorie_Bruciate Ore_Lavoro Ore_Sonno
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Traccia i dati esistenti in Python

Ora, possiamo prima tracciare i valori di Average_Pulse rispetto a Calorie_Burage usando la libreria matplotlib.

La plot()funzione viene utilizzata per creare un grafico binning esagonale 2D di punti x,y:

Esempio

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

Esempio spiegato

  • Importa il modulo pyplot della libreria matplotlib
  • Traccia i dati da Average_Pulse contro Calorie_Burage
  • kind='line'ci dice che tipo di trama vogliamo. Qui, vogliamo avere una linea retta
  • plt.ylim() e plt.xlim() ci dicono su quale valore vogliamo che inizi l'asse. Qui, vogliamo che l'asse inizi da zero
  • plt.show() ci mostra l'output

Il codice sopra produrrà il seguente risultato:

Funzione lineare

L'output del grafico

Come possiamo vedere, esiste una relazione tra Average_Pulse e Calorie_Burage. Calorie_Burage aumenta proporzionalmente con Average_Pulse. Significa che possiamo usare Average_Pulse per prevedere Calorie_Burnage.



Perché la linea non è completamente disegnata sull'asse y?

Il motivo è che non abbiamo osservazioni in cui Average_Pulse o Calorie_Burage sono uguali a zero. 80 è la prima osservazione di Average_Pulse e 240 è la prima osservazione di Calorie_Burage.

Funzione lineare

Guarda la linea. Cosa succede al consumo calorico se il polso medio aumenta da 80 a 90?

Funzione lineare

Possiamo usare la linea diagonale per trovare la funzione matematica per prevedere il consumo calorico.

Come risulta:

  • Se l'impulso medio è 80, il consumo calorico è 240
  • Se l'impulso medio è 90, il consumo calorico è 260
  • Se l'impulso medio è 100, il consumo calorico è 280

C'è un modello. Se l'impulso medio aumenta di 10, il consumo calorico aumenta di 20.