Scienza dei dati - Funzioni lineari


Le funzioni matematiche sono importanti da conoscere come scienziato dei dati, perché vogliamo fare previsioni e interpretarle.


Funzioni lineari

In matematica si usa una funzione per mettere in relazione una variabile con un'altra variabile.

Supponiamo di considerare la relazione tra consumo calorico e polso medio. È ragionevole presumere che, in generale, il consumo calorico cambierà al variare del polso medio: diciamo che il consumo calorico dipende dal polso medio.

Inoltre, può essere ragionevole presumere che all'aumentare dell'impulso medio, aumenterà anche il consumo calorico. Consumo calorico e polso medio sono le due variabili considerate.

Poiché il consumo calorico dipende dal polso medio, diciamo che il consumo calorico è la variabile dipendente e il polso medio è la variabile indipendente.

La relazione tra una variabile dipendente e una indipendente può spesso essere espressa matematicamente utilizzando una formula (funzione).

Una funzione lineare ha una variabile indipendente (x) e una variabile dipendente (y) e ha la forma seguente:

y = f(x) = ax + b

Questa funzione viene utilizzata per calcolare un valore per la variabile dipendente quando scegliamo un valore per la variabile indipendente.

Spiegazione:

  • f(x) = l'output (la variabile dipendente)
  • x = l'input (la variabile indipendente)
  • a = pendenza = è il coefficiente della variabile indipendente. Fornisce il tasso di variazione della variabile dipendente
  • b = intercetta = è il valore della variabile dipendente quando x = 0. È anche il punto in cui la linea diagonale incrocia l'asse verticale.


Funzione lineare con una variabile esplicativa

Una funzione con una variabile esplicativa significa che utilizziamo una variabile per la previsione.

Diciamo che vogliamo prevedere il consumo calorico utilizzando il polso medio. Abbiamo la seguente formula:  

f(x) = 2x + 80

Qui, i numeri e le variabili significano:

  • f(x) = L'uscita. Questo numero è dove otteniamo il valore previsto di Calorie_Burage
  • x = L'input, che è Average_Pulse
  • 2 = Pendenza = Specifica la quantità di calorie bruciate aumenta se Average_Pulse aumenta di uno. Ci dice quanto sia "ripida" la linea diagonale
  • 80 = Intercetta = Un valore fisso. È il valore della variabile dipendente quando x = 0

Tracciare una funzione lineare

Il termine linearità significa "linea retta". Quindi, se mostri graficamente una funzione lineare, la linea sarà sempre una linea retta. La linea può essere inclinata verso l'alto, verso il basso e in alcuni casi può essere orizzontale o verticale.

Ecco una rappresentazione grafica della funzione matematica sopra:

Funzione lineare

Spiegazioni del grafico:

  • L'asse orizzontale è generalmente chiamato asse x. Qui rappresenta Average_Pulse.
  • L'asse verticale è generalmente chiamato asse y. Qui rappresenta Calorie_Burage.
  • Calorie_Burge è una funzione di Average_Pulse, perché si presume che Calorie_Burage dipenda da Average_Pulse.
  • In altre parole, utilizziamo Average_Pulse per prevedere Calorie_Burage.
  • La linea blu (diagonale) rappresenta la struttura della funzione matematica che prevede il consumo calorico.