Funzioni di scienza dei dati


Questo capitolo mostra tre funzioni comunemente utilizzate quando si lavora con Data Science: max(), min() e mean().


Il set di dati dell'orologio sportivo

Durata Impulso_medio Impulso_max Calorie_Bruciate Ore_Lavoro Ore_Sonno
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Il set di dati sopra è composto da 6 variabili, ciascuna con 10 osservazioni:

  • Durata - Quanto è durata la sessione di allenamento in minuti?
  • Average_Pulse - Qual è stato il battito medio della sessione di allenamento? Questo è misurato da battiti al minuto
  • Max_Pulse - Qual è stato il battito massimo della sessione di allenamento?
  • Calorie_Burage - Quante calorie sono state bruciate durante la sessione di allenamento?
  • Hours_Work - Quante ore abbiamo lavorato al nostro lavoro prima della sessione di formazione?
  • Hours_Sleep - Quanto abbiamo dormito la notte prima dell'allenamento?

Usiamo il carattere di sottolineatura (_) per separare le stringhe perché Python non può leggere lo spazio come separatore.



La funzione max()

La funzione Python max()viene utilizzata per trovare il valore più alto in un array.

Esempio

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

La funzione min()

La funzione Python min()viene utilizzata per trovare il valore più basso in un array.

Esempio

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

La funzione media()

La funzione NumPy mean()viene utilizzata per trovare il valore medio di una matrice.

Esempio

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Scriviamo np. davanti a mean per far sapere a Python che vogliamo attivare la funzione mean dalla libreria Numpy .