Apprendimento automatico - Deviazione standard
Cos'è la deviazione standard?
La deviazione standard è un numero che descrive la distribuzione dei valori.
Una deviazione standard bassa significa che la maggior parte dei numeri è vicina al valore medio (medio).
Una deviazione standard elevata significa che i valori sono distribuiti su un intervallo più ampio.
Esempio: Questa volta abbiamo registrato la velocità di 7 auto:
speed = [86,87,88,86,87,85,86]
La deviazione standard è:
0.9
Ciò significa che la maggior parte dei valori rientra nell'intervallo 0,9 dal valore medio, che è 86,4.
Facciamo lo stesso con una selezione di numeri con un intervallo più ampio:
speed = [32,111,138,28,59,77,97]
La deviazione standard è:
37.85
Ciò significa che la maggior parte dei valori rientra nell'intervallo di 37,85 dal valore medio, che è 77,4.
Come puoi vedere, una deviazione standard più alta indica che i valori sono distribuiti su un intervallo più ampio.
Il modulo NumPy ha un metodo per calcolare la deviazione standard:
Esempio
Usa il metodo NumPy std()
per trovare la deviazione standard:
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
Esempio
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Varianza
La varianza è un altro numero che indica quanto sono distribuiti i valori.
Infatti, se prendi la radice quadrata della varianza, ottieni la deviazione standard!
O viceversa, se moltiplichi la deviazione standard per se stessa, ottieni la varianza!
Per calcolare la varianza devi fare come segue:
1. Trova la media:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Per ogni valore: trova la differenza dalla media:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. Per ogni differenza: trova il valore quadrato:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. La varianza è il numero medio di queste differenze al quadrato:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
Fortunatamente, NumPy ha un metodo per calcolare la varianza:
Esempio
Usa il var()
metodo NumPy per trovare la varianza:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
Deviazione standard
Come abbiamo appreso, la formula per trovare la deviazione standard è la radice quadrata della varianza:
√1432.25 = 37.85
Oppure, come nell'esempio precedente, utilizzare NumPy per calcolare la deviazione standard:
Esempio
Usa il metodo NumPy std()
per trovare la deviazione standard:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Simboli
La deviazione standard è spesso rappresentata dal simbolo Sigma: σ
La varianza è spesso rappresentata dal simbolo Sigma Square: σ 2
Riassunto capitolo
Deviazione standard e varianza sono termini usati spesso in Machine Learning, quindi è importante capire come ottenerli e il concetto alla base.