Apprendimento automatico - Distribuzione normale dei dati
Distribuzione normale dei dati
Nel capitolo precedente abbiamo imparato come creare un array completamente casuale, di una data dimensione e tra due valori dati.
In questo capitolo impareremo come creare un array in cui i valori sono concentrati attorno a un dato valore.
Nella teoria della probabilità questo tipo di distribuzione dei dati è noto come distribuzione normale dei dati , o distribuzione dei dati gaussiana , dal matematico Carl Friedrich Gauss che ha inventato la formula di questa distribuzione dei dati.
Esempio
Una tipica distribuzione normale dei dati:
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
Risultato:
Nota: un grafico di distribuzione normale è anche noto come curva a campana a causa della sua forma caratteristica di campana.
Spiegazione dell'istogramma
Usiamo l'array del numpy.random.normal()
metodo, con 100000 valori, per disegnare un istogramma con 100 barre.
Specifichiamo che il valore medio è 5.0 e la deviazione standard è 1.0.
Ciò significa che i valori dovrebbero essere concentrati intorno a 5,0 e raramente più lontani di 1,0 dalla media.
E come puoi vedere dall'istogramma, la maggior parte dei valori è compresa tra 4,0 e 6,0, con un massimo a circa 5,0.