Scienza dei dati - Introduzione alla statistica
Introduzione alla statistica
La statistica è la scienza dell'analisi dei dati.
Quando abbiamo creato un modello per la previsione, dobbiamo valutare l'affidabilità della previsione.
Dopotutto, quanto vale una previsione, se non possiamo fare affidamento su di essa?
Statistiche descrittive
Per prima cosa tratteremo alcune statistiche descrittive di base.
La statistica descrittiva riassume le caratteristiche importanti di un set di dati come:
- Contare
- Somma
- Deviazione standard
- percentile
- Media
- Eccetera..
È un buon punto di partenza per acquisire familiarità con i dati.
Possiamo usare la describe()
funzione in Python per riassumere i dati:
Esempio
print (full_health_data.describe())
Produzione:
Vedi qualcosa di interessante qui?