Scienza dei dati - Introduzione alla statistica


Introduzione alla statistica

La statistica è la scienza dell'analisi dei dati.

Quando abbiamo creato un modello per la previsione, dobbiamo valutare l'affidabilità della previsione.

Dopotutto, quanto vale una previsione, se non possiamo fare affidamento su di essa?


Statistiche descrittive

Per prima cosa tratteremo alcune statistiche descrittive di base.

La statistica descrittiva riassume le caratteristiche importanti di un set di dati come:

  • Contare
  • Somma
  • Deviazione standard
  • percentile
  • Media
  • Eccetera..

È un buon punto di partenza per acquisire familiarità con i dati.

Possiamo usare la describe()funzione in Python per riassumere i dati:

Esempio

print (full_health_data.describe())

Produzione:

Stat Descrivi

Vedi qualcosa di interessante qui?