Data Science - Percentili statistici


25%, 50% e 75% - percentili

I percentili vengono utilizzati nelle statistiche per fornire un numero che descrive il valore a cui una data percentuale dei valori è inferiore.

Percentili

Proviamo a spiegarlo con alcuni esempi, usando Average_Pulse.

  • Il percentile del 25% di Average_Pulse significa che il 25% di tutte le sessioni di allenamento ha una pulsazione media di 100 battiti al minuto o inferiore. Se capovolgiamo l'affermazione, significa che il 75% di tutte le sessioni di allenamento ha una pulsazione media di 100 battiti al minuto o superiore
  • Il percentile del 75% di Average_Pulse significa che il 75% di tutta la sessione di allenamento ha un polso medio di 111 o inferiore. Se capovolgiamo l'affermazione, significa che il 25% di tutte le sessioni di allenamento ha una pulsazione media di 111 battiti al minuto o superiore

Compito: trova il percentile del 10% per Max_Pulse

L'esempio seguente mostra come farlo in Python:

Esempio

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] - Isola la variabile Max_Pulse dal set di dati di integrità completo.
  • np.percentile() viene utilizzato per definire che vogliamo il percentile del 10% da Max_Pulse.

Il percentile del 10% di Max_Pulse è 120. Ciò significa che il 10% di tutte le sessioni di allenamento ha un Max_Pulse di 120 o inferiore.