Scienza dei dati - Tabella di database
Tabella del database
Una tabella di database è una tabella con dati strutturati.
La tabella seguente mostra una tabella di database con i dati sanitari estratti da un orologio sportivo:
Durata | Impulso_medio | Impulso_max | Calorie_Bruciate | Ore_Lavoro | Ore_Sonno |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Questo set di dati contiene informazioni su una tipica sessione di allenamento come durata, polso medio, consumo calorico ecc.
Struttura della tabella del database
Una tabella di database è composta da colonne e righe:
Colonna 1 | Colonna 2 | Colonna 3 | Colonna 4 | Colonna 5 | Colonna 6 | |
Durata | Impulso_medio | Impulso_max | Calorie_Bruciate | Ore_Lavoro | Ore_Sonno | |
---|---|---|---|---|---|---|
Riga 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Riga 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Riga 3 | 45 | 90 | 130 | 260 | 8 | 7 |
Riga 4 | 45 | 95 | 130 | 270 | 8 | 7 |
Riga 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Riga 6 | 60 | 105 | 140 | 290 | 7 | 8 |
Riga 7 | 60 | 110 | 145 | 300 | 7 | 8 |
Riga 8 | 60 | 115 | 145 | 310 | 8 | 8 |
Riga 9 | 75 | 120 | 150 | 320 | 0 | 8 |
Riga 10 | 75 | 125 | 150 | 330 | 8 | 8 |
Una riga è una rappresentazione orizzontale dei dati.
Una colonna è una rappresentazione verticale dei dati.
Variabili
Una variabile è definita come qualcosa che può essere misurato o contato.
Gli esempi possono essere caratteri, numeri o tempo.
Nell'esempio sotto, possiamo osservare che ogni colonna rappresenta una variabile.
Durata | Impulso_medio | Impulso_max | Calorie_Bruciate | Ore_Lavoro | Ore_Sonno |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Ci sono 6 colonne, il che significa che ci sono 6 variabili (Duration, Average_Pulse, Max_Pulse, Calorie_Burage, Hours_Work, Hours_Sleep).
Ci sono 11 righe, il che significa che ogni variabile ha 10 osservazioni.
Ma se ci sono 11 righe, come mai ci sono solo 10 osservazioni?
È perché la prima riga è l'etichetta, il che significa che è il nome della variabile.