Scienza dei dati - Che cosa sono i dati?
Che cosa sono i dati?
I dati sono una raccolta di informazioni.
Uno degli scopi di Data Science è strutturare i dati, rendendoli interpretabili e facili da utilizzare.
I dati possono essere classificati in due gruppi:
- Dati strutturati
- Dati non strutturati
Dati non strutturati
I dati non strutturati non sono organizzati. Dobbiamo organizzare i dati a fini di analisi.
Dati strutturati
I dati strutturati sono organizzati e più facili da lavorare.
Come strutturare i dati?
Possiamo usare un array o una tabella di database per strutturare o presentare i dati.
Esempio di una matrice:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
L'esempio seguente mostra come creare un array in Python:
Esempio
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
È comune lavorare con set di dati molto grandi in Data Science.
In questo tutorial cercheremo di rendere il più semplice possibile la comprensione dei concetti di Data Science. Lavoreremo quindi con un piccolo set di dati di facile interpretazione.