Scienza dei dati - Che cosa sono i dati?


Che cosa sono i dati?

I dati sono una raccolta di informazioni.

Uno degli scopi di Data Science è strutturare i dati, rendendoli interpretabili e facili da utilizzare.

I dati possono essere classificati in due gruppi:

  • Dati strutturati
  • Dati non strutturati

Dati non strutturati

I dati non strutturati non sono organizzati. Dobbiamo organizzare i dati a fini di analisi.

Dati non strutturati

Dati non strutturati


Dati strutturati

I dati strutturati sono organizzati e più facili da lavorare.

Dati strutturati


Come strutturare i dati?

Possiamo usare un array o una tabella di database per strutturare o presentare i dati.

Esempio di una matrice:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

L'esempio seguente mostra come creare un array in Python:

Esempio

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

È comune lavorare con set di dati molto grandi in Data Science.

In questo tutorial cercheremo di rendere il più semplice possibile la comprensione dei concetti di Data Science. Lavoreremo quindi con un piccolo set di dati di facile interpretazione.