Apprendimento automatico
Machine Learning sta facendo imparare il computer dallo studio di dati e statistiche.
L'apprendimento automatico è un passo nella direzione dell'intelligenza artificiale (AI).
Machine Learning è un programma che analizza i dati e impara a prevedere il risultato.
Dove iniziare?
In questo tutorial torneremo alla matematica e studieremo le statistiche e come calcolare i numeri importanti in base ai set di dati.
Impareremo anche come utilizzare vari moduli Python per ottenere le risposte di cui abbiamo bisogno.
E impareremo come creare funzioni in grado di prevedere il risultato in base a ciò che abbiamo appreso.
Insieme di dati
Nella mente di un computer, un set di dati è qualsiasi raccolta di dati. Può essere qualsiasi cosa, da un array a un database completo.
Esempio di una matrice:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Esempio di una banca dati:
Carname | Colore | Età | Velocità | Passaggio automatico |
BMW | rosso | 5 | 99 | Y |
Volvo | Nero | 7 | 86 | Y |
VW | grigio | 8 | 87 | n |
VW | bianco | 7 | 88 | Y |
Guado | bianco | 2 | 111 | Y |
VW | bianco | 17 | 86 | Y |
Tesla | rosso | 2 | 103 | Y |
BMW | Nero | 9 | 87 | Y |
Volvo | grigio | 4 | 94 | n |
Guado | bianco | 11 | 78 | n |
Toyota | grigio | 12 | 77 | n |
VW | bianco | 9 | 85 | n |
Toyota | blu | 6 | 86 | Y |
Osservando l'array, possiamo indovinare che il valore medio è probabilmente intorno a 80 o 90 e siamo anche in grado di determinare il valore più alto e il valore più basso, ma cos'altro possiamo fare?
E guardando il database possiamo vedere che il colore più popolare è il bianco e l'auto più vecchia ha 17 anni, ma se potessimo prevedere se un'auto avesse un AutoPass, solo guardando gli altri valori?
Ecco a cosa serve l'apprendimento automatico! Analizzare i dati e prevedere il risultato!
In Machine Learning è comune lavorare con set di dati molto grandi. In questo tutorial cercheremo di rendere il più semplice possibile la comprensione dei diversi concetti di machine learning e lavoreremo con piccoli set di dati di facile comprensione.
Tipi di dati
Per analizzare i dati, è importante sapere con quale tipo di dati abbiamo a che fare.
Possiamo suddividere i tipi di dati in tre categorie principali:
- Numerico
- Categorico
- Ordinale
I dati numerici sono numeri e possono essere suddivisi in due categorie numeriche:
- Dati discreti
: numeri limitati a numeri interi. Esempio: il numero di auto che passano. - Dati continui
: numeri di valore infinito. Esempio: il prezzo di un articolo o le dimensioni di un articolo
I dati categoriali sono valori che non possono essere misurati l'uno rispetto all'altro. Esempio: un valore di colore o qualsiasi valore sì/no.
I dati ordinali sono come i dati categoriali, ma possono essere misurati l'uno contro l'altro. Esempio: voti scolastici in cui A è migliore di B e così via.
Conoscendo il tipo di dati della tua origine dati, sarai in grado di sapere quale tecnica utilizzare durante l'analisi.
Imparerai di più sulle statistiche e sull'analisi dei dati nei prossimi capitoli.