Esercitazione Python

Python HOME Introduzione di Python Python per iniziare Sintassi Python Commenti Python Variabili Python Tipi di dati Python Numeri Python Fusione in pitone Stringhe Python Python booleani Operatori Python Elenchi Python Tuple di Python Insiemi Python Dizionari Python Python Se... Altro Python While Loops Python per loop Funzioni Python Python Lambda Matrici Python Classi/oggetti Python Ereditarietà Python Iteratori Python Ambito Python Moduli Python Date Python Python matematica Python JSON Python RegEx PIP Python Python Prova... Tranne Input utente Python Formattazione di stringhe Python

Gestione dei file

Gestione dei file Python File di lettura Python Python Scrivi/Crea file Python Elimina file

Moduli Python

Tutorial NumPy Guida dettagliata di Panda Tutorial Scipy

Python Matplotlib

Introduzione a Matplotlib Matplotlib Inizia Plottaggio Matplotlib Tracciatura Matplotlib Marcatori Matplotlib Linea Matplotlib Etichette Matplotlib Griglia Matplotlib Sottotrame Matplotlib Dispersione Matplotlib Barre Matplotlib Istogrammi Matplotlib Grafici a torta Matplotlib

Apprendimento automatico

Iniziare Modalità mediana media Deviazione standard percentile Distribuzione dei dati Distribuzione normale dei dati Trama a dispersione Regressione lineare Regressione polinomiale Regressione multipla Scala Treno/prova Albero decisionale

Python MySQL

MySQL per iniziare MySQL crea database MySQL Crea tabella Inserimento MySQL MySQL Seleziona MySQL dove MySQL Ordina per Elimina MySQL MySQL Drop Table Aggiornamento MySQL Limite MySQL Unisciti a MySQL

Python MongoDB

MongoDB Inizia MongoDB Crea database MongoDB Crea raccolta Inserisci MongoDB MongoDB Trova Interrogazione MongoDB Ordinamento MongoDB Elimina MongoDB Collezione Drop MongoDB Aggiornamento MongoDB Limite MongoDB

Riferimento Python

Panoramica di Python Funzioni integrate in Python Metodi di stringa Python Metodi dell'elenco Python Metodi del dizionario Python Metodi della tupla Python Metodi di impostazione Python Metodi di file Python Parole chiave Python Eccezioni Python Glossario Python

Riferimento del modulo

Modulo casuale Modulo Richieste Modulo Statistiche Modulo di matematica Modulo cMath

Python come fare per

Rimuovi i duplicati dell'elenco Invertire una stringa Aggiungi due numeri

Esempi Python

Esempi Python Compilatore Python Esercizi di Python Python Quiz Certificato Python

Apprendimento automatico - Distribuzione dei dati


Distribuzione dei dati

In precedenza in questo tutorial abbiamo lavorato con quantità molto piccole di dati nei nostri esempi, solo per comprendere i diversi concetti.

Nel mondo reale, i set di dati sono molto più grandi, ma può essere difficile raccogliere dati del mondo reale, almeno nella fase iniziale di un progetto.

Come possiamo ottenere grandi set di dati?

Per creare grandi set di dati per i test, utilizziamo il modulo Python NumPy, che viene fornito con una serie di metodi per creare set di dati casuali, di qualsiasi dimensione.

Esempio

Crea un array contenente 250 float casuali compresi tra 0 e 5:

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

Istogramma

Per visualizzare il set di dati possiamo disegnare un istogramma con i dati che abbiamo raccolto.

Useremo il modulo Python Matplotlib per disegnare un istogramma.

Scopri il modulo Matplotlib nel nostro Tutorial Matplotlib .

Esempio

Disegna un istogramma:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()

Risultato:

Spiegazione dell'istogramma

Usiamo l'array dall'esempio sopra per disegnare un istogramma con 5 barre.

La prima barra rappresenta quanti valori nell'array sono compresi tra 0 e 1.

La seconda barra rappresenta quanti valori sono compresi tra 1 e 2.

Eccetera.

Il che ci dà questo risultato:

  • 52 valori sono compresi tra 0 e 1
  • 48 valori sono compresi tra 1 e 2
  • 49 valori sono compresi tra 2 e 3
  • 51 valori sono compresi tra 3 e 4
  • 50 valori sono compresi tra 4 e 5

Nota: i valori dell'array sono numeri casuali e non mostreranno lo stesso identico risultato sul tuo computer.

Distribuzioni di Big Data

Un array contenente 250 valori non è considerato molto grande, ma ora sai come creare un insieme casuale di valori e, modificando i parametri, puoi creare il set di dati grande quanto desideri.

Esempio

Crea una matrice con 100000 numeri casuali e visualizzali utilizzando un istogramma con 100 barre:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 100000)

plt.hist(x, 100)
plt.show()