Grafico a dispersione R


Grafici a dispersione

Hai imparato dal capitolo Trama che la plot()funzione viene utilizzata per tracciare i numeri l'uno contro l'altro.

Un "grafico a dispersione" è un tipo di grafico utilizzato per visualizzare la relazione tra due variabili numeriche e traccia un punto per ciascuna osservazione.

Ha bisogno di due vettori della stessa lunghezza, uno per l'asse x (orizzontale) e uno per l'asse y (verticale):

Esempio

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Risultato:

L'osservazione nell'esempio sopra dovrebbe mostrare il risultato del passaggio di 12 auto.

Potrebbe non essere chiaro per qualcuno che vede il grafico per la prima volta, quindi aggiungiamo un'intestazione e diverse etichette per descrivere meglio il grafico a dispersione:

Esempio

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Risultato:

Per ricapitolare, l'osservazione nell'esempio sopra è il risultato del passaggio di 12 auto.

L' asse x mostra quanti anni ha l'auto.

L' asse y mostra la velocità dell'auto quando passa.

Ci sono relazioni tra le osservazioni?

Sembra che più l'auto sia nuova, più vada veloce, ma potrebbe essere una coincidenza, dopotutto abbiamo registrato solo 12 auto.


Confronta le trame

Nell'esempio sopra, sembra esserci una relazione tra la velocità dell'auto e l'età, ma cosa succede se tracciamo anche le osservazioni di un altro giorno? Il grafico a dispersione ci dirà qualcos'altro?

Per confrontare il grafico con un altro grafico, utilizzare la points()funzione:

Esempio

Disegna due grafici sulla stessa figura:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Risultato:

Nota: per poter vedere la differenza del confronto, è necessario assegnare colori diversi ai grafici (utilizzando il colparametro). Il rosso rappresenta i valori del giorno 1, mentre il blu rappresenta il giorno 2. Si noti che abbiamo anche aggiunto il cexparametro per aumentare la dimensione dei punti.

Conclusione dell'osservazione: confrontando i due grafici, penso che si possa affermare con sicurezza che entrambi ci danno la stessa conclusione: più nuova è l'auto, più veloce è la guida.