lettura facile

I diagrammi a dispersione in R

Oggi parliamo degli scatter plots nel linguaggio R.

Cosa sono gli scatter plot? Gli scatter plots, o grafici di dispersione, sono tra gli strumenti più utili e diffusi per esplorare le relazioni tra due variabili quantitative. Nel linguaggio R è molto semplice tracciare un grafico di questo tipo.
una linea di tendenza

Ecco un esempio pratico.

Immagina di avere due insiemi di dati: uno rappresenta le ore studiate da un gruppo di studenti, e l'altro i loro voti ottenuti in un esame.

Questi vettori in R rappresentano, rispettivamente, le ore di studio e i voti degli studenti.

ore_studio <- c(2, 4, 5, 7, 8, 9, 10, 12)

voti <- c(5, 6, 7, 7, 8, 9, 9, 10)

Vorresti sapere se c'è una correlazione tra queste due variabili, giusto? Gli scatter plots possono aiutarti a visualizzare questa relazione.

Per creare uno scatter plot in R, puoi usare la funzione plot()

plot(ore_studio, voti, main="Relazione tra ore di studio e voti", xlab="Ore di studio", ylab="Voti", pch=19)

In questo comando, pch=19 rende i punti del grafico più visibili, main aggiunge un titolo al grafico, e xlab e ylab etichettano rispettivamente gli assi x e y.

Dopo aver eseguito il codice, vedrai un grafico con i punti dispersi nel piano che rappresentano le coppie di dati ore di studio-voti.

un diagramma a dispersione in R

Se i punti formano una sorta di linea ascendente da sinistra a destra, significa che c'è una correlazione positiva tra le ore di studio e i voti: più uno studente studia, più alto è il voto che può aspettarsi.

Questo è un principio fondamentale nella statistica: la correlazione non implica causalità, ma può indicarne la presenza.

Per rendere la relazione ancora più evidente, potresti voler aggiungere una linea di tendenza al tuo scatter plot.

Puoi farlo con la funzione abline() e lm() per il modello lineare:

modello <- lm(voti ~ ore_studio)
abline(modello, col="red")

Questo aggiunge una linea rossa che meglio approssima i dati nel tuo scatter plot, permettendoti di visualizzare la direzione generale della relazione tra le ore di studio e i voti.

una linea di tendenza

Gli scatter plots sono incredibilmente potenti per visualizzare e capire le relazioni tra le variabili.

Esplorando graficamente i tuoi dati, puoi ottenere intuizioni che non sarebbero evidenti solo guardando le cifre.

Ricorda, la chiave sta nell'interpretazione: i dati possono raccontarti una storia, ma devi essere disposto ad ascoltare.

 




Se qualcosa non ti è chiaro, scrivi la tua domanda nei commenti.




FacebookTwitterLinkedinLinkedin