Esempio di diagramma a scatola e baffi
Confronto con le funzioni di densità di probabilità

In statistica il diagramma a scatola e baffi (o diagramma degli estremi e dei quartili[1] o box and whiskers plot o box-plot) è una rappresentazione grafica utilizzata per descrivere la distribuzione di un campione tramite semplici indici di dispersione e di posizione.

Rappresentazione

modifica

Viene rappresentato (orientato orizzontalmente o verticalmente) tramite un rettangolo diviso in due parti, da cui escono due segmenti. Il rettangolo (la "scatola") è delimitato dal primo e dal terzo quartile,[2] q1/4 e q3/4, e diviso al suo interno dalla mediana, q1/2. I segmenti (i "baffi") sono delimitati dal minimo e dal massimo dei valori.

In questo modo vengono rappresentati graficamente i quattro intervalli ugualmente popolati delimitati dai quartili.

Rappresentazioni alternative

modifica

Esistono scelte alternative per rappresentare il box-plot; tutte concordano sui tre quartili per rappresentare il rettangolo ma differiscono per la lunghezza dei segmenti, solitamente scelti più corti per evitare valori troppo "estremi", che vengono solitamente rappresentati solo come dei punti. La lunghezza dei baffi è spesso impostata ad 1,5 volte lo scarto interquartile.[3][4]

Comunemente i segmenti possono venire delimitati da particolari quantili, spesso della forma qα e q1-α, come q0,1 e q0,9.

Altre alternative, che tuttavia possono portare a tracciare i segmenti all'interno del rettangolo, o a farli terminare oltre i valori estremi del campione, delimitano i segmenti con:

  • la media più o meno la deviazione standard;
  • i valori (5q1/4-3q3/4)/2 e (5q3/4-3q1/4)/2, in modo che entrambi i segmenti siano lunghi 3/2 volte la lunghezza del rettangolo.

Note

modifica
  1. ^ Glossario Istat, su www3.istat.it (archiviato dall'url originale il 31 dicembre 2011).
  2. ^ Sheldon, p. 98.
  3. ^ (EN) Quartiles and Box Plots, in Data Science Discovery, Università dell'Illinois - Urbana-Champaign. URL consultato il 17 settembre 2024 (archiviato l'8 luglio 2024).
  4. ^ (EN) Boxplots, Interquartile Range, and Outliers (PDF), su mcckc.edu, Metropolitan Community College. URL consultato il 17 settembre 2024 (archiviato il 5 giugno 2024).

Bibliografia

modifica

Voci correlate

modifica

Altri progetti

modifica

Collegamenti esterni

modifica
  Portale Statistica: accedi alle voci di Wikipedia che trattano di statistica

📚 Artikel Terkait di Wikipedia

Diagramma a violino

informazioni aggiuntive rispetto ai diagrammi a scatola e baffi (detti anche box plot), creati da John Tukey nel 1977. Il nome deriva dalla somiglianza della

Scarto interquartile

allontanino da un valore centrale. Viene utilizzato nel disegno del diagramma box-plot. Lo scarto interquartile di una variabile aleatoria si ottiene tramite

Indice di dispersione

(archiviato dall'url originale il 31 dicembre 2011). Variabilità Indice di posizione Box-plot Indice di polidispersione Portale Matematica Portale Statistica

Quartile

interquartile; i quartili vengono inoltre utilizzati per rappresentare un box-plot. Il quartile zero, il primo, il secondo, il terzo e il quarto quartile

Indice di posizione

Un modo per rappresentare graficamente alcuni indici di posizione è il box-plot. ^ Glossario Istat, su www3.istat.it (archiviato dall'url originale il

Grafico fuorviante

box plot o diagramma a scatola e baffi, un grafico che riassume le caratteristiche principali di una distribuzione statistica univariata. I box plot possono

Pandas

bar(stacked=True) plt.show() Trama scatola (Box plot) df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE')) df.plot.box() plt.show() Histogram data = pd

Quantile

ISBN 978-88-7192-348-2. Sheldon M. Ross, 2.3.3 Percentili campionari e box plot, in Probabilità e statistica per l'ingegneria e le scienze, Apogeo Editore