Gráfico Q-Q 📖 Wikipedia

Un gráfico Q-Q normal de datos exp(1) generados aleatoriamente.

Un gráfico Q-Q normal de datos N(0,1) generados aleatoriamente.

En estadística, un gráfico Q-Q ("Q" viene de cuantil) es un método gráfico para el diagnóstico de diferencias entre la distribución de probabilidad de una población de la que se ha extraído una muestra aleatoria y una distribución usada para la comparación. Una forma básica de gráfico surge cuando la distribución para la comparación es una distribución teórica.^[1] No obstante, puede usarse la misma idea para comparar las distribuciones inferidas directamente de dos conjuntos de observaciones, donde los tamaños de las muestras sean distintos.^[2]

Un ejemplo del tipo de diferencias que pueden comprobarse es la no-normalidad de la distribución de una variable en una población. Para una muestra de tamaño n, se dibujan n puntos con los (n+1)-cuantiles de la distribución de comparación, por ejemplo, la distribución normal, en el eje horizontal el estadístico de k-ésimo orden, (para k = 1, ..., n) de la muestra en el eje vertical. Si la distribución de la variable es la misma que la distribución de comparación se obtendrá, aproximadamente, una línea recta, especialmente cerca de su centro. En el caso de que se den desviaciones sustanciales de la linealidad, los estadísticos rechazan la hipótesis nula de similitud.

Representación gráfica

editar

Para los cuantiles de la distribución de comparación se usa habitualmente la fórmula ${\frac {k}{n+1}}$ . Hay varias fórmulas diferentes que se han usado o propuesto para representaciones gráficas simétricas. Tales fórmulas tienen la forma ${\frac {k-a}{n+1-2a}}$ , para algún valor de a entre 0 y ${\frac {1}{2}}$ . La expresión de arriba, ${\frac {k}{n+1}}$ es sólo un ejemplo de estas fórmulas, para a = 0. Otras expresiones incluyen:

${\frac {k-{\frac {1}{3}}}{n+{\frac {1}{3}}}}$ ^[3]

${\frac {k-0,3175}{n+0,365}}$ ^[4]

${\frac {k-0,326}{n+0,348}}$ ^[5]

${\frac {k-0,375}{n+0,25}}$ ^[6]

${\frac {k-0,44}{n+0,12}}$ ^[7]

Para grandes tamaños muestrales, n, hay muy poca diferencia entre todas estas expresiones.

Relación con gráficas de probabilidad

editar

Los gráficos Q-Q son similares a los gráficos de probabilidad (que para una distribución normal se llaman gráficos de probabilidad normal o gráficos rankit). La diferencia es que en un gráfico de probabilidad, en lugar de usar el cuantil de la distribución como eje X, se usa la esperanza matemática del estadístico de k-ésimo orden de la distribución. Sólo cuando n es pequeño hay una diferencia sustancial entre un gráfico Q-Q y un gráfico de probabilidad.

Véase también

editar

Análisis Probit, desarrollado por Chester Ittner Bliss en 1934.

Notas

editar

↑ Gnanadesikan (1977) p199.
↑ Cleveland (1994), p144.
↑ A simple (and easy to remember) formula for plotting positions.
↑ Engineering Statistics Handbook: Normal Probability Plot Nótese que aquí también se usa una expresión diferente para el primer y último puntos. [1] cita el trabajo original de Filliben, en 1975.
↑ Distribution free plotting position, Yu & Huang
↑ Esta es una aproximación inicial de Blom en 1953 y se trata de la expresión usada en Minitab.
↑ Esta gráfica fue usada por Gringorten en 1963 para dibujar puntos en tests de la distribución de Gumbel.

Referencias

editar

Cleveland, W.S. (1994) The Elements of Graphing Data, Hobart Press ISBN 0-9634884-1-4
Gnanadesikan, R. (1977) Methods for Statistical Analysis of Multivariate Observations, Wiley ISBN 0-471-30845-5.
Wilk, M.B., Gnanadesikan, R. (1968) Probability plotting methods for the analysis of data. Biometrika, 55, 1–17.

Enlaces externos

editar

Descripción alternativa de un gráfico Q-Q: http://www.stats.gla.ac.uk/steps/glossary/probability_distributions.html#qqplot

Datos: Q378347
Multimedia: Q-Q plot / Q378347

[1] Gnanadesikan (1977) p199.

[2] Cleveland (1994), p144.

[3] A simple (and easy to remember) formula for plotting positions.

[4] Engineering Statistics Handbook: Normal Probability Plot Nótese que aquí también se usa una expresión diferente para el primer y último puntos. [1] cita el trabajo original de Filliben, en 1975.

[5] Distribution free plotting position, Yu & Huang

[6] Esta es una aproximación inicial de Blom en 1953 y se trata de la expresión usada en Minitab.

[7] Esta gráfica fue usada por Gringorten en 1963 para dibujar puntos en tests de la distribución de Gumbel.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

Gráfico Q-Q 📖 Wikipedia

Índice

Representación gráfica

Relación con gráficas de probabilidad

Véase también

Notas

Referencias

Enlaces externos

📚 Artikel Terkait di Wikipedia

Distribución de Weibull

Helecho de Barnsley

Estimación de la densidad de Kernel

Distribución normal

Prueba χ²

Metodología de superficie de respuesta

Sensibilidad climática

Paradoja del cumpleaños