Un gráfico Q-Q normal de datos exp(1) generados aleatoriamente.
Un gráfico Q-Q normal de datos N(0,1) generados aleatoriamente.

En estadística, un gráfico Q-Q ("Q" viene de cuantil) es un método gráfico para el diagnóstico de diferencias entre la distribución de probabilidad de una población de la que se ha extraído una muestra aleatoria y una distribución usada para la comparación. Una forma básica de gráfico surge cuando la distribución para la comparación es una distribución teórica.[1]​ No obstante, puede usarse la misma idea para comparar las distribuciones inferidas directamente de dos conjuntos de observaciones, donde los tamaños de las muestras sean distintos.[2]

Un ejemplo del tipo de diferencias que pueden comprobarse es la no-normalidad de la distribución de una variable en una población. Para una muestra de tamaño n, se dibujan n puntos con los (n+1)-cuantiles de la distribución de comparación, por ejemplo, la distribución normal, en el eje horizontal el estadístico de k-ésimo orden, (para k = 1, ..., n) de la muestra en el eje vertical. Si la distribución de la variable es la misma que la distribución de comparación se obtendrá, aproximadamente, una línea recta, especialmente cerca de su centro. En el caso de que se den desviaciones sustanciales de la linealidad, los estadísticos rechazan la hipótesis nula de similitud.

Representación gráfica

editar

Para los cuantiles de la distribución de comparación se usa habitualmente la fórmula . Hay varias fórmulas diferentes que se han usado o propuesto para representaciones gráficas simétricas. Tales fórmulas tienen la forma , para algún valor de a entre 0 y . La expresión de arriba, es sólo un ejemplo de estas fórmulas, para a = 0. Otras expresiones incluyen:

  • [3]
  • [4]
  • [5]
  • [6]
  • [7]

Para grandes tamaños muestrales, n, hay muy poca diferencia entre todas estas expresiones.

Relación con gráficas de probabilidad

editar

Los gráficos Q-Q son similares a los gráficos de probabilidad (que para una distribución normal se llaman gráficos de probabilidad normal o gráficos rankit). La diferencia es que en un gráfico de probabilidad, en lugar de usar el cuantil de la distribución como eje X, se usa la esperanza matemática del estadístico de k-ésimo orden de la distribución. Sólo cuando n es pequeño hay una diferencia sustancial entre un gráfico Q-Q y un gráfico de probabilidad.

Véase también

editar

Notas

editar
  1. Gnanadesikan (1977) p199.
  2. Cleveland (1994), p144.
  3. A simple (and easy to remember) formula for plotting positions.
  4. Engineering Statistics Handbook: Normal Probability Plot Nótese que aquí también se usa una expresión diferente para el primer y último puntos. [1] cita el trabajo original de Filliben, en 1975.
  5. Distribution free plotting position, Yu & Huang
  6. Esta es una aproximación inicial de Blom en 1953 y se trata de la expresión usada en Minitab.
  7. Esta gráfica fue usada por Gringorten en 1963 para dibujar puntos en tests de la distribución de Gumbel.

Referencias

editar
  • Cleveland, W.S. (1994) The Elements of Graphing Data, Hobart Press ISBN 0-9634884-1-4
  • Gnanadesikan, R. (1977) Methods for Statistical Analysis of Multivariate Observations, Wiley ISBN 0-471-30845-5.
  • Wilk, M.B., Gnanadesikan, R. (1968) Probability plotting methods for the analysis of data. Biometrika, 55, 1–17.

Enlaces externos

editar


📚 Artikel Terkait di Wikipedia

Distribución de Weibull

univariate distributions. Vol. 1, Wiley Series in Probability and Mathematical Statistics: Applied Probability and Statistics (2nd edición), New York: John

Helecho de Barnsley

positioning let plotX = canvas.width * (x + 3) / 6; let plotY = canvas.height - canvas.height * ((y + 2) / 14); drawFilledCircle(plotX, plotY, 1, "green");

Estimación de la densidad de Kernel

(1969). «"Non-parametric estimation of a multivariate probability density"». Theory of Probability and Its Applications. doi:10.1137/1114019.  Wand, M.P;

Distribución normal

Anderson–Darling Test de Ryan–Joiner Test de Shapiro–Wilk Normal probability plot (rankit plot) Test de Jarque–Bera Test ómnibus de Spiegelhalter Supóngase

Prueba χ²

parameters, "Theory of Probability and its Applications", v.18, #3, 559–568 Chi-Square Calculator from GraphPad Chi-Square Test in QtiPlot Vassar College's

Metodología de superficie de respuesta

Almost Anything: Ideas and Essays, Revised Edition (Wiley Series in Probability and Statistics) George E. P. Box Box, G.E.P.; Wilson, K.B. (1951). «On

Sensibilidad climática

confidence interval of 1.4–7.7 °C for the climate sensitivity, and a 30% probability that sensitivity was outside the 1.5 to 4.5 °C range. Gregory, et al

Paradoja del cumpleaños

dia es de \(porcentaje)%"); Internet Archive, Isidore Jacob (1950). Probability and the weighing of evidence. London, C. Griffin. Consultado el 8 de