Grados de Libertad

En estadística, grados de libertad es un estimador del número de categorías independientes en una prueba particular o experimento estadístico. Se encuentran mediante la fórmula n-r, donde n=número de sujetos en la muestra (también pueden ser representados por k-r, donde k=número de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales) y r es el número de sujetos o grupos estadísticamente dependientes.
Cuando se trata de ajustar modelos estadísticos a un conjunto de datos, los residuos -expresados en forma de vector- se encuentran habitualmente en un espacio de menor dimensión que aquél en el que se encontraban los datos originales. Los grados de libertad del error los determina, precisamente, el valor de esta menor dimensión.
Un ejemplo aclara el concepto. Supongamos que
X_1,\dots,X_n\, son variables aleatorias, cada una de ellas con media \mu, y que
\overline{X}_n={X_1+\cdots+X_n \over n}
es la "media muestral". Entonces las cantidades
X_i-\overline{X}_n\,
son los residuos, que pueden ser considerados estimaciones de los errores X_i - \mu. La suma de los residuos (a diferencia de la suma de los errores, que no es conocida) es necesariamente 0,
\sum_{i=1}^n({X_i}-\overline{X}_n)=\sum_{i=1}^n{X_i}-n\overline{X}_n=\sum_{i=1}^n{X_i}-\sum_{i=1}^n{X_i}=0
ya que existen variables con valores superiores e inferiores a la media muestral. Esto también significa que los residuos están restringidos a encontrarse en un espacio de dimensión n-1 (en este ejemplo, en el caso general a n-r) ya que, si se conoce el valor de n-1 de estos residuos, la determinación del valor del residuo restante es inmediata. Así, se dice que "el error tiene n-1 grados de libertad" (el error tiene n-r grados de libertal para el caso general)..

No hay comentarios:

Publicar un comentario