Distribución t de Student

Modelo:Outros homónimos Modelo:Modelo de distribución de probabilidade A distribución t (de Student) é unha distribución de probabilidade que xorde do problema de estimar a media dunha poboación normalmente distribuída cando o tamaño da mostra é pequeno.

Aparece de xeito natural ao realizar a proba t de Student para a determinación das diferenzas entre dúas medias das mostras e para a construción do intervalo de confianza para a diferenza entre as medias de dúas poboacións cando se descoñece o desvío estándar dunha poboación e esta debe ser estimada a partir dos datos dunha mostra.

Caracterización

A distribución t de Student é a distribución de probabilidade do cociente

T = \frac{Z}{\sqrt{V / ν}} = Z \sqrt{\frac{ν}{V}}

onde

Z é unha variable aleatoria distribuída segundo unha normal típica (de media nula e varianza 1).
V é unha variable aleatoria que segue unha distribución χ² con $ν$ graos de liberdade.
Z e V son independentes

Se μ é unha constante non nula, o cociente $\frac{Z + μ}{\sqrt{V / ν}}$ é unha variable aleatoria que segue a distribución t de Student non central con parámetro de non-centralidade $μ$ .

Aparición e especificacións da distribución t de Student

Supóñase que X₁,..., X_n son variables aleatorias independentes distribuídas normalmente, con media μ e varianza σ²

Sexa

{\overline{X}}_{n} = (X_{1} + \dots + X_{n}) / n

a media da mostra. Entón

Z = \frac{{\overline{X}}_{n} - μ}{σ / \sqrt{n}}

segue unha distribución normal de media 0 e varianza 1.

Non obstante, dado que o desvío estándar non sempre se coñece previamente, Gosset estudou un cociente relacionado,

T = \frac{{\overline{X}}_{n} - μ}{S_{n} / \sqrt{n}},

S^{2} (x) = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \overline{x})^{2}

é a varianza da mostra e demostrou que a función de densidade de T é

f (t) = \frac{Γ ((ν + 1) / 2)}{\sqrt{ν π} Γ (ν / 2)} (1 + t^{2} / ν)^{- (ν + 1) / 2}

onde $ν$ é igual a n − 1.

A distribución de T chámase agora a distribución-t de Student.

O parámetro $ν$ representa o número de graos de liberdade. A distribución depende de $ν$ , pero non de $μ$ ou $σ$ , o que é moi importante na práctica.

Intervalos de confianza derivados da distribución t de Student

O procedemento para o cálculo do intervalo de confianza baseado na t de Student consiste en estimar o desvío estándar dos datos S e calcular o erro estándar da media: $\overline{X} = \frac{S}{\sqrt{n}}$ , sendo entón o intervalo de confianza para a media: $\overline{X} = \pm t_{α / 2, n - 1} \frac{S}{\sqrt{n}}$ .

Este resultado é o que se emprega no test de Student: posto que a diferenza das medias de mostras de dúas distribucións normais distribúese tamén normalmente, a distribución t pode empregarse para examinar se esa diferenza se pode supor razoablemente igual a cero.

Para efectos prácticos o valor esperado e a varianza son:

$E (t (n)) = 0$ e $V a r (t (n - 1)) = n / (n - 2)$ para $n > 3$ $E (t (n)) = 0$ e $V a r (t (n - 1)) = n / (n - 2)$ para $n > 3$ $E (t (n)) = 0$ e $V a r (t (n - 1)) = n / (n - 2)$ para $n > 3$ $E (t (n)) = 0$ e $V a r (t (n - 1)) = n / (n - 2)$ para $n > 3$

Historia

A distribución de Student foi descrita en 1908 por William Sealy Gosset. Gosset traballaba nunha fábrica de cervexa, Guinness, que prohibía aos seus empregados a publicación de artigos científicos debido a unha difusión previa de segredos industriais. Por ese motivo, Gosset publicou os seus resultados baixo o pseudónimo de Student (“estudante”).^[1]