Distribución t de Student
Modelo:Outros homónimos Modelo:Modelo de distribución de probabilidade A distribución t (de Student) é unha distribución de probabilidade que xorde do problema de estimar a media dunha poboación normalmente distribuída cando o tamaño da mostra é pequeno.
Aparece de xeito natural ao realizar a proba t de Student para a determinación das diferenzas entre dúas medias das mostras e para a construción do intervalo de confianza para a diferenza entre as medias de dúas poboacións cando se descoñece o desvío estándar dunha poboación e esta debe ser estimada a partir dos datos dunha mostra.
Caracterización
A distribución t de Student é a distribución de probabilidade do cociente
onde
- Z é unha variable aleatoria distribuída segundo unha normal típica (de media nula e varianza 1).
- V é unha variable aleatoria que segue unha distribución χ² con graos de liberdade.
- Z e V son independentes
Se μ é unha constante non nula, o cociente é unha variable aleatoria que segue a distribución t de Student non central con parámetro de non-centralidade .
Aparición e especificacións da distribución t de Student
Supóñase que X1,..., Xn son variables aleatorias independentes distribuídas normalmente, con media μ e varianza σ2
Sexa
a media da mostra. Entón
segue unha distribución normal de media 0 e varianza 1.
Non obstante, dado que o desvío estándar non sempre se coñece previamente, Gosset estudou un cociente relacionado,
é a varianza da mostra e demostrou que a función de densidade de T é
onde é igual a n − 1.
A distribución de T chámase agora a distribución-t de Student.
O parámetro representa o número de graos de liberdade. A distribución depende de , pero non de ou , o que é moi importante na práctica.
Intervalos de confianza derivados da distribución t de Student
O procedemento para o cálculo do intervalo de confianza baseado na t de Student consiste en estimar o desvío estándar dos datos S e calcular o erro estándar da media: , sendo entón o intervalo de confianza para a media: .
Este resultado é o que se emprega no test de Student: posto que a diferenza das medias de mostras de dúas distribucións normais distribúese tamén normalmente, a distribución t pode empregarse para examinar se esa diferenza se pode supor razoablemente igual a cero.
Para efectos prácticos o valor esperado e a varianza son:
e para e para e para e para
Historia
A distribución de Student foi descrita en 1908 por William Sealy Gosset. Gosset traballaba nunha fábrica de cervexa, Guinness, que prohibía aos seus empregados a publicación de artigos científicos debido a unha difusión previa de segredos industriais. Por ese motivo, Gosset publicou os seus resultados baixo o pseudónimo de Student (“estudante”).[1]
Distribución t de Student non estandarizada
A distribución t pode xeralizarse a 3 parámetros, introducindo un parámero locacional e outro de escala . O resultado é unha distribución t de Student non estandarizada cunha densidade que está definida por:[2]
Equivalentemente, pode escribirse en termos de (correspondente á varianza en vez de ao desvío estándar):
Outras propiedades desta versión da distribución t son:[2]