Distribución t de Student

De testwiki
Saltar á navegación Saltar á procura

Modelo:Outros homónimos Modelo:Modelo de distribución de probabilidade A distribución t (de Student) é unha distribución de probabilidade que xorde do problema de estimar a media dunha poboación normalmente distribuída cando o tamaño da mostra é pequeno.

Aparece de xeito natural ao realizar a proba t de Student para a determinación das diferenzas entre dúas medias das mostras e para a construción do intervalo de confianza para a diferenza entre as medias de dúas poboacións cando se descoñece o desvío estándar dunha poboación e esta debe ser estimada a partir dos datos dunha mostra.

Caracterización

A distribución t de Student é a distribución de probabilidade do cociente

T=ZV/ν =Zν V

onde

Se μ é unha constante non nula, o cociente Z+μV/ν  é unha variable aleatoria que segue a distribución t de Student non central con parámetro de non-centralidade μ.

Aparición e especificacións da distribución t de Student

Supóñase que X1,..., Xn son variables aleatorias independentes distribuídas normalmente, con media μ e varianza σ2

Sexa

Xn=(X1++Xn)/n

a media da mostra. Entón

Z=Xnμσ/n

segue unha distribución normal de media 0 e varianza 1.

Non obstante, dado que o desvío estándar non sempre se coñece previamente, Gosset estudou un cociente relacionado,

T=XnμSn/n,
S2(x)=1n1i=1n(xix)2

é a varianza da mostra e demostrou que a función de densidade de T é

f(t)=Γ((ν+1)/2)νπΓ(ν/2)(1+t2/ν)(ν+1)/2

onde ν  é igual a n − 1.

A distribución de T chámase agora a distribución-t de Student.

O parámetro ν  representa o número de graos de liberdade. A distribución depende de ν , pero non de μ ou σ, o que é moi importante na práctica.

Intervalos de confianza derivados da distribución t de Student

O procedemento para o cálculo do intervalo de confianza baseado na t de Student consiste en estimar o desvío estándar dos datos S e calcular o erro estándar da media: X=Sn, sendo entón o intervalo de confianza para a media: X=±tα/2,n1Sn .

Este resultado é o que se emprega no test de Student: posto que a diferenza das medias de mostras de dúas distribucións normais distribúese tamén normalmente, a distribución t pode empregarse para examinar se esa diferenza se pode supor razoablemente igual a cero.

Para efectos prácticos o valor esperado e a varianza son:

E(t(n))=0 e Var(t(n1))=n/(n2) para n>3 E(t(n))=0 e Var(t(n1))=n/(n2) para n>3 E(t(n))=0 e Var(t(n1))=n/(n2) para n>3 E(t(n))=0 e Var(t(n1))=n/(n2) para n>3

Historia

A distribución de Student foi descrita en 1908 por William Sealy Gosset. Gosset traballaba nunha fábrica de cervexa, Guinness, que prohibía aos seus empregados a publicación de artigos científicos debido a unha difusión previa de segredos industriais. Por ese motivo, Gosset publicou os seus resultados baixo o pseudónimo de Student (“estudante”).[1]

Distribución t de Student non estandarizada

A distribución t pode xeralizarse a 3 parámetros, introducindo un parámero locacional μ e outro de escala σ. O resultado é unha distribución t de Student non estandarizada cunha densidade que está definida por:[2]

p(x|ν,μ,σ)=Γ(ν+12)Γ(ν2)πνσ(1+1ν(xμσ)2)ν+12

Equivalentemente, pode escribirse en termos de σ2 (correspondente á varianza en vez de ao desvío estándar):

p(x|ν,μ,σ2)=Γ(ν+12)Γ(ν2)πνσ2(1+1ν(xμ)2σ2)ν+12

Outras propiedades desta versión da distribución t son:[2]

E(X)=μpara ν>1,Var(X)=σ2νν2para ν>2,Moda(X)=μ.

Notas

Modelo:Listaref

Véxase tamén

Ligazóns externas

Modelo:Control de autoridades