População 1: Coletamos uma amostra aleatória X1,X2,…,Xn de uma população com média μ1 e a variância σ21 e usamos ˉX para estimar μ1.
População 2: Coletamos uma amostra aleatória Y1,Y2,…,Ym de uma população com média μ2 e a variância σ22 e usamos ˉY para estimar μ2.
A população 1 é independente da população 2.
Condições:
As populações 1 e 2 são aproximadamente normais ou
Os tamanhos amostrais n e m são suficientemente grandes.
Se pelo menos uma das condições acima é satisfeita, temos: ˉX∼N(μ1,σ21n)eˉY∼N(μ2,σ22m)
Caso 1: Variâncias diferentes e conhecidas
Assumindo que as duas amostras X1,…,Xn e Y1,…,Ym são independentes com σ21≠σ22 conhecidas, temos:
ˉX−ˉY∼N(μ1−μ2,σ21n+σ22m)
Caso 1: Variâncias diferentes e conhecidas
Temos interesse em: H0: μ1−μ2=Δ0 vs Ha: μ1−μ2≠Δ0 (ou Ha: μ1−μ2<Δ0 ou Ha: μ1−μ2>Δ0).
E daí, sob H0, temos que: Z=(ˉX−ˉY)−Δ0⏞(μ1−μ2)√σ21n+σ22m∼N(0,1)
Se temos interesse em: H0:μ1−μ2=Δ0vsHa:μ1−μ2>Δ0.
Uma amostra aleatória de tamanho m é coletada da população X e calcula-se a média amostral, ˉx. Similarmente, para a população Y, temos ˉy obtida a partir de uma amostra aleatória de tamanho n.
p-valor=P(ˉX−ˉY−Δ0√σ21/n+σ22/m≥ˉx−ˉy−Δ0√σ21/n+σ22/m)=P(Z≥ˉx−ˉy−Δ0√σ21/n+σ22/m)=1−Φ(ˉx−ˉy−Δ0√σ21/n+σ22/m) em que Φ(z)=P(Z≤z) para Z∼N(0,1).
Se temos interesse em: H0:μ1−μ2=Δ0vsHa:μ1−μ2<Δ0.
p-valor=P(ˉX−ˉY−Δ0√σ21n+σ22m≤ˉx−ˉy−Δ0√σ21n+σ22m)=P(Z≤ˉx−ˉy−Δ0√σ21n+σ22m)=Φ(ˉx−ˉy−Δ0√σ21n+σ22m) em que Φ(z)=P(Z≤z) para Z∼N(0,1).
Se temos interesse em: H0:μ1−μ2=Δ0vsHa:μ1−μ2≠Δ0.
p-valor=P(|ˉX−ˉY−Δ0|√σ21n+σ22m≥|ˉx−ˉy−Δ0|√σ21n+σ22m)=P(|Z|≥|ˉx−ˉy−Δ0|√σ21n+σ22m)=2×[1−Φ(|ˉx−ˉy−Δ0|√σ21n+σ22m)] em que Φ(z)=P(Z≤z) para Z∼N(0,1).
Caso 2: Variâncias iguais e conhecidas
ˉX−ˉY∼N(μ1−μ2,σ2n+σ2m)
Temos interesse em: H0: μ1−μ2=Δ0 vs Ha: μ1−μ2≠Δ0 (ou Ha: μ1−μ2<Δ0 ou Ha: μ1−μ2>Δ0).
E daí, sob H0, temos que: Z=(ˉX−ˉY)−Δ0⏞(μ1−μ2)√σ2(1n+1m)∼N(0,1)
Caso 3: Variâncias iguais e desconhecidas
Assim como no caso de uma média com variância desconhecida, usamos uma estimativa de σ2 e a distribuição normal é substituída pela distribuição t.
No caso de duas populações, o estimador da variância σ2 é a combinação das variâncias amostrais de cada população, ou seja, S2p=(n−1)S21+(m−1)S22n+m−2, sendo S2i é a variância amostral da população i.
Quando σ2 é conhecida:
ˉX−ˉY−(μ1−μ2)√σ2(1/n+1/m)∼N(0,1)
Quando σ2 é desconhecida: ˉX−ˉY−(μ1−μ2)√S2p(1/n+1/m)∼tn+m−2
Temos interesse em: H0: μ1−μ2=Δ0 vs Ha: μ1−μ2≠Δ0 (ou Ha: μ1−μ2<Δ0 ou Ha: μ1−μ2>Δ0).
E daí, sob H0, temos que: T=(ˉX−ˉY)−Δ0⏞(μ1−μ2)√S2p(1n+1m)∼tn+m−2
Observação: Se n e m são pequenos, as duas amostras devem vir de populações aproximadamente normais. Se n e m são grandes, então a distribuição t com n+m−2 graus de liberdade aproxima-se de uma normal.
Para H0: μ1−μ2=Δ0 vs H1: μ1−μ2≠Δ0
Variâncias | Estatística do teste | Valor crítico para α | Valor de p |
---|---|---|---|
Diferentes e conhecidas (σ21≠σ22) | Z=(ˉX−ˉY)−Δ0√σ21n+σ22m∼N(0,1) | rejeitar se |zobs|≥zα/2 | 2P(Z≥|zobs|) |
Iguais e conhecidas (σ21=σ22=σ2) | Z=(ˉX−ˉY)−Δ0√σ2(1n+1m)∼N(0,1) | rejeitar se |zobs|≥zα/2 | 2P(Z≥|zobs|) |
Iguais e desconhecidas (σ21=σ22=σ2) | T∼(ˉX−ˉY)−Δ0√S2p(1/m+1/n)∼tn+m−2 | rejeitar se |tobs|≥tn+m−2,α/2 | 2P(T≥|tobs|) |
Para H0: μ1−μ2=Δ0 vs H1: μ1−μ2≤Δ0
Variâncias | Estatística do teste | Valor crítico para α | Valor de p |
---|---|---|---|
Diferentes e conhecidas (σ21≠σ22) | Z=(ˉX−ˉY)−Δ0√σ21n+σ22m∼N(0,1) | rejeitar se zobs≤−zα | P(Z≤zobs) |
Iguais e conhecidas (σ21=σ22=σ2) | Z=(ˉX−ˉY)−Δ0√σ2(1n+1m)∼N(0,1) | rejeitar se zobs≤−zα | P(Z≤zobs) |
Iguais e desconhecidas (σ21=σ22=σ2) | T∼(ˉX−ˉY)−Δ0√S2p(1/m+1/n)∼tn+m−2 | rejeitar se tobs≤−tn+m+2,α | P(T≤tobs) |
Para H0: μ1−μ2=Δ0 vs H1: μ1−μ2≥Δ0
Variâncias | Estatística do teste | Valor crítico para α | Valor de p |
---|---|---|---|
Diferentes e conhecidas (σ21≠σ22) | Z=(ˉX−ˉY)−Δ0√σ21n+σ22m∼N(0,1) | rejeitar se zobs≥zα | P(Z≥zobs) |
Iguais e conhecidas (σ21=σ22=σ2) | Z=(ˉX−ˉY)−Δ0√σ2(1n+1m)∼N(0,1) | rejeitar se zobs≥zα | P(Z≥zobs) |
Iguais e desconhecidas (σ21=σ22=σ2) | T∼(ˉX−ˉY)−Δ0√S2p(1/m+1/n)∼tn+m−2 | rejeitar se tobs≥tn+m+2,α | P(T≥tobs) |
P(|Z|≤zα/2)=P(−zα/2≤Z≤zα/2)=1−α
Procure na tabela o valor de z tal que a probabilidade acumulada até o valor de z, isto é P(Z≤z)=Φ(z), seja 1−α/2.
P(−tν,α/2<T<tν,α/2)=1−α
Nesse caso, ν=n+m−2 e os valores da distribuição t encontram-se tabelados.
O tempo de incubação do vírus 1 segue uma distribuição normal com média μ1 e desvio padrão σ1=√2.
Por outro lado, o tempo de incubação do vírus 2 segue uma distribuição normal com média μ2 e desvio padrão σ2=1.
Os tempos de incubação de ambos os vírus são considerados independentes.
Afirma-se que em média, o tempo de incubação do vírus 1 é 3 meses depois do tempo médio de incubação do vírus 2.
Realizaram um estudo de controle e os tempos de incubação registrados foram (tempo em meses):
## [1] 4.56 3.72 3.45 2.86 4.03 4.08 6.56 4.31 0.42 5.56 5.92 2.65 4.54 4.04 ## [15] 4.23 6.24 6.16 5.46 3.22 2.28
## [1] 2.44 1.49 2.68 2.60 1.51 1.60 1.47 3.70 2.22 1.78 2.36 1.56 2.98 3.33 ## [15] 2.22 0.58 2.26 2.26 1.92 0.50 1.17 1.70
Recentemente, pacientes contaminados com os vírus foram avaliados e suspeita-se que talvez o tempo de incubação do vírus 1 não seja 3 meses depois do tempo médio de incubação do vírus 2.
Definindo as hipóteses as serem testadas:
H0:μ1−μ2=3vsH1:μ1−μ2≠3
Os dados coletados serão usados para avaliar se temos ou não evidências contra H0.
Vamos calcular a média amostral das duas populações: ˉx=4.21 e ˉy=2.02.
Pelo enunciado, as duas populações são normais e as variâncias são conhecidas: σ21=2 e σ22=1. Veja que as populações são normais, variâncias diferentes mas conhecidas. Além disso, n=20 e m=22.
p-valor=P(|ˉX−ˉY−Δ0|√σ21m+σ22n≥|4.21−2.02−3|√222+120)=P(|Z|≥2.12)=2×P(Z≥2.12)=2×[1−Φ(2.12)]=2×[1−0.983]=0.034
Se α=0.01, como p-valor=0.034 >α=0.01, não temos evidência para rejeitar H0:μ1=3+μ2 com nível de significância 0.01.
Valor crítico para α=0.01: 2.58, ou seja, se |zobs|≥2.58 temos evidências para rejeitar H0 com nível de significância α=0.01.
Dois tipos diferentes de tecido devem ser comparados. Uma máquina de testes Martindale pode comparar duas amostras ao mesmo tempo. O peso (em miligramas) para sete experimentos foram:
Tecido | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
A | 36 | 26 | 31 | 38 | 28 | 20 | 37 |
B | 39 | 27 | 35 | 42 | 31 | 39 | 22 |
Construa um teste de hipótese com nível de significância 5% para testar a hipótese nula de igualdade entre os pesos médios dos tecidos. Admita que a variância é a mesma, e igual a 49.
Quais outras suposições são necessárias para que o teste seja válido?
Adaptado de: Profa. Nancy Garcia, Notas de aula.
Os tecidos do tipo A tem uma média amostral igual a ˉxA=30.86. Já os tecidos do tipo B têm média amostral de ˉxB=33.57.
A variância populacional é igual a 49, enquanto as variâncias amostrais são 44.14 e 52.62, respectivamente.
Suposições: Como os tamanhos amostrais n=m=7 são pequenos, devemos assumir os pesos dos tecidos dos dois tipos são normalmente distribuídos ou seja, XA∼N(μA,σ2) e XB∼N(μB,σ2). Além disso são independentes e com variâncias iguais.
Assumimos que as variâncias são iguais e conhecidas (σ21=σ22=49). Além disso, n=7 e m=7.
Definindo as hipóteses as serem testadas:
H0:μA−μB=0vsH1:μA−μB≠0.
Como a variância é conhecida, a estatística do teste é dada por Z=ˉXA−ˉXB−Δ0σ√1nA+1nB
Se a hipótese nula é verdadeira, temos que Δ0=μA−μB=0 e Z∼N(0,1). Note que a hipótese alternativa é do tipo ≠, então o teste é bilateral.
p-valor=P(|ˉXA−ˉXB−Δ0|σ√1nA+1nB≥|30.86−33.57−0|7√17+17)=P(|Z|≥0.72)=2×P(Z≥0.72)=2×[1−Φ(0.72)]=2×[1−0.7642]=0.4716
Se α=0.05, como p-valor=0.4716 >α=0.05, não temos evidência para rejeitar H0:μA=μB com nível de significância 0.05.
Valor crítico para α=0.05: 1.96, ou seja, se |zobs|≥1.96 temos evidências para rejeitar H0 com nível de significância α=0.05.
Vamos assumir agora que a variância populacional não fosse conhecida.
Assumindo ainda que as variâncias são iguais mas desconhecidas, vamos então estimar a variância amostral combinada.
Sabendo que s21=44.14, s22=52.62 e n=m=7 temos: s2p=(n−1)s21+(m−1)s22n+m−2=(7−1)44.14+(7−1)52.627+7−2=48.38
Nesse caso, a estatística do teste, sob H0, é dada por:
T=ˉXA−ˉXB√S2p(1nA+1nB)∼tn+m−2
tobs=ˉxA−ˉxB√s2p(1/nA+1/nB)=30.86−33.57√48.38(1/7+1/7)=−0.73
Considerando nível de significância 0.05, rejeitamos H0 se |tobs|≥tn+m−2,0.025.
Valor crítico para α=0.05: 2.18, ou seja, se |tobs|≥2.18 temos evidências para rejeitar H0 com nível de significância α=0.05. No caso, |tobs|=0.73<2.18, portanto não encontramos evidências para rejeitar a hipótese de que as médias são iguais.
Num estudo comparativo do tempo médio de adaptação (em anos), uma amostra aleatória, de 50 homens e 50 mulheres de um grande complexo industrial, produziu os seguintes resultados:
Estatística | Homens | Mulheres |
---|---|---|
Média | 3.2 | 3.7 |
Desvio Padrão | 0.8 | 0.9 |
Construa um teste de hipótese com nível de significância de 5% para a diferença entre o tempo médio de adaptação para homens e mulheres.
Fonte: Adaptado de Morettin & Bussab, Estatística Básica 5a edição, pág 365.
Veja que não sabemos a variância populacional, mas temos os desvios-padrão amostrais e estes são bem próximos. Então iremos assumir que as variâncias são iguais porém desconhecidas.
Nesse caso, vamos então estimar a variância amostral combinada.
Sabendo que s1=0.8, s2=0.9 e n=m=50 temos: s2p=(n−1)s21+(m−1)s22n+m−2=(50−1)(0.8)2+(50−1)(0.9)250+50−2=0.73
Nesse caso, a estatística do teste, sob H0, é dada por:
T=ˉX1−ˉX2√S2p(1n+1m)∼tnA+mB−2
tobs=ˉx1−ˉx2√s2p(1n+1m)=3.2−3.7√0.73(150+150)=−2.93
Considerando nível de significância 0.05 e Ha: μ1≠μ2, rejeitamos H0 se |tobs|≥tn+m−2,0.025=1.98.
Valor crítico para α=0.05: 1.98, ou seja, se |tobs|≥1.98 temos evidências para rejeitar H0 com nível de significância α=0.05. No caso, |tobs|=2.93>1.98, portanto encontramos evidências para rejeitar a hipótese de que as médias são iguais.
Considere X1,…,Xn1 e Y1,…,Yn2 duas amostras independentes de ensaios de Bernoulli tal que X∼b(p1) e Y∼b(p2), com probabilidade p1 e p2 de apresentarem uma certa característica.
Queremos testar: H0: p1−p2=0 vs Ha: p1−p2≠0 (ou Ha: p1−p2<0 ou Ha: p1−p2>0).
Em aulas anteriores vimos que: ˆp1∼N(p1,p1(1−p1)n1)eˆp2∼N(p2,p2(1−p2)n2)
Como as variâncias de ˆp1 e ˆp2 dependem de p1 e p2 e, portanto, não são conhecidas, iremos usar uma estimativa dessas variâncias.
Sob H0, p1=p2=p, portanto:
ˆp1∼N(p1,p(1−p)n1)eˆp2∼N(p2,p(1−p)n2)
No entanto, p é desconhecido. Iremos utilizar como estimativa para p: ˆp, definido como o número de sucessos entre todos os elementos amostrados. Ou seja, o estimador é a proporção de sucessos na amostra toda, sem levar em consideração as populações, pois, sob H0, p1=p2 (não há diferença entre as proporções das duas populações).
Então, para H0: p1=p2 usamos a estatística do teste a seguir: Z=ˆp1−ˆp2√ˆp(1−ˆp)(1n1+1n2)∼N(0,1)
em que ˆp é a proporção de sucessos entre os n1+n2 elementos amostrados.
Condições: Todas as quantidades n1ˆp1,n1(1−ˆp1),n2ˆp2 e n2(1−ˆp2) devem ser pelo menos igual a 10 para que a aproximação pela normal seja válida.
Resumindo:
Para H0: p1−p2=0
Ha | Valor crítico para α | Valor de p |
---|---|---|
p1−p2≠0 | rejeitar se |zobs|≥zα/2 | 2P(Z≥|zobs|) |
p1−p2<0 | rejeitar se zobs≤−zα | P(Z≤zobs) |
p1−p2>0 | rejeitar se zobs≥zα | P(Z≥zobs) |
O dinheiro que não é gasto hoje pode ser gasto depois.
Será que ao relembrar o aluno deste fato faz com que tome a decisão sobre uma compra de maneira diferente?
O cético pode pensar que relembrar não irá influenciar na decisão.
Podemos utilizar um teste de hipótese:
H0: Relembrar o aluno de que ele pode poupar para comprar algo especial depois não irá influenciar na decisão de gasto do aluno.
Ha: Relembrar o aluno de que ele pode poupar para comprar algo especial depois irá aumentar a chance dele não gastar em algo no presente.
Alunos de ME414 do segundo semestres de 2015 foram recrutados para um estudo e cada um recebeu a seguinte informação através do Google Forms:
Imagine que você estivesse poupando para comprar algo especial. Em uma visita ao shopping você encontra um DVD da sua série/filme favorita que estava na sua "lista de desejos" há tempos. O DVD está em promoção, custando R$ 20,00. O que você faria?
56 alunos (grupo 1) selecionados ao acaso receberam a seguinte opção de resposta:
54 alunos (grupo 2) selecionados ao acaso receberam a seguinte opção de resposta:
Obs: estudo adaptado do artigo Frederick S, Novemsky N, Wang J, Dhar R, Nowlis S. 2009. Opportunity Cost Neglect. Journal of Consumer Research 36: 553-561.
Compraria | Não compraria | |
---|---|---|
grupo1 | 31 | 25 |
grupo2 | 29 | 25 |
Entre os alunos do grupo 1, a proporção que decide não comprar foi 0.45.
Entre os alunos do grupo 2, a proporção que decide não comprar foi 0.46.
Temos evidências contra a hipótese nula, ou seja, relembrar o aluno não influencia na decisão?
Para realizar o teste de hipótese, devemos fazer algumas suposições.
Considere duas populações: X e Y tal que:
Queremos testar:
Seja ˆp1 a proporção que decide não comprar entre os alunos n1 amostrados do grupo 1.
Seja ˆp2 a proporção que decide não comprar entre os n2 alunos amostrados do grupo 2.
Relembrando o TCL:
ˆp1∼N(p1,p1(1−p1)n1)eˆp2∼N(p2,p2(1−p2)n2)
Condições: Todas as quantidades n1ˆp1,n1(1−ˆp1),n2ˆp2 e n2(1−ˆp2) devem ser pelo menos igual a 10 para que a aproximação pela normal seja válida.
Então, para H0: p1=p2 usamos a estatística do teste a seguir: Z=(ˆp1−ˆp2)√ˆp(1−ˆp)(1n1+1n2)∼N(0,1)
em que ˆp é a proporção que decide não comprar entre os n1+n2 alunos amostrados.
H0: p1=p2 vs Ha: p1<p2, que é equivalente a testar: H0: p1−p2=0 vs Ha: p1−p2<0.
p-valor=P(ˆp1−ˆp2√ˆp(1−ˆp)(1n1+1n2)≤25/56−25/54√5/11(1−5/11)(156+154))=P(Z≤−0.17)=0.4325
Se α=0.05, como p-valor=0.4325 >α=0.05, não temos evidência para rejeitar H0 com nível de significância 0.05.
Valor crítico para α=0.05: -1.64, ou seja, se zobs≤−1.64 temos evidências para rejeitar H0 com nível de significância α=0.05.
Slides produzidos pelos professores:
Samara Kiihl
Tatiana Benaglia
Benilton Carvalho