Um teste foi feito da seguinte maneira: 116 pessoas selecionadas aleatoriamente forneceram data, hora e local de nascimento.
Um astrólogo preparou um mapa astral para essas 116 pessoas, usando apenas os dados fornecidos acima.
Cada voluntário também preencheu um questionário: "California Personality Index".
Para um outro astrólogo, foram dados:
Hipótese: Usando o mapa astral de uma pessoa, a probabilidade, \(p\), de um astrólogo predizer corretamente qual dos 3 questionários está associado àquele mapa astral é igual a \(1/3\). Ou seja, os astrólogos apenas selecionam ao acaso um dos questionários.
Nesse caso, para saber se os astrólogos têm a capacidade de predizer a personalidade usando o mapa astral, usarÃamos as seguintes hipóteses:
\[ \begin{cases} H_0: p = 1/3 & \mbox{(hipótese nula)} \\ H_a: p > 1/3 & \mbox{(hipótese alternativa)} \end{cases} \]
No experimento com os 28 astrólogos, observar uma proporção alta de acertos pode ser uma evidência contra a hipótese de que \(p=1/3\).
O teste é válido sob algumas suposições. A mais importante assume que os dados do experimento foram produzidos através de um processo de aleatorização.
O teste de hipótese tem sempre duas hipóteses sobre o parâmetro populacional de interesse. As hipóteses devem ser definidas antes de se realizar o experimento e coletar dados.
No experimento dos astrólogos, \(H_0\): \(p=1/3\) representa a hipótese de que não há efeito, no sentido de que os astrólogos não têm uma capacidade maior de predizer a personalidade usando o mapa astral.
A hipótese alternativa, \(H_a\): \(p>1/3\), representa a hipótese de que há efeito, ou seja, os astrólogos têm uma capacidade de predizer a personalidade usando o mapa astral.
Em teste de hipóteses, mantém-se a favor de \(H_0\) a menos que os dados tragam grande evidência contra.
A hipótese nula é conservadora: "o réu é inocente até que se prove o contrário".
Vimos que podemos usar uma estatÃstica para estimar um parâmetro populacional. A estatÃstica do teste descreve quão longe do parâmetro populacional usado na \(H_0\) a estimativa está.
Por exemplo, se \(H_0:\) \(p=1/3\), e se \(\hat{p}=40/116=0.345\), queremos uma estatÃstica que quantifique quão longe está \(\hat{p}=0.345\) de \(p=1/3\).
Para interpretar uma estatÃstica do teste, vamos usar uma probabilidade para resumir a evidência contra \(H_0\). Esta probabilidade é o que chamamos de valor-de-p.
Baseado no valor-de-p, decidir se rejeita ou não a hipótese nula. Note que a conclusão é sempre em termos da hipótese nula: rejeitar ou não \(H_0\).
Mas quão pequeno deve ser o valor-de-p para ser considerado forte evidência contra \(H_0\)?
Geralmente, fixamos o nÃvel de significância do teste (\(\alpha\)), e usamos a seguinte regra. É comum usarmos \(\alpha=0.05\).
Assumimos primeiro que \(H_0\) é verdadeira.
Consideramos então todos os valores possÃveis para a estatÃstica do teste, de acordo com sua distribuição amostral.
Calculamos a estatÃstica do teste observada para o experimento realizado e verificamos onde, na distribuição amostral, ela se posiciona.
Calculamos a probabilidade de um valor igual ou mais extremo ao da estatÃstica do teste observada (valor-de-p). Mais extremo: mais evidência contra \(H_0\).
Se o valor-de-p obtido é bem pequeno, por exemplo, \(0.01\), isto quer dizer que se \(H_0\) é verdadeira, então seria incomum obter uma amostra com os resultados como o observado. Um valor-de-p muito baixo traz fortes evidências contra \(H_0\).
Distribuição amostral da proporção amostral \(\hat{p}\) sob \(H_0\). A área em azul representa uma probabilidade, que chamamos de valor-de-p: probabilidade de proporção amostral assumir um valor igual ao observado, \(\hat{p}_{obs}\), ou mais extremo, sob \(H_0\).
Passo 1: suposições.
Passo 2: hipóteses.
Passo 3: estatÃstica do teste.
Passo 3: estatÃstica do teste.
\[Z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \overset{H_0}{\sim}\mbox{Normal}(0,1)\]
Passo 3: estatÃstica do teste.
Passo 4: valor-de-p.
Distribuição amostral da estatÃstica do teste \(Z\) sob \(H_0\). A área em azul representa a probabilidade de valores mais extremos que \(z_{obs}\) ocorrerem, que chamamos de valor-de-p.
Passo 5: conclusão.
Detalhes da pesquisa podem ser encontrados no artigo da revista Nature: A double-blind test of Astrology.
Suponho que temos uma população e uma hipótese sobre a proporção \(p\) de indÃviduos com certa caracterÃstica.
Hipóteses:
\[ \begin{aligned} H_0: p = p_0 \quad \mbox{vs} \quad
H_a: & p \neq p_0 \mbox{ (bilateral)} \\
& p < p_0 \mbox{ (unilateral à esquerda)} \\
& p > p_0 \mbox{ (unilateral à direita)}
\end{aligned}
\]
EstatÃstica do teste: Baseada na distribuição amostral de \(\hat p\) \[Z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \overset{H_0}{\sim} N(0,1)\]
Condição: \(np_0 ≥ 10\) e \(n(1−p_0) ≥ 10\) para aproximação normal
valor-de-p
\(H_a: p \neq p_0\) (bilateral): valor-de-p=\(P(|Z| ≥|z_{obs}|)\)
\(H_a: p < p_0\) (unilateral à esquerda): valor-de-p=\(P(Z \leq z_{obs})\)
\(H_a: p > p_0\) (unilateral à direita): valor-de-p=\(P(Z \geq z_{obs})\)
Conclusão
Para um nÃvel de significância \(\alpha\):
Uma indústria farmacêutica diz que menos de 20% dos pacientes que estão usando um certo medicamento terão efeitos colaterais.
Realizou-se então um ensaio clÃnico com 400 pacientes e verificou-se que 68 pacientes apresentaram efeitos colaterais
Hipóteses: \(H_0: p = 0.20 \quad \mbox{vs} \quad H_a: p < 0.20\)
EstatÃstica do teste: Da amostra temos que \(\hat p = 68/400 = 0.17\) \[z_{obs} = \frac{\hat p - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} = \frac{0.17 - 0.20}{\sqrt{\frac{0.20(1-0.20)}{400}}} = -1.5\]
\[\mbox{valor-de-p} =P(Z \leq- 1.5) = 0.067\]
Conclusão: Para \(\alpha=0.05\), como o valor-de-p é maior que 0.05, não temos evidências nos dados para rejeitar a hipótese de que \(p=0.20\). Na verdade, a evidência está na direção que a indústria farmacêutica queria, mas não é o suficiente para rejeitar \(H_0\).
E se estivéssemos testando: \(H_0: p = 0.20 \quad \mbox{vs} \quad H_a: p \neq 0.20\)
\[\begin{aligned} \mbox{valor-de-p} &=P(|Z| \geq 1.5) = P(Z \leq -1.5) + P(Z \geq 1.5) \\ &= 2P(Z \leq -1.5) = 2 \times 0.067=0.134 \end{aligned} \]
Conclusão: Para \(\alpha=0.05\), como o valor-de-p é maior que 0.05, não temos evidências nos dados para rejeitar a hipótese de que \(p=0.20\).
Algumas pessoas afirmam que conseguem distinguir o sabor da coca-cola normal da coca zero.
Faremos então um teste para comprovar se a afirmação é verdadeira.
Experimento:
Suposições:
Hipóteses:
EstatÃstica do teste:
Valor-de-p:
Resultado do experimento:
Seja \(t_{obs}=19\) o número de acertos, o valor-de-p foi então: \(P(T\geq 19)=0\), onde \(T\overset{H_0}{\sim}\mbox{Binomial}(20,1/2)\).
Conclusão: Decidimos rejeitar \(H_0\).
Utilizando a aproximação pela Normal:
Temos que \(T \sim Bin(20, p)\), onde \(T\) é o número de acertos.
A proporção amostral de acertos \(\hat p = \frac{T}{20}= 19/20=0.95\).
Vamos testar o seguinte: \(H_0: p = 0.50 \quad \mbox{vs} \quad H_a: p > 0.50\).
EstatÃstica do teste:
\[z_{obs} = \frac{\hat p - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} = \frac{0.95 - 0.5}{\sqrt{\frac{(0.50)(0.50)}{20}}} = 4.02\]
valor-de-p = \(P(Z \geq 4.02) = 0\)
Conclusão: Fixando \(\alpha=0.05\), rejeitamos a hipótese de que \(p=0.5\) e, portanto, rejeitamos a hipótese de que probabilidade de acertos é 50%.
Slides produzidos pelos professores:
Samara Kiihl
Tatiana Benaglia
Benilton Carvalho