Análise Estatística: Testes de Hipóteses e Ajuste de Distribuições
Classificado em Matemática
Escrito em em
português com um tamanho de 7,81 KB
Exercícios de Estatística Aplicada
Teste do Sinal para a Mediana
H₀: θ = θ₀ vs H₁: θ ≠ θ₀ utilizando o teste do sinal, em que θ é a mediana. Em uma amostra de n observações, o menor valor possível da probabilidade de significância (valor-p) é atingido quando Bobs = 0 ou quando Bobs = n. Em uma amostra de tamanho n = 5 e supondo que um destes dois valores foi observado, calcule o valor-p correspondente e realize o teste com um nível de significância de 5%. Qual a sua decisão?
=> Resolução:
Como a distribuição nula de B é Binomial(5, 1/2), e é simétrica em relação à sua média, temos que:
Valor-p = 2 × P(B = 0) = 2 × P(B = 5) = 2 × (1/2)⁵ = 2 × 0,03125 = 0,0625.
Sendo assim, com α = 5% (ou 0,05), não rejeitamos H₀, mesmo em uma situação que é a mais extrema em termos de afastamento da hipótese nula. Este fato se deve ao tamanho da amostra, que é reduzido.
Teste Qui-Quadrado de Aderência (Distribuição Binomial)
A distribuição do número de dias com chuva em uma semana do ano foi observada durante 100 anos. Pode ser afirmado que o número de dias com chuva segue a distribuição Binomial(7; 0,1)?
Dados Observados (Frequências)
| Dias com Chuva (j) | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
|---|---|---|---|---|---|---|---|---|
| Frequência Observada (f) | 57 | 30 | 9 | 3 | 1 | 0 | 0 | 0 |
Total de Frequências: 100
=> Resolução:
Temos k = 8 valores diferentes para o número de dias. Utilizando a expressão para a frequência esperada (e) sob a Binomial(7; 0,1):
$$e_j = n \times \text{COMBINAÇÃO}(7, j) \times (0,1)^j \times (0,9)^{(7-j)}$$
Com n = 100, obtemos as frequências esperadas (esp) apresentadas abaixo:
| i | Observada (fᵢ) | Esperada (eᵢ) |
|---|---|---|
| 1 (j=0) | 57 | 47,82969 |
| 2 (j=1) | 30 | 37,20087 |
| 3 (j=2) | 9 | 12,40029 |
| 4 (j=3) | 3 | 2,29635 |
| 5 (j=4) | 1 | 0,25515 |
| 6 (j=5) | 0 | 0,01701 |
| 7 (j=6) | 0 | 0,00063 |
| 8 (j=7) | 0 | 0,00001 |
Com os valores acima, calculamos a estatística Qui-Quadrado observada:
$$Q_{\text{obs}} = \sum_{i=1}^{8} \frac{(f_i - e_i)^2}{e_i} = 6,49$$
Para α = 0,05, o valor crítico obtido da distribuição χ² com 7 graus de liberdade (g.l.) é 14,07. Como Qobs (6,49) é menor que o valor crítico (14,07), com base no teste qui-quadrado de bondade de ajuste, os dados indicam que a distribuição do número de dias com chuva segue a distribuição Binomial(7; 0,1).
Teste Kolmogorov-Smirnov (Distribuição Weibull)
Tensão de ruptura de blocos de concreto, de uma amostra com 12 blocos. Verifique se a distribuição Weibull(a, b) ajusta-se bem a estes dados, sendo que a função de distribuição acumulada é dada por:
$$F_X(x) = 1 - \exp \left( - \left(\frac{x}{b}\right)^a \right)$$
Considere a = 11 e b = 15. O que você pode afirmar sobre o valor-p do teste realizado?
Dados da Amostra (Tensão de Ruptura)
13,7; 13,8; 13,9; 14,1; 14,3; 14,6; 14,8; 15,1; 15,7; 16,1; 16,4; 16,6
=> Resolução:
Com os dados da amostra e a expressão F₀(x) = 1 − exp ( -(x/15)¹¹) obtemos os resultados abaixo (onde Sₙ(x) é a função de distribuição empírica):
| x | Sₙ(x) | F₀(x) | |Sₙ(x) - F₀(x)| | |F₀(x) - Sₙ(x-ε)| |
|---|---|---|---|---|
| 13,7 | 0,08333333 | 0,3085135 | 0,225180177 | 0,30851351 |
| 13,8 | 0,16666667 | 0,3294368 | 0,162770170 | 0,24610350 |
| 13,9 | 0,25000000 | 0,3512269 | 0,101226850 | 0,18456018 |
| 14,1 | 0,33333333 | 0,3972774 | 0,063944058 | 0,14727739 |
| 14,3 | 0,41666667 | 0,4463060 | 0,029639291 | 0,11297262 |
| 14,6 | 0,50000000 | 0,5242247 | 0,024224748 | 0,10755808 |
| 14,8 | 0,58333333 | 0,5779917 | 0,005341658 | 0,07799167 |
| 15,1 | 0,66666667 | 0,6589845 | 0,007682175 | 0,07565116 |
| 15,7 | 0,75000000 | 0,8082480 | 0,058247976 | 0,14158131 |
| 16,1 | 0,83333333 | 0,8867452 | 0,053411841 | 0,13674517 |
| 16,4 | 0,91666667 | 0,9306486 | 0,013981955 | 0,09731529 |
| 16,6 | 1,00000000 | 0,9526029 | 0,047397090 | 0,03593624 |
Calculamos a estatística de teste Dₙ:
$$D_n = \max \left( |S_n(x) - F_0(x)|, |F_0(x) - S_n(x-\epsilon)| \right) = 0,3085$$
Temos que 0,10 distribuição Weibull(11, 15) ajusta-se bem aos dados (pois o valor-p é maior que α).
Estimativa e Intervalo de Confiança para a Mediana
Tempo de uso, em horas (h), de uma bateria recarregável:
1,5; 2,2; 0,9; 1,3; 2,0; 1,6; 1,8; 1,5; 2,0; 1,2; 1,7
- Estimativa para o tempo mediano.
- Intervalo de Confiança (IC) para o tempo mediano com probabilidade de cobertura próxima a 95%.
- Pode ser afirmado que o tempo mediano é igual a 1,9 h?
(a) Estimativa para o Tempo Mediano
Supondo que temos uma amostra aleatória (a.a.) de uma distribuição contínua com mediana única, utilizamos a mediana amostral como estimador. As observações (x) ordenadas encontram-se abaixo (n=11):
0,9; 1,2; 1,3; 1,5; 1,5; 1,6; 1,7; 1,8; 2,0; 2,0; 2,2
Com n = 11, consultando a posição (n + 1)/2 = 6 na amostra ordenada, obtemos x₍₆₎ = 1,6 h como estimativa do tempo mediano.
(b) Intervalo de Confiança para o Tempo Mediano
Tomando uma variável aleatória B ∼ Binomial(11, 1/2), calculamos as probabilidades:
- P(B = 11) = 0,00049
- P(B = 10) = 0,00586
- P(B = 9) = 0,03271
- P(B = 8) = 0,11328
Portanto, o valor crítico b tal que P(B ≤ b) é o mais próximo de 1 - α/2 é b = 9, correspondendo a α = 2 × 0,03271 = 0,06542. A probabilidade de cobertura é 1 - α = 0,93458, que é a mais próxima de 0,95.
Calculamos o índice inferior do intervalo: Cₐ = b + 1 = 9 + 1 = 10. (Nota: O cálculo original Cα = n + 1 − b(1−α/2) = 3 parece estar incorreto ou usando uma notação diferente para o índice superior/inferior. Usando o método padrão, o índice inferior é b+1 e o superior é n-b.)
Utilizando os índices (b+1) e (n-b), onde b=2 (P(B ≤ 2) = 0,03271), ou b=9 (P(B ≥ 9) = 0,03271):
Se usarmos o índice b = 2 (para P(B ≤ 2) = 0,03271), o IC é (x₍₃₎, x₍₉₎).
Se usarmos o índice b = 9 (para P(B ≥ 9) = 0,03271), o IC é (x₍ₙ₋₉₊₁₎, x₍₉₎) = (x₍₃₎, x₍₉₎).
O intervalo de confiança para o tempo mediano é dado por (x₍₃₎, x₍₉₎) = (1,3; 2,0) h.
(c) Teste de Hipótese para o Tempo Mediano
O intervalo de confiança do item (b), (1,3; 2,0), contém 1,9. Portanto, os dados permitem afirmar que o tempo mediano é 1,9 h, ao nível de significância adotado (α ≈ 6,5%).