Análise Estatística: Testes de Hipóteses e Ajuste de Distribuições

Classificado em Matemática

Escrito em em português com um tamanho de 7,81 KB

Exercícios de Estatística Aplicada

Teste do Sinal para a Mediana

H₀: θ = θ₀ vs H₁: θ ≠ θ₀ utilizando o teste do sinal, em que θ é a mediana. Em uma amostra de n observações, o menor valor possível da probabilidade de significância (valor-p) é atingido quando Bobs = 0 ou quando Bobs = n. Em uma amostra de tamanho n = 5 e supondo que um destes dois valores foi observado, calcule o valor-p correspondente e realize o teste com um nível de significância de 5%. Qual a sua decisão?

=> Resolução:

Como a distribuição nula de B é Binomial(5, 1/2), e é simétrica em relação à sua média, temos que:

Valor-p = 2 × P(B = 0) = 2 × P(B = 5) = 2 × (1/2)⁵ = 2 × 0,03125 = 0,0625.

Sendo assim, com α = 5% (ou 0,05), não rejeitamos H₀, mesmo em uma situação que é a mais extrema em termos de afastamento da hipótese nula. Este fato se deve ao tamanho da amostra, que é reduzido.

Teste Qui-Quadrado de Aderência (Distribuição Binomial)

A distribuição do número de dias com chuva em uma semana do ano foi observada durante 100 anos. Pode ser afirmado que o número de dias com chuva segue a distribuição Binomial(7; 0,1)?

Dados Observados (Frequências)

Dias com Chuva (j)01234567
Frequência Observada (f)5730931000

Total de Frequências: 100

=> Resolução:

Temos k = 8 valores diferentes para o número de dias. Utilizando a expressão para a frequência esperada (e) sob a Binomial(7; 0,1):

$$e_j = n \times \text{COMBINAÇÃO}(7, j) \times (0,1)^j \times (0,9)^{(7-j)}$$

Com n = 100, obtemos as frequências esperadas (esp) apresentadas abaixo:

iObservada (fᵢ)Esperada (eᵢ)
1 (j=0)5747,82969
2 (j=1)3037,20087
3 (j=2)912,40029
4 (j=3)32,29635
5 (j=4)10,25515
6 (j=5)00,01701
7 (j=6)00,00063
8 (j=7)00,00001

Com os valores acima, calculamos a estatística Qui-Quadrado observada:

$$Q_{\text{obs}} = \sum_{i=1}^{8} \frac{(f_i - e_i)^2}{e_i} = 6,49$$

Para α = 0,05, o valor crítico obtido da distribuição χ² com 7 graus de liberdade (g.l.) é 14,07. Como Qobs (6,49) é menor que o valor crítico (14,07), com base no teste qui-quadrado de bondade de ajuste, os dados indicam que a distribuição do número de dias com chuva segue a distribuição Binomial(7; 0,1).

Teste Kolmogorov-Smirnov (Distribuição Weibull)

Tensão de ruptura de blocos de concreto, de uma amostra com 12 blocos. Verifique se a distribuição Weibull(a, b) ajusta-se bem a estes dados, sendo que a função de distribuição acumulada é dada por:

$$F_X(x) = 1 - \exp \left( - \left(\frac{x}{b}\right)^a \right)$$

Considere a = 11 e b = 15. O que você pode afirmar sobre o valor-p do teste realizado?

Dados da Amostra (Tensão de Ruptura)

13,7; 13,8; 13,9; 14,1; 14,3; 14,6; 14,8; 15,1; 15,7; 16,1; 16,4; 16,6

=> Resolução:

Com os dados da amostra e a expressão F₀(x) = 1 − exp ( -(x/15)¹¹) obtemos os resultados abaixo (onde Sₙ(x) é a função de distribuição empírica):

xSₙ(x)F₀(x)|Sₙ(x) - F₀(x)||F₀(x) - Sₙ(x-ε)|
13,70,083333330,30851350,2251801770,30851351
13,80,166666670,32943680,1627701700,24610350
13,90,250000000,35122690,1012268500,18456018
14,10,333333330,39727740,0639440580,14727739
14,30,416666670,44630600,0296392910,11297262
14,60,500000000,52422470,0242247480,10755808
14,80,583333330,57799170,0053416580,07799167
15,10,666666670,65898450,0076821750,07565116
15,70,750000000,80824800,0582479760,14158131
16,10,833333330,88674520,0534118410,13674517
16,40,916666670,93064860,0139819550,09731529
16,61,000000000,95260290,0473970900,03593624

Calculamos a estatística de teste Dₙ:

$$D_n = \max \left( |S_n(x) - F_0(x)|, |F_0(x) - S_n(x-\epsilon)| \right) = 0,3085$$

Temos que 0,10 distribuição Weibull(11, 15) ajusta-se bem aos dados (pois o valor-p é maior que α).

Estimativa e Intervalo de Confiança para a Mediana

Tempo de uso, em horas (h), de uma bateria recarregável:

1,5; 2,2; 0,9; 1,3; 2,0; 1,6; 1,8; 1,5; 2,0; 1,2; 1,7

  1. Estimativa para o tempo mediano.
  2. Intervalo de Confiança (IC) para o tempo mediano com probabilidade de cobertura próxima a 95%.
  3. Pode ser afirmado que o tempo mediano é igual a 1,9 h?

(a) Estimativa para o Tempo Mediano

Supondo que temos uma amostra aleatória (a.a.) de uma distribuição contínua com mediana única, utilizamos a mediana amostral como estimador. As observações (x) ordenadas encontram-se abaixo (n=11):

0,9; 1,2; 1,3; 1,5; 1,5; 1,6; 1,7; 1,8; 2,0; 2,0; 2,2

Com n = 11, consultando a posição (n + 1)/2 = 6 na amostra ordenada, obtemos x₍₆₎ = 1,6 h como estimativa do tempo mediano.

(b) Intervalo de Confiança para o Tempo Mediano

Tomando uma variável aleatória B ∼ Binomial(11, 1/2), calculamos as probabilidades:

  • P(B = 11) = 0,00049
  • P(B = 10) = 0,00586
  • P(B = 9) = 0,03271
  • P(B = 8) = 0,11328

Portanto, o valor crítico b tal que P(B ≤ b) é o mais próximo de 1 - α/2 é b = 9, correspondendo a α = 2 × 0,03271 = 0,06542. A probabilidade de cobertura é 1 - α = 0,93458, que é a mais próxima de 0,95.

Calculamos o índice inferior do intervalo: Cₐ = b + 1 = 9 + 1 = 10. (Nota: O cálculo original Cα = n + 1 − b(1−α/2) = 3 parece estar incorreto ou usando uma notação diferente para o índice superior/inferior. Usando o método padrão, o índice inferior é b+1 e o superior é n-b.)

Utilizando os índices (b+1) e (n-b), onde b=2 (P(B ≤ 2) = 0,03271), ou b=9 (P(B ≥ 9) = 0,03271):

Se usarmos o índice b = 2 (para P(B ≤ 2) = 0,03271), o IC é (x₍₃₎, x₍₉₎).

Se usarmos o índice b = 9 (para P(B ≥ 9) = 0,03271), o IC é (x₍ₙ₋₉₊₁₎, x₍₉₎) = (x₍₃₎, x₍₉₎).

O intervalo de confiança para o tempo mediano é dado por (x₍₃₎, x₍₉₎) = (1,3; 2,0) h.

(c) Teste de Hipótese para o Tempo Mediano

O intervalo de confiança do item (b), (1,3; 2,0), contém 1,9. Portanto, os dados permitem afirmar que o tempo mediano é 1,9 h, ao nível de significância adotado (α ≈ 6,5%).

Entradas relacionadas: