Aplicações de Testes Estatísticos Não Paramétricos

Classificado em Física

Escrito em em português com um tamanho de 7,84 KB

Valor-P: É o menor nível de significância com que se rejeitaria a hipótese nula. Ou seja, se (valor-p) < α, rejeitamos H₀.

Questão 02: Comparação de Métodos K e L (Teste do Sinal)

Resolução: Como as duas amostras foram retiradas da mesma chapa, são duas amostras pareadas e podemos utilizar o teste do sinal para solucionar o problema.

Teste de hipóteses

Seja a amostra X referente ao método K e a amostra Y referente ao método L, logo:

H₀: θ ≤ 0 vs H₁: θ > 0,

em que θ = mediana das diferenças (xᵢ-yᵢ).

Portanto, é um teste unilateral à direita, em que se rejeitarmos H₀, há evidências de que o método K tem melhores predições que o método L.

Estatística de teste

Calculando as diferenças zᵢ=xᵢ-yᵢ, e ordenando teremos:

0.125; 0.135; 0.159; 0.224; 0.259; 0.227; 0.328; 0.451; 0.507.

com postos 1; 2; 3; 4; 5; 6; 7; 8; 9.

T⁺ = soma dos postos positivos = 1+2+3...+9 = 45.

T⁻ = soma dos postos negativos = 0

Não há empates, logo o tamanho da amostra não será alterado n=9.

seja φᵢ = { 1, se Zᵢ > 0; 0, se Zᵢ < 0. Logo B = Σφᵢ = 9.

Calculemos o valor-p para o teste do sinal que segue uma distribuição exata Binomial (n=9; p=1/2).

valor-p: Σ (de j=B até n=9) (n C j) * (0.5)j * (1-0.5)(n-j) = 1 / (2n) * (n C B).

valor-p: (1/(29)) * ((9 C 9)) = 0.00195.

Como (valor-p = 0.00195) < (α = 0.05), Rejeitamos H₀ e segundo a estatística de teste do sinal, os dados fornecem evidência de que o método K é mais preditivo que o método L, a nível 5% de significância.

Aproximação Normal

Outra forma, aproximando para um valor-p Normal, temos:

E₀(B) = n/2 = 9/2 = 4.5 e Var₀(B) = n/4 = 9/4 = 2.25

Calculando Zobs = (B - E₀(B)) / (√Var₀(B)) = (9 - 4.5) / (√2.25) = 3.

Valor-p: P(Z ≥ 3) = 1 - P(Z < 3) = 1 - P(Z ≤ 3) = 1 - (0.9987) = 0.0013.

(valor-p = 0.0013) < (α = 0.05), Rejeitamos H₀.

Questão 03: Rendimento de Processos 1 e 2 (Mann-Whitney)

Resposta: Considerando que são amostras independentes, podemos utilizar a estatística de Mann-Whitney para resolver esta questão.

Teste de hipóteses

H₀: Fₓ(x) ≤ Fᵧ(x) versus H₁: Fₓ(x) > Fᵧ(x), teste de hipóteses unilateral.

Estatística de teste

Ordenar os valores do rendimento, tal que:

20.9; 21; 21.8; ... ; 25.9; 26.6.

identificar se o processo é 1 ou 2:

2; 2; 2; 2; 2; 1; ...; 1; 1.

postos: 1; 2; 3; 4; ... ; 11.

logo n₁=5; n₂=6 e N = n₁+n₂ = 11.

R₁ = soma dos postos do processo 1 = 44

R₂ = soma dos postos do processo 2 = 22

Como não há empates, utilizemos as fórmulas fornecidas no apêndice:

Var₀(U) = ( (n₁*n₂)*(N+1) )/12 = (5*6)*(11+1)/12 = 30*12/12 = 30.

E₀(U) = (n₁*n₂)/2 = (5*6)/2 = 15.

WN = R₁ = 44.

U = WN - [n₁(n₁+1)/2] = 44 - [(5*(5+1))/2] = 44 - (5*6)/2 = 44 - 15 = 29.

Zobs = ( U - E₀(U) ) / (√Var₀(U)) = (29 - 15) / (√30) = 14 / 5.477 ≈ 2.5560.

Calculando o valor-p, temos:

(P(Z > 2.556) = 0.005) < (α = 0.05), Rejeitamos H₀, os dados fornecem evidências de que o processo 1 apresenta melhor rendimento que o processo 2, a nível 5% de significância.

Questão 04: Dependência entre Preço e Impostos

Resposta: Para se descobrir se duas variáveis são independentes ou não, podemos utilizar o coeficiente de correlação de Spearman.

Coeficiente de Correlação de Spearman

Preço sem ordenação: 25.7; 29.5; 27.5; .... ; 35.9; 31.9.

Impostos sem ordenação: 4.92; 5.02; 4.53; ....; 5.83; 5.3.

postos para preço: 1; 5; 3; 2; 7; 6; 8; 4; 10; 9.

postos para imposto: 4; 5; 2; 3; 6; 1; 10; 8; 9; 7.

x̄ = ȳ = (n+1)/2 = (10+1)/2 = 5.5

COV(Rₓ, Rᵧ) = (Σ (de i=1 até n=10) rₓᵢrᵧᵢ - n * x̄ * ȳ) = (354 - 10 * 5.5 * 5.5) = (354 - 10 * 30.25) = 354 - 302.5 = 51.5

Sₓ² = Sᵧ² = 82.5 (Valor utilizado no cálculo original)

Logo, ρ̂s = COV(Rₓ, Rᵧ) / (Sₓ * Sᵧ) = 51.5 / 82.5 ≈ 0.6242

Como ρ̂s * √(n-1) ~ N(0,1) e Z = 0.6242 * √(9) = 0.6242 * 3 = 1.8726.

O valor-p é dado por P(Z ≥ 1.8726) = 0.031 e como (valor-p = 0.031) < (α = 0.05), rejeitamos H₀, há evidências de que as variáveis são dependentes.

Tau de Kendall

Para se descobrir se duas variáveis são independentes ou não, podemos utilizar o coeficiente de correlação de Kendall (Tau).

Teste de hipóteses

H₀: τ = 0 (independência entre x e y não é rejeitada).

H₁: Há dependência (τ ≠ 0).

Estatística de teste

Analisando os pares de postos:

Número de concordantes (C): 32, número de discordantes (D): 13 (pois (n(n-1)/2) = (10*9)/2 = 45 = C+D).

C - D = 32 - 13 = 19.

LOGO: τ̂ = (C - D) / (n C 2) = 19 / 45 ≈ 0.4222.

Logo, rejeitamos H₀ pois τ̂ ≠ 0 e há dependência entre as duas variáveis.

Kruskal-Wallis: Comparação de 3 Grupos Independentes

Análise de rendimento de 15 estudantes em 3 disciplinas: História, Matemática e Sociologia.

Teste de hipóteses

H₀: τ₁ = τ₂ = τ₃ (As medianas dos postos são iguais para os 3 grupos)

H₁: Nem todos os τᵢ são iguais (Pelo menos uma mediana dos postos é diferente).

n₁=5; n₂=5; n₃=5. Logo N = n₁+n₂+n₃ = 15.

Estatística de teste

Amostra combinada e ordenada:

480(1); 490(2); 500(3); .... ; 760(14); 820(15).

R₁: Soma dos postos da amostra 1 (História) = 38.

R₂: Soma dos postos da amostra 2 (Matemática) = 40.

R₃: Soma dos postos da amostra 3 (Sociologia) = 42.

Médias dos postos: R̄₁ = R₁/n₁ = 38/5 = 7.6; R̄₂ = R₂/n₂ = 40/5 = 8; R̄₃ = R₃/n₃ = 42/5 = 8.4

Média geral dos postos = (N+1)/2 = (15+1)/2 = 8.

Estatística H = [12 / (N(N+1))] * Σ [nᵢ * (R̄ᵢ - (N+1)/2)²]

H = [12 / (15 * 16)] * {5 * (7.6 - 8)² + 5 * (8 - 8)² + 5 * (8.4 - 8)²}

H = [12 / 240] * {5 * (-0.4)² + 0 + 5 * (0.4)²}

H = [1 / 20] * {5 * 0.16 + 5 * 0.16}

H = 0.05 * {0.8 + 0.8} = 0.05 * 1.6 = 0.08

Como valor-p = P(H ≥ 0.08) = 0.9607 > α = 0.05, Não rejeitamos H₀. Não há evidências suficientes para concluir que as medianas dos postos são diferentes entre os grupos.

Friedman: Comparação de 3 Grupos Dependentes

Análise de rendimento em 3 condições (grupos) para os mesmos 7 indivíduos (blocos).

Teste de hipóteses

H₀: τ₁ = τ₂ = τ₃ (As medianas dos postos são iguais para os 3 grupos)

H₁: Nem todos os τᵢ são iguais (Pelo menos uma mediana dos postos é diferente).

b=7 (blocos/indivíduos), k=3 (tratamentos/grupos).

Estatística de teste

Rᵢ = Soma dos postos por coluna (grupo).

R₁ = 9; R₂ = 13; R₃ = 20.

Médias dos postos: R̄₁ = R₁/b = 9/7; R̄₂ = R₂/b = 13/7; R̄₃ = R₃/b = 20/7.

Estatística S (ou χ²ᵣ) = [12 / (b * k * (k+1))] * Σ Rᵢ² - 3 * b * (k+1)

S = [12 / (7 * 3 * (3+1))] * (9² + 13² + 20²) - 3 * 7 * (3+1)

S = [12 / (7 * 3 * 4)] * (81 + 169 + 400) - 3 * 7 * 4

S = [12 / 84] * (650) - 84

S = [1 / 7] * 650 - 84 ≈ 92.857 - 84 ≈ 8.857

Pelo valor-p = P(S ≥ 8.857) = 0.012 < α = 0.02, Rejeitamos H₀. Há evidências de que pelo menos uma das medianas dos postos é diferente entre os grupos.

Entradas relacionadas: