Testes de Aderência: Milho e Escores de Prova (2014)

Classificado em Matemática

Escrito em em português com um tamanho de 7,73 KB

Problema 3: Proporções de Plantas de Milho

Em culturas de milho, foram realizadas contagens de quatro tipos de plantas (M1, M2, M3 e M4), obtendo-se 670, 230, 238 e 62, respetivamente. De acordo com a teoria genética, a distribuição esperada dos tipos de plantas deve seguir as proporções 9:3:3:1.

  1. A teoria é compatível com os dados coletados?
  2. O que você pode afirmar sobre o valor-p do teste realizado?

Resolução:

De acordo com a teoria, as probabilidades esperadas para os quatro tipos de plantas, M1 a M4, sob a hipótese nula (H0), são θ10 = 9/16, θ20 = 3/16, θ30 = 3/16 e θ40 = 1/16.

(a) Teste de Hipótese:

Os dados foram coletados de uma amostra com tamanho total n = 670 + 230 + 238 + 62 = 1200 plantas. As frequências esperadas sob H0 (calculadas como ei = n × θi0, para i = 1, ..., 4) são:

  • e1 = 1200 × (9/16) = 675
  • e2 = 1200 × (3/16) = 225
  • e3 = 1200 × (3/16) = 225
  • e4 = 1200 × (1/16) = 75

Para os dados observados (o1=670, o2=230, o3=238, o4=62), a estatística de teste Qui-quadrado de Pearson é calculada como:

Qobs = Σ [ (oi - ei)2 / ei ]

Qobs = (670 − 675)2/675 + (230 − 225)2/225 + (238 − 225)2/225 + (62 − 75)2/75

Qobs = 25/675 + 25/225 + 169/225 + 169/75

Qobs ≈ 0.037 + 0.111 + 0.751 + 2.253 ≈ 3.15

Esta estatística segue uma distribuição Qui-quadrado com k - 1 = 4 - 1 = 3 graus de liberdade (g.l.), pois a hipótese nula H0 é simples.

Com um nível de significância α = 5% (ou 0,05), o valor crítico da distribuição Qui-quadrado com 3 g.l. é χ2(0.05, 3) ≈ 7.815. O texto original compara Qobs = 3.15 com um valor crítico (implícito como sendo maior que 3.15, mencionando > 4.64, que corresponde a α=0.20) para concluir a não rejeição a 5%.

Seguindo a conclusão do texto original: Como Qobs = 3.15 é menor do que o valor crítico para α = 0.05 (que é 7.815), não rejeitamos a hipótese nula (H0). Os dados são compatíveis com a teoria de que a distribuição dos tipos de plantas segue as proporções 9:3:3:1 a um nível de significância de 5%.

(b) Valor-p:

O texto original afirma que, com base numa tabela específica (nota 2), como 2.95 < Qobs = 3.15 < 3.66, conclui-se que 0.30 < valor-p < 0.40. Este intervalo é consistente com o valor observado da estatística de teste.

Problema 4: Distribuição de Escores de Prova

Dez estudantes realizaram uma prova e obtiveram os seguintes escores (em 100): 95, 80, 40, 52, 60, 80, 82, 58, 65 e 50. Afirma-se que a função de distribuição acumulada (FDA) do escore (normalizado para o intervalo [0, 1], ou seja, escore/100) é dada por:

  • F0(x) = 0, se x < 0
  • F0(x) = x2(3 − 2x), se x ∈ [0, 1]
  • F0(x) = 1, se x > 1
  1. Com base nestes dados, o que pode ser concluído sobre a afirmação da FDA?
  2. O que você pode afirmar sobre o valor-p do teste realizado?

Resolução:

Deve ser testada a hipótese nula H0: F(x) = F0(x) para todo x, contra a hipótese alternativa H1: F(x) ≠ F0(x) para pelo menos um x, onde F0(x) é a função especificada no enunciado. Adotamos um nível de significância α = 5%.

Como a hipótese nula é simples (a distribuição F0(x) está completamente especificada), o teste de aderência apropriado é o teste de Kolmogorov-Smirnov.

As n = 10 observações (escores divididos por 100) em ordem crescente são: 0.40, 0.50, 0.52, 0.58, 0.60, 0.65, 0.80, 0.80, 0.82, 0.95.

A função de distribuição empírica Sn(x) é calculada a partir dos dados ordenados. Ela aumenta em 1/n = 1/10 = 0.1 em cada observação distinta (e em 2/10 no valor 0.80, que é repetido).

Os elementos necessários ao cálculo da estatística de teste Dn = supx |Sn(x) - F0(x)| estão apresentados na Tabela 1. A estatística Dn é o máximo das diferenças |Sn(xi) - F0(xi)| e |Sn(xi-1) - F0(xi)| sobre todos os pontos observados xi.

Tabela 1: Cálculo da estatística Dn na questão 4

xiSn(xi)F0(xi) = xi2(3-2xi)| Sn(xi) − F0(xi) |Sn(xi-1)| Sn(xi-1) − F0(xi) |
0.400.10.3520.2520.00.352
0.500.20.5000.3000.10.400
0.520.30.5300.2300.20.330
0.580.40.6190.2190.30.319
0.600.50.6480.1480.40.248
0.650.60.7180.1180.50.218
0.800.80.8960.0960.60.296
0.820.90.9140.0140.80.114
0.951.00.9930.0070.90.093

Nota: Sn(xi-1) é o valor da função empírica antes do salto em xi. A coluna | Sn(xi-1) − F0(xi) | corresponde a | Sn(x - ε) − F0(x) | no texto original. Os valores de F0(xi) foram calculados usando a fórmula dada.

(a) Conclusão do Teste:

A estatística de teste observada é o valor máximo absoluto das diferenças calculadas nas duas últimas colunas da Tabela 1:

Dn,obs = max(0.352, 0.400, 0.330, 0.319, 0.248, 0.218, 0.296, 0.114, 0.093) = 0.400

Consultando a tabela de valores críticos para o teste de Kolmogorov-Smirnov com n = 10 e α = 0.05, obtemos o valor crítico D10, 0.95 = 0.409 (conforme mencionado no texto original).

Como Dn,obs = 0.400 < D10, 0.95 = 0.409, não rejeitamos a hipótese nula (H0). A um nível de significância de 5%, não podemos negar a afirmação de que os escores seguem a distribuição F0(x) especificada.

(b) Valor-p:

O valor-p é P(D10 ≥ Dn,obs | H0) = P(D10 ≥ 0.400 | H0). Como o valor observado (0.400) é muito próximo do valor crítico para α = 0.05 (0.409), podemos afirmar que o valor-p é ligeiramente maior que 0.05. O texto original não fornece um intervalo específico para o valor-p desta questão.

Entradas relacionadas: