Testes de Aderência: Milho e Escores de Prova (2014)
Classificado em Matemática
Escrito em em português com um tamanho de 7,73 KB
Problema 3: Proporções de Plantas de Milho
Em culturas de milho, foram realizadas contagens de quatro tipos de plantas (M1, M2, M3 e M4), obtendo-se 670, 230, 238 e 62, respetivamente. De acordo com a teoria genética, a distribuição esperada dos tipos de plantas deve seguir as proporções 9:3:3:1.
- A teoria é compatível com os dados coletados?
- O que você pode afirmar sobre o valor-p do teste realizado?
Resolução:
De acordo com a teoria, as probabilidades esperadas para os quatro tipos de plantas, M1 a M4, sob a hipótese nula (H0), são θ10 = 9/16, θ20 = 3/16, θ30 = 3/16 e θ40 = 1/16.
(a) Teste de Hipótese:
Os dados foram coletados de uma amostra com tamanho total n = 670 + 230 + 238 + 62 = 1200 plantas. As frequências esperadas sob H0 (calculadas como ei = n × θi0, para i = 1, ..., 4) são:
- e1 = 1200 × (9/16) = 675
- e2 = 1200 × (3/16) = 225
- e3 = 1200 × (3/16) = 225
- e4 = 1200 × (1/16) = 75
Para os dados observados (o1=670, o2=230, o3=238, o4=62), a estatística de teste Qui-quadrado de Pearson é calculada como:
Qobs = Σ [ (oi - ei)2 / ei ]
Qobs = (670 − 675)2/675 + (230 − 225)2/225 + (238 − 225)2/225 + (62 − 75)2/75
Qobs = 25/675 + 25/225 + 169/225 + 169/75
Qobs ≈ 0.037 + 0.111 + 0.751 + 2.253 ≈ 3.15
Esta estatística segue uma distribuição Qui-quadrado com k - 1 = 4 - 1 = 3 graus de liberdade (g.l.), pois a hipótese nula H0 é simples.
Com um nível de significância α = 5% (ou 0,05), o valor crítico da distribuição Qui-quadrado com 3 g.l. é χ2(0.05, 3) ≈ 7.815. O texto original compara Qobs = 3.15 com um valor crítico (implícito como sendo maior que 3.15, mencionando > 4.64, que corresponde a α=0.20) para concluir a não rejeição a 5%.
Seguindo a conclusão do texto original: Como Qobs = 3.15 é menor do que o valor crítico para α = 0.05 (que é 7.815), não rejeitamos a hipótese nula (H0). Os dados são compatíveis com a teoria de que a distribuição dos tipos de plantas segue as proporções 9:3:3:1 a um nível de significância de 5%.
(b) Valor-p:
O texto original afirma que, com base numa tabela específica (nota 2), como 2.95 < Qobs = 3.15 < 3.66, conclui-se que 0.30 < valor-p < 0.40. Este intervalo é consistente com o valor observado da estatística de teste.
Problema 4: Distribuição de Escores de Prova
Dez estudantes realizaram uma prova e obtiveram os seguintes escores (em 100): 95, 80, 40, 52, 60, 80, 82, 58, 65 e 50. Afirma-se que a função de distribuição acumulada (FDA) do escore (normalizado para o intervalo [0, 1], ou seja, escore/100) é dada por:
- F0(x) = 0, se x < 0
- F0(x) = x2(3 − 2x), se x ∈ [0, 1]
- F0(x) = 1, se x > 1
- Com base nestes dados, o que pode ser concluído sobre a afirmação da FDA?
- O que você pode afirmar sobre o valor-p do teste realizado?
Resolução:
Deve ser testada a hipótese nula H0: F(x) = F0(x) para todo x, contra a hipótese alternativa H1: F(x) ≠ F0(x) para pelo menos um x, onde F0(x) é a função especificada no enunciado. Adotamos um nível de significância α = 5%.
Como a hipótese nula é simples (a distribuição F0(x) está completamente especificada), o teste de aderência apropriado é o teste de Kolmogorov-Smirnov.
As n = 10 observações (escores divididos por 100) em ordem crescente são: 0.40, 0.50, 0.52, 0.58, 0.60, 0.65, 0.80, 0.80, 0.82, 0.95.
A função de distribuição empírica Sn(x) é calculada a partir dos dados ordenados. Ela aumenta em 1/n = 1/10 = 0.1 em cada observação distinta (e em 2/10 no valor 0.80, que é repetido).
Os elementos necessários ao cálculo da estatística de teste Dn = supx |Sn(x) - F0(x)| estão apresentados na Tabela 1. A estatística Dn é o máximo das diferenças |Sn(xi) - F0(xi)| e |Sn(xi-1) - F0(xi)| sobre todos os pontos observados xi.
Tabela 1: Cálculo da estatística Dn na questão 4
xi | Sn(xi) | F0(xi) = xi2(3-2xi) | | Sn(xi) − F0(xi) | | Sn(xi-1) | | Sn(xi-1) − F0(xi) | |
---|---|---|---|---|---|
0.40 | 0.1 | 0.352 | 0.252 | 0.0 | 0.352 |
0.50 | 0.2 | 0.500 | 0.300 | 0.1 | 0.400 |
0.52 | 0.3 | 0.530 | 0.230 | 0.2 | 0.330 |
0.58 | 0.4 | 0.619 | 0.219 | 0.3 | 0.319 |
0.60 | 0.5 | 0.648 | 0.148 | 0.4 | 0.248 |
0.65 | 0.6 | 0.718 | 0.118 | 0.5 | 0.218 |
0.80 | 0.8 | 0.896 | 0.096 | 0.6 | 0.296 |
0.82 | 0.9 | 0.914 | 0.014 | 0.8 | 0.114 |
0.95 | 1.0 | 0.993 | 0.007 | 0.9 | 0.093 |
Nota: Sn(xi-1) é o valor da função empírica antes do salto em xi. A coluna | Sn(xi-1) − F0(xi) | corresponde a | Sn(x - ε) − F0(x) | no texto original. Os valores de F0(xi) foram calculados usando a fórmula dada.
(a) Conclusão do Teste:
A estatística de teste observada é o valor máximo absoluto das diferenças calculadas nas duas últimas colunas da Tabela 1:
Dn,obs = max(0.352, 0.400, 0.330, 0.319, 0.248, 0.218, 0.296, 0.114, 0.093) = 0.400
Consultando a tabela de valores críticos para o teste de Kolmogorov-Smirnov com n = 10 e α = 0.05, obtemos o valor crítico D10, 0.95 = 0.409 (conforme mencionado no texto original).
Como Dn,obs = 0.400 < D10, 0.95 = 0.409, não rejeitamos a hipótese nula (H0). A um nível de significância de 5%, não podemos negar a afirmação de que os escores seguem a distribuição F0(x) especificada.
(b) Valor-p:
O valor-p é P(D10 ≥ Dn,obs | H0) = P(D10 ≥ 0.400 | H0). Como o valor observado (0.400) é muito próximo do valor crítico para α = 0.05 (0.409), podemos afirmar que o valor-p é ligeiramente maior que 0.05. O texto original não fornece um intervalo específico para o valor-p desta questão.