Testes de Aderência: Milho e Escores de Prova (2014)

Escrito em 7 de Abril de 2025 em português com um tamanho de 7,73 KB

Problema 3: Proporções de Plantas de Milho

Em culturas de milho, foram realizadas contagens de quatro tipos de plantas (M1, M2, M3 e M4), obtendo-se 670, 230, 238 e 62, respetivamente. De acordo com a teoria genética, a distribuição esperada dos tipos de plantas deve seguir as proporções 9:3:3:1.

A teoria é compatível com os dados coletados?
O que você pode afirmar sobre o valor-p do teste realizado?

Resolução:

De acordo com a teoria, as probabilidades esperadas para os quatro tipos de plantas, M1 a M4, sob a hipótese nula (H₀), são θ₁₀ = 9/16, θ₂₀ = 3/16, θ₃₀ = 3/16 e θ₄₀ = 1/16.

(a) Teste de Hipótese:

Os dados foram coletados de uma amostra com tamanho total n = 670 + 230 + 238 + 62 = 1200 plantas. As frequências esperadas sob H₀ (calculadas como e_i = n × θ_i0, para i = 1, ..., 4) são:

e₁ = 1200 × (9/16) = 675
e₂ = 1200 × (3/16) = 225
e₃ = 1200 × (3/16) = 225
e₄ = 1200 × (1/16) = 75

Para os dados observados (o₁=670, o₂=230, o₃=238, o₄=62), a estatística de teste Qui-quadrado de Pearson é calculada como:

Q_obs = Σ [ (o_i - e_i)² / e_i ]

Q_obs = (670 − 675)²/675 + (230 − 225)²/225 + (238 − 225)²/225 + (62 − 75)²/75

Q_obs = 25/675 + 25/225 + 169/225 + 169/75

Q_obs ≈ 0.037 + 0.111 + 0.751 + 2.253 ≈ 3.15

Esta estatística segue uma distribuição Qui-quadrado com k - 1 = 4 - 1 = 3 graus de liberdade (g.l.), pois a hipótese nula H₀ é simples.

Com um nível de significância α = 5% (ou 0,05), o valor crítico da distribuição Qui-quadrado com 3 g.l. é χ²_{(0.05, 3)} ≈ 7.815. O texto original compara Q_obs = 3.15 com um valor crítico (implícito como sendo maior que 3.15, mencionando > 4.64, que corresponde a α=0.20) para concluir a não rejeição a 5%.

Seguindo a conclusão do texto original: Como Q_obs = 3.15 é menor do que o valor crítico para α = 0.05 (que é 7.815), não rejeitamos a hipótese nula (H₀). Os dados são compatíveis com a teoria de que a distribuição dos tipos de plantas segue as proporções 9:3:3:1 a um nível de significância de 5%.

(b) Valor-p:

O texto original afirma que, com base numa tabela específica (nota 2), como 2.95 < Q_obs = 3.15 < 3.66, conclui-se que 0.30 < valor-p < 0.40. Este intervalo é consistente com o valor observado da estatística de teste.

Problema 4: Distribuição de Escores de Prova

Dez estudantes realizaram uma prova e obtiveram os seguintes escores (em 100): 95, 80, 40, 52, 60, 80, 82, 58, 65 e 50. Afirma-se que a função de distribuição acumulada (FDA) do escore (normalizado para o intervalo [0, 1], ou seja, escore/100) é dada por:

F₀(x) = 0, se x < 0
F₀(x) = x²(3 − 2x), se x ∈ [0, 1]
F₀(x) = 1, se x > 1

Com base nestes dados, o que pode ser concluído sobre a afirmação da FDA?
O que você pode afirmar sobre o valor-p do teste realizado?

Resolução:

Deve ser testada a hipótese nula H₀: F(x) = F₀(x) para todo x, contra a hipótese alternativa H₁: F(x) ≠ F₀(x) para pelo menos um x, onde F₀(x) é a função especificada no enunciado. Adotamos um nível de significância α = 5%.

Como a hipótese nula é simples (a distribuição F₀(x) está completamente especificada), o teste de aderência apropriado é o teste de Kolmogorov-Smirnov.

As n = 10 observações (escores divididos por 100) em ordem crescente são: 0.40, 0.50, 0.52, 0.58, 0.60, 0.65, 0.80, 0.80, 0.82, 0.95.

A função de distribuição empírica S_n(x) é calculada a partir dos dados ordenados. Ela aumenta em 1/n = 1/10 = 0.1 em cada observação distinta (e em 2/10 no valor 0.80, que é repetido).

Tabela 1: Cálculo da estatística D_n na questão 4

x_i	S_n(x_i)	F₀(x_i) = x_i²(3-2x_i)	\| S_n(x_i) − F₀(x_i) \|	S_n(x_i-1)	\| S_n(x_i-1) − F₀(x_i) \|
0.40	0.1	0.352	0.252	0.0	0.352
0.50	0.2	0.500	0.300	0.1	0.400
0.52	0.3	0.530	0.230	0.2	0.330
0.58	0.4	0.619	0.219	0.3	0.319
0.60	0.5	0.648	0.148	0.4	0.248
0.65	0.6	0.718	0.118	0.5	0.218
0.80	0.8	0.896	0.096	0.6	0.296
0.82	0.9	0.914	0.014	0.8	0.114
0.95	1.0	0.993	0.007	0.9	0.093

Nota: S_n(x_i-1) é o valor da função empírica antes do salto em x_i. A coluna | S_n(x_i-1) − F₀(x_i) | corresponde a | S_n(x - ε) − F₀(x) | no texto original. Os valores de F₀(x_i) foram calculados usando a fórmula dada.

(a) Conclusão do Teste:

A estatística de teste observada é o valor máximo absoluto das diferenças calculadas nas duas últimas colunas da Tabela 1:

D_n,obs = max(0.352, 0.400, 0.330, 0.319, 0.248, 0.218, 0.296, 0.114, 0.093) = 0.400

Consultando a tabela de valores críticos para o teste de Kolmogorov-Smirnov com n = 10 e α = 0.05, obtemos o valor crítico D_{10, 0.95} = 0.409 (conforme mencionado no texto original).

Como D_n,obs = 0.400 < D_{10, 0.95} = 0.409, não rejeitamos a hipótese nula (H₀). A um nível de significância de 5%, não podemos negar a afirmação de que os escores seguem a distribuição F₀(x) especificada.

(b) Valor-p:

O valor-p é P(D₁₀ ≥ D_n,obs | H₀) = P(D₁₀ ≥ 0.400 | H₀). Como o valor observado (0.400) é muito próximo do valor crítico para α = 0.05 (0.409), podemos afirmar que o valor-p é ligeiramente maior que 0.05. O texto original não fornece um intervalo específico para o valor-p desta questão.

Entradas relacionadas:

Etiquetas: