Análise de Regressão Linear Múltipla em Preços de Imóveis
Classificado em Física
Escrito em em português com um tamanho de 6,45 KB
Regressão Linear Múltipla
a) O que Elizabeth está interessada em saber?
R: Elizabeth está interessada em saber o impacto que algumas variáveis têm sobre o preço de um imóvel.
b) Análise da Correlação entre Preço e Tamanho do Imóvel
R: O gráfico de dispersão apresenta uma correlação positiva entre o preço do imóvel e o tamanho. Isso significa que, quanto maior o tamanho do imóvel, maior tende a ser o preço.
c) Análise da Correlação entre Preço e Idade do Imóvel
R: A idade do imóvel não parece ter uma relação definida com o preço do imóvel, indicando uma correlação fraca ou inexistente.
d) Análise da Correlação entre Preço e Quantidade de Quartos
R: Observa-se que quanto maior o número de quartos, maior tende a ser o preço do imóvel, sugerindo uma correlação positiva.
e) Pré-requisitos para Regressão Linear Múltipla
R: Os pré-requisitos para a realização de uma regressão linear múltipla são:
- Ausência de Multicolinearidade
- Homogeneidade das Variâncias (Homocedasticidade)
- Normalidade dos Resíduos
- Linearidade da Relação
f) Análise da Significância Global do Modelo
R: Para analisar a significância do modelo, formulamos as seguintes hipóteses:
- H0: β1 = β2 = β3 = 0 (Nenhuma das variáveis independentes tem impacto significativo no preço do imóvel)
- Ha: Existe pelo menos um βi ≠ 0 (Pelo menos uma variável independente tem impacto significativo no preço do imóvel)
Comparando o valor-p (0,000) com o nível de significância de 5% (0,05), temos que 0,000 < 0,05. Portanto, rejeita-se H0. Conclui-se que há significância estatística do modelo de regressão. Em outras palavras, há evidência de que pelo menos uma variável no modelo está significativamente relacionada com o preço do imóvel.
g) Análise do Poder Explicativo do Modelo (R-quadrado)
R: O conjunto de variáveis independentes (quantidade de quartos, idade do imóvel e tamanho do imóvel) explica 45,3% da variação dos preços dos imóveis. Este valor é derivado do R-quadrado (R2), que, quando multiplicado por 100, fornece a porcentagem da variância da variável dependente explicada pelas variáveis independentes.
h) Análise da Significância dos Coeficientes Individuais
R: A análise da significância dos coeficientes individuais é apresentada na tabela a seguir:
Coeficientes | Comparação (Valor-p vs. Nível de Significância) | Rejeita H0? | Coeficiente Mantido no Modelo? |
---|---|---|---|
Constante | 0,024 < 0,05 | Sim | Sim |
Tamanho | 0,000 < 0,05 | Sim | Sim |
Idade | 0,028 < 0,05 | Sim | Sim |
Conclusão: Como o valor-p de todos os coeficientes (constante, tamanho e idade) é menor que o nível de significância de 0,05, rejeita-se a hipótese nula (H0) para cada um deles. Isso indica que todos os coeficientes são estatisticamente significativos e, portanto, devem ser mantidos no modelo de regressão.
i) Análise da Presença de Multicolinearidade
R: Para analisar a presença de multicolinearidade entre as variáveis independentes no modelo de regressão, utiliza-se o Fator de Inflação da Variância (VIF). Geralmente, valores de VIF abaixo de 5 ou 10 (dependendo da literatura) indicam ausência de multicolinearidade significativa. Se o valor VIF for menor que o limite estabelecido (por exemplo, 5 ou 10), conclui-se que não há multicolinearidade preocupante no modelo.
j) Autocorrelação dos Resíduos: Teste de Durbin-Watson
R: Para analisar a presença de autocorrelação dos resíduos, utiliza-se o teste de Durbin-Watson (DW). Sabe-se que o limite superior (dU) é 1,29 e o limite inferior (dL) é 1,14.
O valor de Durbin-Watson obtido é 2,681. Como este valor é superior a 2, é necessário realizar um ajuste para a análise, calculando 4 - dU
.
Cálculo do limite ajustado: 4 - dU = 4 - 1,29 = 2,71
Comparando o valor de DW (2,681) com este novo limite ajustado (2,71), temos que 2,681 < 2,71
. Portanto, não há evidência de autocorrelação negativa dos resíduos. Conclui-se que os resíduos são independentes, o que é um pressuposto importante para a validade do modelo de regressão.
k) Análise da Significância dos Coeficientes na Segunda Simulação
R: Para analisar a significância dos coeficientes na segunda simulação, deve-se comparar o valor de significância (sig) de cada coeficiente com o nível de confiança estabelecido, geralmente 95% (o que corresponde a um nível de significância de 0,05). Se o valor de significância for menor que o nível de significância (por exemplo, 0,05), rejeita-se a hipótese nula (H0) para aquele coeficiente, indicando que ele é estatisticamente significativo no modelo.