Guia de Regressão, Correlação e Análise de Dados
Classificado em Matemática
Escrito em em
português com um tamanho de 2,76 KB
Regressão
A análise de regressão estuda a relação entre uma variável, chamada de variável dependente, e outras variáveis, chamadas de variáveis independentes, representadas por um modelo matemático que associa a variável dependente com as independentes.
Modelos de Regressão
- MRLS (Modelo de Regressão Linear Simples): Define uma relação linear entre a variável dependente e uma única variável independente. Tem como objetivo tratar de um valor que não se consegue estimar inicialmente.
- MRLM (Modelo de Regressão Linear Múltipla): É uma coleção de técnicas estatísticas para construir modelos que descrevem relações entre várias variáveis explicativas de um determinado processo.
- Regressão Logística: Recurso que permite estimar a probabilidade associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias.
Correlação e Métricas
Correlação: Qualquer relação dentro de uma ampla classe de relações estatísticas que envolva dependência entre duas variáveis.
Coeficiente de Pearson: Mede o grau da correlação entre duas variáveis de escala métrica. Este coeficiente, normalmente representado por ρ, assume valores entre -1 e 1. Quanto mais perto de 1 ou -1, mais forte é a relação entre os dados, indicando que a regressão pode ser usada para prever valores futuros.
R-squared (R²): Mostra o percentual da variação de Y que é explicado pela variação de X.
EDA (Análise Exploratória de Dados)
Um conjunto de técnicas estatísticas e gráficas que permitem explorar grandes massas de dados para um primeiro entendimento, na procura de algum padrão ou comportamento relevante.
Tipos de Variáveis
- Variáveis Qualitativas Ordinais: Possuem grau de informação maior que as nominais, pois são dotadas de uma ordenação prévia. Exemplos: colocação em torneios, grau de escolaridade, classificação de qualidade.
- Variáveis Quantitativas Discretas: Assumem apenas valores inteiros (conjuntos enumeráveis). Exemplos: pontos em um dado, número de pessoas entrevistadas.
- Variáveis Quantitativas Contínuas: Permitem a observação de qualquer subconjunto dos números reais (resultados não inteiros). Utilizadas para avaliar tempo, distância, áreas e volumes.
Ciência de Dados
Área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou informação para tomadas de decisão.