Guia de Regressão, Correlação e Análise de Dados

Classificado em Matemática

Escrito em em português com um tamanho de 2,76 KB

Regressão

A análise de regressão estuda a relação entre uma variável, chamada de variável dependente, e outras variáveis, chamadas de variáveis independentes, representadas por um modelo matemático que associa a variável dependente com as independentes.

Modelos de Regressão

  • MRLS (Modelo de Regressão Linear Simples): Define uma relação linear entre a variável dependente e uma única variável independente. Tem como objetivo tratar de um valor que não se consegue estimar inicialmente.
  • MRLM (Modelo de Regressão Linear Múltipla): É uma coleção de técnicas estatísticas para construir modelos que descrevem relações entre várias variáveis explicativas de um determinado processo.
  • Regressão Logística: Recurso que permite estimar a probabilidade associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias.

Correlação e Métricas

Correlação: Qualquer relação dentro de uma ampla classe de relações estatísticas que envolva dependência entre duas variáveis.

Coeficiente de Pearson: Mede o grau da correlação entre duas variáveis de escala métrica. Este coeficiente, normalmente representado por ρ, assume valores entre -1 e 1. Quanto mais perto de 1 ou -1, mais forte é a relação entre os dados, indicando que a regressão pode ser usada para prever valores futuros.

R-squared (R²): Mostra o percentual da variação de Y que é explicado pela variação de X.

EDA (Análise Exploratória de Dados)

Um conjunto de técnicas estatísticas e gráficas que permitem explorar grandes massas de dados para um primeiro entendimento, na procura de algum padrão ou comportamento relevante.

Tipos de Variáveis

  • Variáveis Qualitativas Ordinais: Possuem grau de informação maior que as nominais, pois são dotadas de uma ordenação prévia. Exemplos: colocação em torneios, grau de escolaridade, classificação de qualidade.
  • Variáveis Quantitativas Discretas: Assumem apenas valores inteiros (conjuntos enumeráveis). Exemplos: pontos em um dado, número de pessoas entrevistadas.
  • Variáveis Quantitativas Contínuas: Permitem a observação de qualquer subconjunto dos números reais (resultados não inteiros). Utilizadas para avaliar tempo, distância, áreas e volumes.

Ciência de Dados

Área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou informação para tomadas de decisão.

Entradas relacionadas: