Conceitos Fundamentais de Estatística Descritiva

Classificado em Matemática

Escrito em em português com um tamanho de 4,21 KB

Regra de Ouro

Se a junta CV é de 35% homogênea.

Se o CV 35% do conjunto é heterogêneo.

Coeficiente de Bias

Bias: Grau de assimetria ou falta de simetria de uma distribuição de frequência. É determinado por:

Regras do Coeficiente de Preconceito (Bias)

  • Se o coeficiente de preconceito é "+", então o viés da distribuição é positivo.
  • Se o coeficiente de preconceito é "-", então a tendência da distribuição é negativa.
  • Se o coeficiente de preconceito é zero, então a distribuição é simétrica.

Quantis

Partição da área sob o polígono de frequência em mais de dois partidos, com os quatro usuais, dez e cem pedaços.

  • Quartil: Divide a distribuição de frequência em quatro partes.
  • Decil: Divide a distribuição de frequência em 10 partes iguais.
  • Percentil: Divide a distribuição de frequência em 100 partes iguais.

Representação Gráfica de Frequências

Gráfico Circular (Pizza)

Pode representar frequências absolutas e frequências relativas em círculos. Determinar o número de graus do círculo corresponde a cada frequência absoluta, pela proporção.

Gráfico de Caule e Folha (Stem and Leaf)

É um procedimento semi-gráfico para variáveis quantitativas.

Os dígitos são separados em duas porções:

  • STEM (Caule): Define uma classe e corresponde a um certo número de algarismos contados da esquerda para a direita.
  • FOLHA (Leaf): Define a frequência absoluta da classe e utiliza o próximo dígito, descartando o restante, se houver.

A representação dos dados é realizada por meio de uma coluna de hastes, dispostas em ordem e sem repetição, e outra para as folhas correspondentes.

Medidas de Tendência Central

Moda

É a pontuação ou categoria que ocorre com mais frequência. Usada com qualquer tipo de medida.

Mediana

É o valor que divide a distribuição ao meio. Isto é, metade dos casos caem abaixo da mediana e metade está acima dela. A mediana é usada para medir os níveis de intervalo ou a relação ordinal.

Média

É a média aritmética da distribuição. É a soma de todos os valores, dividido pelo número de casos. Aplica-se apenas às medições de intervalo e razão (classes).

Exemplo: $$(3 + 5 + 6) / 3 = 4,6$$

Medidas de Dispersão

Medidas de variabilidade ou dispersão dos dados a partir de uma série de valores. Representam a semelhança ou diferença entre os indivíduos do grupo em relação a algumas variáveis quantitativas (idade, rendimento, educação, etc.).

Os principais são os seguintes:

  • Variação (Amplitude)
  • Desvio Padrão
  • Índice de Dispersão

Variação (Amplitude)

Média dos desvios ao quadrado de cada um dos valores de uma série em relação à sua média aritmética.

Desvio Padrão

É a raiz quadrada da variância.

Medidas de Dispersão (Comuns)

Quantificam a dispersão dos dados em torno do centro dos dados.

As mais comuns são: Amplitude, Intervalo Interquartil, Variância, Desvio Padrão, Coeficiente de Variação.

Variância

É mais útil em aplicações estatísticas. É definida como a ordenação ou agrupamento de dados e o resultado é obtido da seguinte forma:

  • Dados individuais.
  • Dados agrupados.
  • Dados agrupados por classes.

Desvio Padrão

É definido como o desvio médio dos dados originais em relação à média aritmética destes. É indicado por $\sigma$ (sigma).

Aproximações baseadas na curva normal:

  • Contém aproximadamente 68% das observações.
  • Contém aproximadamente 95% das observações.
  • Contém aproximadamente 100% das observações.

Coeficiente de Variação

Dá o "grau" ou "%" de variabilidade dos dados e é usado para comparar duas distribuições que podem ter diferentes unidades de medida.

Entradas relacionadas: