Conceitos Fundamentais de Estatística Descritiva
Classificado em Matemática
Escrito em em
português com um tamanho de 4,21 KB
Regra de Ouro
Se a junta CV é de 35% homogênea.
Se o CV 35% do conjunto é heterogêneo.
Coeficiente de Bias
Bias: Grau de assimetria ou falta de simetria de uma distribuição de frequência. É determinado por:
Regras do Coeficiente de Preconceito (Bias)
- Se o coeficiente de preconceito é "+", então o viés da distribuição é positivo.
- Se o coeficiente de preconceito é "-", então a tendência da distribuição é negativa.
- Se o coeficiente de preconceito é zero, então a distribuição é simétrica.
Quantis
Partição da área sob o polígono de frequência em mais de dois partidos, com os quatro usuais, dez e cem pedaços.
- Quartil: Divide a distribuição de frequência em quatro partes.
- Decil: Divide a distribuição de frequência em 10 partes iguais.
- Percentil: Divide a distribuição de frequência em 100 partes iguais.
Representação Gráfica de Frequências
Gráfico Circular (Pizza)
Pode representar frequências absolutas e frequências relativas em círculos. Determinar o número de graus do círculo corresponde a cada frequência absoluta, pela proporção.
Gráfico de Caule e Folha (Stem and Leaf)
É um procedimento semi-gráfico para variáveis quantitativas.
Os dígitos são separados em duas porções:
- STEM (Caule): Define uma classe e corresponde a um certo número de algarismos contados da esquerda para a direita.
- FOLHA (Leaf): Define a frequência absoluta da classe e utiliza o próximo dígito, descartando o restante, se houver.
A representação dos dados é realizada por meio de uma coluna de hastes, dispostas em ordem e sem repetição, e outra para as folhas correspondentes.
Medidas de Tendência Central
Moda
É a pontuação ou categoria que ocorre com mais frequência. Usada com qualquer tipo de medida.
Mediana
É o valor que divide a distribuição ao meio. Isto é, metade dos casos caem abaixo da mediana e metade está acima dela. A mediana é usada para medir os níveis de intervalo ou a relação ordinal.
Média
É a média aritmética da distribuição. É a soma de todos os valores, dividido pelo número de casos. Aplica-se apenas às medições de intervalo e razão (classes).
Exemplo: $$(3 + 5 + 6) / 3 = 4,6$$
Medidas de Dispersão
Medidas de variabilidade ou dispersão dos dados a partir de uma série de valores. Representam a semelhança ou diferença entre os indivíduos do grupo em relação a algumas variáveis quantitativas (idade, rendimento, educação, etc.).
Os principais são os seguintes:
- Variação (Amplitude)
- Desvio Padrão
- Índice de Dispersão
Variação (Amplitude)
Média dos desvios ao quadrado de cada um dos valores de uma série em relação à sua média aritmética.
Desvio Padrão
É a raiz quadrada da variância.
Medidas de Dispersão (Comuns)
Quantificam a dispersão dos dados em torno do centro dos dados.
As mais comuns são: Amplitude, Intervalo Interquartil, Variância, Desvio Padrão, Coeficiente de Variação.
Variância
É mais útil em aplicações estatísticas. É definida como a ordenação ou agrupamento de dados e o resultado é obtido da seguinte forma:
- Dados individuais.
- Dados agrupados.
- Dados agrupados por classes.
Desvio Padrão
É definido como o desvio médio dos dados originais em relação à média aritmética destes. É indicado por $\sigma$ (sigma).
Aproximações baseadas na curva normal:
- Contém aproximadamente 68% das observações.
- Contém aproximadamente 95% das observações.
- Contém aproximadamente 100% das observações.
Coeficiente de Variação
Dá o "grau" ou "%" de variabilidade dos dados e é usado para comparar duas distribuições que podem ter diferentes unidades de medida.