Guia Essencial de Estatística: Conceitos e Métodos

Classificado em Matemática

Escrito em em português com um tamanho de 161,67 KB

Definição de Estatística

Definição: Estatística é um conjunto de conceitos e métodos científicos para coleta, organização, descrição, análise e interpretação de dados experimentais, que permitem tirar conclusões válidas e tomar decisões razoáveis.

Classificação da Estatística

Usualmente, a estatística se divide em:

  • Estatística Descritiva: É a parte que tem por objetivo organizar, apresentar e sintetizar dados observados de determinada população, sem pretensões de tirar conclusões de caráter extensivo.
  • Teoria de Probabilidade: Objetiva descrever e prever as características de populações infinitas.
  • Inferência Estatística: É a parte que, baseando-se em estudos realizados sobre os dados de uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi retirada. A estatística inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades. É, também, definida como um conjunto de métodos para a tomada de decisões.

Conceitos Fundamentais em Estatística

No estudo da estatística, alguns conceitos são importantes:

  • População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum. A população é o conjunto Universo. Exemplos:
    • Todos as cabeças de gado criadas em confinamento;
    • Todas as plantas de uma determinada cultivar de milho;
    • Todo o solo de um talhão de área.
  • Amostra (n): Um subconjunto da população, geralmente de tamanho reduzido, selecionado para estudo. Por exemplo, se a população é de 10.000, a amostra pode ser de 1.000, ou conforme determinado pelo pesquisador. A amostra deverá ser considerada finita, selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta.

Pesquisa Estatística

É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem.

  • Censo: Atividade de inspecionar (observar) todos os elementos de uma população, objetivando conhecer, com certeza, suas características.
  • Amostragem: É o processo de retirada de informações dos elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem).

Dados Estatísticos e Variáveis

  • Dados Estatísticos: É qualquer característica que possa ser observada ou medida de alguma maneira. A matéria-prima da estatística são os dados observáveis.
  • Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão. Geralmente, as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que podem assumir qualquer valor de um conjunto de dados.

Tipos de Amostragem

Para que, a partir de um determinado número de observações (amostras), se possa estimar o comportamento do conjunto de todas as observações em potencial (população), é necessário que esses subconjuntos sejam representativos e coletados de tal modo que cada observação tenha a mesma chance de ser escolhida. Quando uma amostra é obtida segundo esse critério, denomina-se casual (aleatória). Existem diversos esquemas de amostragem, os quais são empregados conforme o objetivo da pesquisa e o que se conhece a respeito do modelo estatístico. Nessas condições, normalmente são utilizadas tabelas de números aleatórios.

Amostragem Aleatória Simples

  • Objetivo: Obter uma amostra representativa quando os elementos da população são todos homogêneos. Neste processo de amostragem, todos os elementos da população têm a mesma probabilidade de serem amostrados. A característica principal é que todos os elementos da população têm igual probabilidade de pertencer à amostra.
  • Procedimento: Na prática, a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.
  • Exemplo: Vamos obter uma amostra representativa, de 10% dos valores, para obtermos a estatura média de noventa alunos de uma escola:
    • Numeramos os alunos de 01 a 90.
    • Sorteamos os números, de 01 a 90, um a um, nove números que formarão a amostra.

Amostragem Sistemática

Exemplo de Aplicação: Usada em linhas de produção (fábricas de processadores), onde os itens são produzidos continuamente e não é viável sortear ou testar um a um. Segue-se uma ordem de produção, por exemplo, a cada 100 itens, 10 são selecionados.

  • Objetivo: Aumentar a representatividade da amostra, dando maior cobertura à população. É usada quando todos os elementos são homogêneos e ordenados.
  • Procedimento: Quando os elementos da população já estão ordenados, não há necessidade de construirmos um sistema de referência para selecionarmos a amostra. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, uma linha de produção, os nomes em uma lista telefônica, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos de sistemática.
  • Exemplo: Consideremos uma população, com elementos ordenados, de tamanho N e dela tiramos uma amostra de tamanho n, através de uma amostragem sistemática, da seguinte maneira:
    • Definimos FS como fator de sistematização, dado por FS = N/n.
    • Sorteamos um número entre 1 e FS. Esse número é simbolizado por m, que será o primeiro elemento da amostra.
    • O segundo elemento da amostra é o de número FS + m.
    • O terceiro elemento da amostra é o de número 2FS + m.
    • O k-ésimo elemento da amostra é o número (k - 1)FS + m.
  • Exemplo Prático: Uma rua contém 1000 prédios, dos quais desejamos obter uma amostra sistemática formada por 100 deles.
    • FS = 1000/100 = 10.
    • m será um número entre 1 e 10. Vamos supor que m = 7. Então temos:
      • 1º elemento da amostra = (1-1)10 + 7 = 7 »> 7º elemento da população.
      • 100º elemento da amostra = (100 - 1)10 + 7 = 997 »> 997º elemento da população.

Amostragem Estratificada

  • Objetivo: Melhorar a representatividade da amostra quando os elementos da população são heterogêneos, porém, podem ser agrupados em subpopulações (ESTRATOS) contendo elementos homogêneos.
  • Procedimento: A população é dividida em grupos ou estratos contendo elementos homogêneos e as amostras são retiradas separadamente de cada um desses grupos.
  • Exemplo: Dada a população de 50.000 operários da indústria, selecionar uma amostra proporcional estratificada de 5% de operários para estimar seu salário médio. Usando a variável critério “cargo” para estratificar essa população, e considerando amostras de 5% de cada estrato obtido, chegamos ao seguinte quadro:
CARGOPOPULAÇÃO5% AMOSTRA
Chefes de Seção5000250
Operários Especializados15000750
Operários Não Especializados300001500
TOTAL500002500

Método Estatístico: Etapas Essenciais

O método estatístico abrange todas as etapas, do início ao fim, de uma pesquisa.

  • Definição do Problema

    Formular corretamente o problema, examinar outros levantamentos já feitos, e definir o que se pretende pesquisar (variáveis, população, hipóteses).

  • Planejamento

    Determinar os procedimentos necessários para resolver o problema, como levantar informações e os tipos de levantamento (censo ou amostragem parcial).

  • Coleta de Dados

    Consiste na obtenção dos dados referentes ao trabalho que se deseja fazer.

    • Coleta Direta: Realizada pelo próprio pesquisador, geralmente mais confiável. Permite a publicação de resultados originais.
    • Coleta Indireta: Utiliza dados históricos de outras pesquisas, que podem não ser atuais ou já foram trabalhados. Uma vantagem é a ausência de custos, mas o pesquisador original pode não ser conhecido.
  • Apuração de Dados

    Consiste em resumir os dados por contagem e agrupamento. É um trabalho de coordenação e tabulação (verificar, organizar tabelas).

  • Apresentação de Dados

    Fase em que se mostram os resultados obtidos na coleta e organização, seja de forma tabular ou gráfica (com ou sem software).

  • Análise e Interpretação de Dados

    Fase importante e mais delicada, onde são tiradas conclusões que auxiliam a resolver um problema.

Tipos de Tabelas Estatísticas

Imagem

Há três tipos principais:

  • Séries Cronológicas

    Dados de um período de tempo.

    • Colunas: Ano, Número de Clientes.
  • Série Geográfica

    Dados de diferentes regiões geográficas.

    • Colunas: Região (Norte), Frequência.
  • Série Categórica

    Dados distribuídos em categorias.

    • Exemplo: Sexo, Número de Reclamações, Percentual.
  • Série Mista

    Combinação, por exemplo, geográfica e categórica.

    • Exemplo: Região Norte, Gênero (subdivide em masculino e feminino), e Total.

Tipos de Gráficos Estatísticos

  • Gráfico de Barras: Variáveis qualitativas podem ser representadas.
  • Gráfico de Linhas: Mais indicados para séries cronológicas.
  • Gráfico Retangular de Composição: Divisão proporcional de um retângulo em relação às categorias da variável em estudo.
  • Gráfico de Setores (Pizza): Para variáveis qualitativas, compara proporções (mesmo exemplo do gráfico retangular de composição).
  • Histograma: Para dados organizados por classes. Deve ter a mesma amplitude (variável quantitativa contínua).
  • Gráfico de Pareto: Variável qualitativa ordinal, barras por categoria em ordem decrescente, enfatizando as de maior frequência.

Imagem

Imagem

Imagem

Imagem

Imagem

Imagem

Tipos de Variáveis Estatísticas

  • Variável Qualitativa

    Não numérica, não apresenta valores. Definidas por várias categorias, mostram a classificação de indivíduos. Ex: sexo, escolaridade, é fumante.

    • Nominal: Não tem ordem nas categorias. Ex: sexo, cor dos olhos, doente/sadio. Um fator não depende do outro (fa, fr, fp).
    • Ordinal: Há ordenação entre categorias (uma depende da outra). Ex: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial).
  • Variável Quantitativa

    Apresenta valores numéricos, podem ser medidos em escala quantitativa (fa, fp, fr, FA, FP).

    • Discreta (Valores Exatos): Assume somente valores inteiros num conjunto de valores. Processo de contagem. Ex: número de filhos, idade (em anos completos).
    • Contínua: Valor dentro de um intervalo. Processo de medição. Ex: Idade (24,5 meses), pressão arterial (fa, fp, fr, FA, FP, agrupamento por classes).

    Observação: Após obter salários (todos inteiros), eles seriam discretos. Mas se um deles for um número com vírgula, eles se classificam como contínuos.

Entradas relacionadas: