Conceitos Fundamentais de Estatística e Análise de Dados
Classificado em Matemática
Escrito em em
português com um tamanho de 11,7 KB
Estatística
A estatística é geralmente considerada como uma coleção de fatos numéricos expressos em termos de uma relação de submissão, e foram recolhidos junto de outros dados numéricos.
Kendall e Buckland (citado por Gini V. Glas / Julian C. Stanley, 1980) definem a estatística como um valor de síntese, calculado com base em uma amostra de observações que, em geral, embora não por necessidade, deve ser considerado como uma estimativa de parâmetros de uma dada população, ou seja, uma função dos valores da amostra.
"A estatística é uma técnica especial apropriada para o estudo quantitativo dos fenômenos de massa ou coletivos, cuja mediação exige uma massa de observações de outros fenômenos mais simples chamados indivíduo ou indivíduos." (Gini, 1953).
R. Murray Spiegel (1991) afirma: "A Estatística estuda os métodos científicos para coletar, organizar, resumir e analisar dados, extrair conclusões válidas e tomar decisões razoáveis com base nessa análise."
"Estatística é a ciência que trata da recolha, classificação e apresentação dos fatos objeto de uma avaliação numérica com base na explicação, descrição e comparação dos fenômenos." (Yale e Kendal, 1954).
Seja qual for o ponto de vista, a chave é a importância científica que a estatística possui, devido à ampla gama de aplicações que ela tem.
População
O conceito de população em matéria de estatística vai além do que é comumente conhecido como tal. Uma população refere-se a um conjunto finito ou infinito de pessoas ou objetos que compartilham características comuns.
"A população é um conjunto de todos os elementos sob consideração, sobre o qual tentamos tirar conclusões." (Levin & Rubin, 1996).
"A população é um conjunto de elementos que têm uma característica comum." (Chains, 1974).
Exemplo:
- Os membros do Colégio de Engenheiros do Estado de Cojedes.
O tamanho de uma população é um fator importante no processo de pesquisa estatística. Esse tamanho é determinado pelo número de elementos que constituem a população. De acordo com o número de elementos, a população pode ser finita ou infinita. Quando o número de itens que integram a população é muito grande, podemos considerá-la como uma população infinita, por exemplo, o conjunto de todos os números positivos. A população finita é aquela que é formada por um número limitado de elementos, por exemplo, o número de alunos do Núcleo San Carlos da Universidade Nacional Experimental Simón Rodríguez.
Amostra
"A amostra representa uma parte da população do estudo utilizada para representá-la." (R. Murray Spiegel, 1991).
"Uma amostra é uma coleção de alguns elementos da população, mas não todos." (Levin & Rubin, 1996).
"A amostra deve ser definida com base na população, e as conclusões obtidas a partir dessa amostra só podem se referir à população de referência." (Chains, 1974).
Exemplo:
- O estudo de 50 membros do Colégio de Engenharia do Estado Cojedes.
O estudo das amostras é mais simples do que o estudo da população total, custa menos e leva menos tempo. A consideração de toda uma população nem sempre permite a aceitação de itens com defeito, pois, em alguns casos, a amostragem pode elevar o nível de qualidade.
Uma amostra deve conter as principais características da população nas mesmas proporções em que estão incluídas nessa população.
Estatísticos coletam dados de uma amostra. Eles usam essa informação para fazer inferências sobre a população que é representada pela amostra. Consequentemente, amostra e população são conceitos relativos. Uma população é um todo e uma amostra é uma fração ou segmento do todo.
Variáveis e Atributos
As variáveis, também chamadas de características quantitativas, são aquelas que podem ser expressas por números. São características passíveis de medição, como altura, peso, renda, idade, etc.
De acordo com Murray R. Spiegel (1992), "a variável é um símbolo, como X, Y, Hx, que pode ter qualquer valor de um determinado conjunto deles, chamado domínio da variável. Se a variável pode assumir apenas um valor, é denominada constante."
Todos os elementos da população têm os mesmos tipos de características, mas como estas geralmente não se manifestam com a mesma intensidade, é evidente que as variáveis assumem valores diferentes. Portanto, estas diferentes questões e medidas tomadas pelas características são os valores da variável. Juntos, eles constituem uma variável.
Métodos de Coleta de Dados
Na estatística, utiliza-se uma variedade de métodos diferentes para obtenção da informação a ser investigada. Discutiremos aqui os métodos mais importantes, incluindo as vantagens e limitações destes.
A Entrevista Pessoal
Os dados estatísticos necessários para a investigação reúnem-se frequentemente através de um processo de envio de um entrevistador ou agente, diretamente à pessoa sob investigação. O investigador faz a essa pessoa uma série de questões previamente escritas em um questionário ou cédula, onde registra as respostas. Este procedimento é conhecido como entrevistas pessoais e permite uma avaliação mais precisa e abrangente do que a prevista por outros métodos, devido ao contato direto com o entrevistado. O entrevistador pode responder a quaisquer perguntas que possam surgir em relação ao questionário ou pesquisa.
Outra vantagem é a possibilidade de os entrevistadores adaptarem a linguagem das questões ao nível intelectual dos participantes.
Uma desvantagem desse método é que, se o entrevistador não agir de boa-fé ou não tiver formação adequada, pode alterar as respostas dos entrevistados.
A Importância da Estatística na Vida Quotidiana
A Estatística é tão importante que quase nenhuma atividade humana não a envolve. As decisões mais importantes da nossa vida são feitas com base na aplicação da Estatística. Tome alguns exemplos:
- O Recenseamento Geral da População
- Estudos da Cesta Básica
- Determinação da inflação e aumentos salariais
- Acidentes mais frequentes
- Doenças mais frequentes
- Seguro de Vida
- Pagamentos de tarifas de ônibus
- Tarifas para hotéis e táxis
- Causas de mortes infantis
- Preferências de candidatos na TV e anúncios de rádio
- Necessidades das Escolas
- Vendas de produtos
Estatística como Ferramenta para Tomada de Decisão
A tomada de decisão exige o conhecimento dos melhores caminhos na direção de uma empresa. É onde se encontram os salários mais altos.
Quando uma empresa está procurando alguém para ocupar um cargo de gestão, é escolhido aquele que pode tomar boas decisões. Ou seja, não são selecionados aqueles que sempre esperam que lhes seja dito o que fazer, mas sim aqueles que decidem o que fazer quando há urgência, coincidindo com a ausência do chefe do departamento.
O melhor funcionário não é o que mais *trabalha*, mas o que melhor pensa e decide o que considera ser razoavelmente correto.
Para tomar decisões, é necessário ser capaz de preencher lacunas de informação da forma mais racional possível.
Este é o lugar onde a estatística pode ajudar a tomar decisões racionais corretas, ajudando a preencher essas lacunas.
Este curso destina-se a ensinar gradualmente o uso de estatísticas para obter um conhecimento mais profundo e racionalmente aceitável de um processo. Com a estatística, podemos ver além dos nossos olhos.
Dados Não Agrupados
É um conjunto de informações sem qualquer ordem que nos fornece uma relação clara a ser desenvolvida ao longo de um problema que é resolvido por um guia que conduz a uma tabela de frequências, como visto acima.
O Tratamento dos Dados Não Agrupados
O que isso quer dizer? Quando a amostra retirada da população ou processo a ser analisado tem menos de 20 elementos, esses dados são analisados sem a necessidade de formar classes com eles, e é isso que é chamado de processamento de dados não agrupados.
Medidas de Tendência Central (Dados Não Agrupados)
São chamadas de medidas de tendência central a média aritmética, mediana, média geométrica, moda, etc., porque, observando a distribuição dos dados, eles tendem a se localizar, em geral, no centro. A seguir, definiremos algumas medidas de tendência central e como calcular seu valor.
Dispersão
A dispersão se refere ao alargamento da distribuição de dados, ou seja, na medida em que as observações são distribuídas.
Dados Agrupados
1.4.2 Dados Agrupados
Medidas de Dispersão
São chamadas medidas de dispersão aquelas que permitem retratar a distância dos valores da variável a um valor central, ou que identificam a concentração de dados em um determinado setor de percurso da variável. Este coeficiente é aplicável a variáveis quantitativas.
Medidas de Tendência Central (Dados Agrupados)
A Estatística busca, entre outras coisas, descrever as características típicas de conjuntos de dados e, como existem várias maneiras de fazê-lo, há vários tipos de médias. Elas são chamadas de medidas de tendência central, pois globalmente o maior acúmulo de dados está em valores intermediários.
As medidas de tendência central comumente utilizadas são:
- Média aritmética
- Mediana
- Moda
- Média geométrica
- Média harmônica
- Os quantis (ou quantiaos)