Análise Fatorial: Métodos e Interpretações Essenciais

Classificado em Tecnologia

Escrito em em português com um tamanho de 4,1 KB

Na construção da Proximity Matrix (média de semelhança), usamos o quadrado da distância euclidiana. Apresente um motivo para a sua utilização. Permite colocar progressivamente pesos maiores nos objetos/indivíduos que se encontram mais afastados. Com base no Agglomeration Schedule e na Proximity Matrix, quais os 2 primeiros indivíduos a entrar/formar o 1º cluster e qual a distância entre eles? Os dois primeiros indivíduos a entrar para o 1º cluster são o 7 e o 10, com uma distância igual a 2. Neste exercício, foram agrupados os indivíduos através do método hierárquico nearest neighbor, mas em termos práticos, qual a melhor recomendação geral que se pode fazer sobre esse assunto? Todos os métodos apresentam vantagens e desvantagens, pelo que a melhor recomendação geral que se pode fazer é a utilização de vários métodos em simultâneo. Se todos produzirem soluções interpretáveis similares, é possível concluir que a matriz dos dados tem agrupamentos "naturais" e não "artificiais". Caso o objetivo fosse o agrupamento de variáveis e não de indivíduos, quais as medidas de semelhança apropriadas para variáveis contínuas e ordinais? Para variáveis contínuas, o coeficiente de correlação de Pearson é o mais utilizado. Para variáveis qualitativas ordinais, o de Spearman. O processo de estandardização de variáveis, embora não possa ser tomado como solução ideal para todos os casos, é habitualmente usado. Em que consiste? A estandardização das variáveis consiste em subtrair, em cada variável, a sua média e dividir pelo seu desvio padrão, com o objetivo de que, por exemplo, a distribuição euclidiana não seja influenciada pela amplitude das variáveis, contribuindo todas de igual modo para a solução. Assim, se as variáveis tiverem unidades de medida diferentes e amplitudes muito diferentes, devemos padronizar as mesmas.


Para que possa prosseguir com a Análise Fatorial, as correlações entre as variáveis não devem ser pequenas, para que partilhem fatores comuns. Com base nos 2 procedimentos estatísticos que constam numa das tabelas acima, procure aferir a qualidade das correlações entre as variáveis. Para avaliar a qualidade dos dados, pode utilizar-se o método +/- heurístico: KMO = x. Justifique convenientemente qual o número de fatores que se devem reter para descrever os dados. De acordo com a regra de retenção de fatores com valores próprios superiores a 1, deve reter-se 2 fatores (o que se confirma pelo scree plot) que explicam cerca de 74% da variabilidade total. Indique qual o método de estimação utilizado para a extração dos fatores e qual a percentagem acumulada da variabilidade total que é explicada pelos 3 primeiros fatores. O método utilizado para a extração de fatores foi o método ACP. Os 3 primeiros fatores/componentes explicam 82,943% da variabilidade total. Interprete o método de rotação utilizado e qual o objetivo da sua aplicação. O método utilizado foi o varimax, com o objetivo de produzir uma solução interpretável, isto é, os pesos fatoriais das variáveis nos fatores comuns podem ser tais que não é possível atribuir um significado empírico aos fatores extraídos. Mencione as 3 variáveis melhor representadas em cada uma das componentes/fatores e procure interpretar o seu significado. Nesta solução rodada (varimax), as variáveis que definem com maior intensidade os eixos do fator componente 1 são: português, inglês, francês. Variáveis que definem melhor a componente 2: química, física, matemática. Aptidão verbal (componente 1), aptidão quantitativa (componente 2). Refira, sucintamente, qual o objetivo da Análise Fatorial. É uma técnica de análise exploratória que tem por objetivo descobrir e analisar a estrutura de um conjunto de variáveis intercorrelacionadas, de modo a construir uma escala de medida por fatores (intrínsecos) que de alguma forma +/- explicam as variáveis originais.

Entradas relacionadas: