- Quanta variação deve explicar o PCA?
- O que é uma alta carga no PCA?
- Devo remover recursos altamente correlacionados antes do PCA?
- O que as cargas de um PCA nos dizem?
Quanta variação deve explicar o PCA?
Alguns critérios dizem que a variação total explicada por todos os componentes deve estar entre 70% e 80% de variação, o que neste caso significaria cerca de quatro a cinco componentes.
O que é uma alta carga no PCA?
As cargas são de um ponto de vista numérico, igual aos coeficientes das variáveis, e fornecem informações sobre quais variáveis oferecem a maior contribuição para os componentes. As cargas variam de -1 a 1. Um alto valor absoluto (para 1 ou -1) descreve que a variável influencia fortemente o componente.
Devo remover recursos altamente correlacionados antes do PCA?
Olá Yong, PCA é uma maneira de lidar com variáveis altamente correlacionadas, então não há necessidade de removê -las. Se n variáveis estiverem altamente correlacionadas, todas elas carregarão no mesmo componente principal (autovetor), não diferentes. É assim que você os identifica como altamente correlacionados.
O que as cargas de um PCA nos dizem?
Cargas positivas indicam uma variável e um componente principal estão correlacionados positivamente: um aumento em um resulta em um aumento no outro. Cargas negativas indicam uma correlação negativa. Cargas grandes (positivas ou negativas) indicam que uma variável tem um forte efeito sobre esse componente principal.