... | ... | @@ -2,17 +2,16 @@ |
|
|
<p>Para melhor compreensão das análises feitas</p>
|
|
|
<hr>
|
|
|
<br>
|
|
|
<h4>Análise de Componentes Principal</h4>
|
|
|
<h4>Análise de Componente Principal (<a href="https://github.com/mljs/pca">Javascript</a>)</h4>
|
|
|
<p>A Análise de Componentes Principais (ACP) ou Principal Component Analysis (PCA) é um procedimento matemático que utiliza uma transformação ortogonal (ortogonalização de vetores) para converter um conjunto de observações de variáveis possivelmente correlacionadas num conjunto de valores de variáveis linearmente não correlacionadas chamadas de componentes principais. O número de componentes principais é menor ou igual ao número de variáveis originais. Esta transformação é definida de forma que o primeiro componente principal tem a maior variância possível (ou seja, é responsável pelo máximo de variabilidade nos dados), e cada componente seguinte, por sua vez, tem a máxima variância sob a restrição de ser ortogonal a (i.e., não correlacionado com) os componentes anteriores.
|
|
|
</p>
|
|
|
|
|
|
<h5 align="center">Exemplo visual do ACP</h5>
|
|
|
<p align="center"><img src="/uploads/83a75b781a8673e391c3444a2caed1b9/006-principal-component-analysis-individuals-factor-map-color-by-groups-1.png" width="65%">
|
|
|
</p>
|
|
|
|
|
|
<hr>
|
|
|
|
|
|
<h4>k-means</h4>
|
|
|
<h4>k-means (<a href="https://github.com/mljs/kmeans">Javascript</a>)</h4>
|
|
|
<p>Clusterização(conjuntos das instâncias) por k-means é um metodo de quantificação de vetores, originada na área de processamento de sinais, que é popular como método de análise de cluster em mineração de dados. O algoritmo funciona desta forma:
|
|
|
<br>
|
|
|
Dado um conjunto de instẫncias iniciais, o algoritmo calcula médias de distância entre essas instâncias e assina-la elas em algum cluster. Após esse passo, o algoritmo calcula o centróide(ponto em que as coordenadas são a média das coordenadas das instâncias do cluster) entre todos dos clusters alterados, para assim calcular as médias de distância atualizadas. O algoritmo itera por esses passos até convergir a um ótimo (todas as instâncias estão nos clusters mais proximos).
|
... | ... | @@ -22,3 +21,5 @@ Dado um conjunto de instẫncias iniciais, o algoritmo calcula médias de distâ |
|
|
<p align="center"><img src="/uploads/d382db5b4e7eb21c3423eefa9d3d8c77/K-means_convergence.gif" width="50%">
|
|
|
</p>
|
|
|
|
|
|
|
|
|
|