Uma partição dos dados em 3 grupos.

Em mineração de dados, agrupamento k-means é um método de segregar em torno de centros (centroides) diversos dados, criando o que analogamente na química chamamos de clustering que gera o efeito de particionar n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média. Isso resulta em uma divisão do espaço de dados em um Diagrama de Voronoi.

O problema é computacionalmente difícil (NP-difícil), no entanto, existem algoritmos heurísticos eficientes que são comumente empregados e convergem rapidamente para um local optimum. Estes são geralmente semelhantes ao algoritmo de maximização da expectativa para misturas de distribuições gaussianas através de uma abordagem de refinamento iterativo utilizado por ambos os algoritmos. Além disso, ambos usam os centros de clusters para modelar dados, no entanto, a clusterização k-means tende a encontrar clusters de extensão espacial comparáveis enquanto o mecanismo de maximização da expectativa permite ter diferentes formas.

História

editar

O termo "k-means" foi empregado primeiramente por James MacQueen em 1967,[1] embora a ideia remonta a Hugo Steinhaus em 1957.[2] O "Standard algorithm" foi proposto primeiramente por Stuart Lloyd em 1957 como uma técnica para modulação por código de pulso, embora não tenha sido publicada fora dos laboratórios Bell até 1982.[3] Em 1965, E.W.Forgy publicou essencialmente o mesmo método, é por isso que é por vezes referido também como Lloyd-Forgy.[4] Uma versão mais eficiente foi proposta e publicada em Fortran por Hartigan e Wong, no período entre 1975 e 1979.[5]

Referências

editar
  1. MacQueen, J. B. (1967). Some Methods for classification and Analysis of Multivariate Observations. Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability. 1. University of California Press. pp. 281–297. MR 0214227. Zbl 0214.46201. Consultado em 14 de novembro de 2012 
  2. Steinhaus, H. (1957). «Sur la division des corps matériels en parties». Bull. Acad. Polon. Sci. (em francês). 4 (12): 801–804. MR 0090073. Zbl 0079.16403 
  3. Lloyd, S. P. (1957). «Least square quantization in PCM». Bell Telephone Laboratories Paper  Published in journal much later: Lloyd., S. P. (1982). «Least squares quantization in PCM» (PDF). IEEE Transactions on Information Theory. 28 (2): 129–137. doi:10.1109/TIT.1982.1056489. Consultado em 15 de abril de 2009 
  4. E.W. Forgy (1965). «Cluster analysis of multivariate data: efficiency versus interpretability of classifications». Biometrics. 21: 768-769 
  5. J.A. Hartigan (1975). Clustering algorithms. [S.l.]: John Wiley & Sons, Inc. 
Ícone de esboço Este artigo sobre informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.

📚 Artikel Terkait di Wikipedia

Psiquiatria

de autores (link) CANMAT (2023). «CANMAT 2023 Depression Guidelines: Algorithms and Patient Tools». canmat.org (em inglês). CANMAT. Consultado em 10 de

Terry Crews

& Thundercat) "These Walls" — 2017 Katy Perry (feat. Nicki Minaj) "Swish Swish" Treinador Terry 2018 Muse "Pressure" Personagem principal "Algorithm"

Matemática

Doja, M. N.; Udzir, Nur Izura; Singh, Manu Pratap. Emerging Security Algorithms and Techniques. [S.l.]: CRC Press. pp. 59–60. ISBN 978-0-8153-6145-9.

Algoritmo de Baum-Welch

Teaching the Forward-Backward Algorithm (planilha e artigo com passo a passo) Formal derivation of the Baum–Welch algorithm Arquivado em 2012-02-28 no Wayback

Ativismo antivacina

Dominik; Siebert, Uwe; Popper, Niki (2 de maio de 2022). «An iterative algorithm for optimizing COVID-19 vaccination strategies considering unknown supply»

Computação quântica supercondutora

«Demonstrating a Continuous Set of Two-qubit Gates for Near-term Quantum Algorithms». Physical Review Letters. 125 (12). Bibcode:2020PhRvL.125l0504F. ISSN 0031-9007

Teoria dos grafos

sistematização dos grafos (pdf) «Graph theory Algorithms» (em inglês). — algoritmos em pseudocódigo  «Algorithm Animations» (em inglês)  «Graph Theory Software»

Ácido desoxirribonucleico

!CS1 manut: Nomes múltiplos: lista de autores (link) Gusfield, Dan. Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology