Initial Centroid Optimization of K-Means Algorithm Using Cosine Similarity

Fadhillah Azmi, Kevin Utama, Oki Thomas Gurning, Syukurman Ndraha

Abstract


Clustering salah satu metode yang sering digunakan di berbagai bidang yang melakukan analisis data, termasuk penggalian data, pengambilan dokumen, segmentasi gambar, dan klasifikasi pola. Adapaun tujuan dari metode tersebut adalah untuk mengelompokkan data ke dalam suatu cluster sehingga kesamaan antara anggota data dalam suatu data informasi yang telah di-cluster yang sama adalah maksimal, di sisi lain untuk kesamaan di antara anggota data yang lain berbeda cluster minimal. Ada beberapa pendekatan metode untuk mengurangi kesalahan pada saat centroid awal yang dipilih selama proses pengelompokan berlangsung. Disini data yang digunakan adalah data acak yang dibuat secara manual yatu 30 data dan 5 atribut, sehingga diperoleh hasil akurasi clustering dalam centroid dengan menggunakan metode K-Means memiliki signifikan 86.67%, sedangkan  menggunakan K-Means dengan cosine similarity tidak jauh berbeda yaitu sebesar 89.7%, maka dari itu hasilnya cukup baik.


Keywords


Optimalisasi; K-Means; Cosine Similarity; Initial Centroid

Full Text:

PDF


DOI: https://doi.org/10.31289/jite.v3i2.3211

DOI (PDF): https://doi.org/10.31289/jite.v3i2.3211.g2433

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.