Muhammad Ammar Farhan Putra

PROPOSAL USULAN PENELITIAN
ANALISIS DAN IMPLEMENTASI ALGORITMA K-MEANS DAN

DECISION TREE ALGORITHM UNTUK PREDIKSI KINERJA
KARYAWAN
Studi Kasus: Organisasi Xyz
Muhammad Ammar Farhan Putra
16.11.0627
PROGRAM STUDI INFORMATIKA

FAKULTAS ILMU KOMPUTER
UNIVERSITAS AMIKOM YOGYAKARTA
2019
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kualitas Sumber Daya Manusia (SDM) merupakan salah satu faktor

yang dapat meningkatkan produktivitas kinerja organisasi maupun instansi.
Dewasa ini banyak organisasi atau instansi yang sudah mempunyai sistem penilaian
kinerja karyawan. Penilaian kinerja karyawan terkadang hanya dilakukan dua atau
satu kali dalam setahun. Penilaian kinerja yang baik pasti akan secara jelas
menguntungkan organisasi dan dapat membantu karyawan untuk mencapai tujuan
organisasi dengan memungkinkan karyawan tahu apa yang diharapkan dari mereka,
dan dapat menghasilkan informasi untuk membuat keputusan kerja, seperti
kenaikan gaji, promosi, atau pelepasan karyawan. Mengembangkan suatu sistem
yang efektif dan efisien bukanlah merupakan suatu hal yang mudah. Karyawan
dapat meningkatkan kinerja mereka dengan cara melihat perkembangan kinerja
mereka. Clustering dan Decision Tree Algorithm merupakan metode yang dapat
digunakan untuk mencari key characteristics dari prediksi suatu organisasi.
Clustering merupakan suatu metode untuk mencari dan mengelompokkan data
yang memiliki kemiripan karakteristik antara satu data dengan data yang lain [1].
Metode ini merupakan prosedur yang sudah banyak digunakan untuk prediksi dan
waktu yang dibutuhkan untuk menjalankan metode ini relatif cepat.
Tujuan utama dari penelitian ini adalah untuk membagi karyawan

menjadi grup homogen sesuai dengan karakteristik dan kemampuan menggunakan
algoritma clustering. Hal ini membuat hasil dari analisis cluster menjadi pembagian
karyawan ke dalam kelompok berdasarkan dengan kinerja mereka. Decision tree
bertugas membuat keputusan untuk karyawan. Berdasarkan hasil dari kinerja
karyawan dapat diberikan keputusan apakah akan diberikan pelatihan lanjutan atau
kualifikasi lebih lanjut diperlukan atau tidak. Implementasi ini juga akan
memudahkan staf administrasi untuk meningkatkan kualitas dari organisasi
maupun instansi terkait.
1.2 Rumusan Masalah
Berdasarkan dari latar belakang tersebut, dapat dirumuskan hal-hal

sebagai berikut:
1. Apakah prediksi kinerja karyawan dapat dioptimalkan dengan

menggunakan algoritma K-means Clustering dan Decision Tree?
2. Bagaimana cara kerja metode K-means Clustering dan Decision Tree
dalam menentukan prediksi kinerja karyawan di masa mendatang?
3. Bagaimana penerapan algoritma K-means Clustering dan Decision Tree
menggunakan software RapidMiner Studio 9.0?
1.3 Batasan Masalah
Dari rumusan masalah diatas, harus ada pembatasan masalah untuk

pembahasan yang lebih jelas. Batasan masalah dari “Analisis dan Implementasi
Algoritma K-means dan Decision Tree Algorithm untuk Prediksi Kinerja
Karyawan, Studi Kasus: Organisasi Xyz.” Adalah sebagai berikut:
1. Software yang digunakan pada penelitian ini menggunakan RapidMiner

Studio 9.0.
2. Data yang digunakan merupakan data kinerja karyawan organisasi xyz
tahun 2018.
3. Analisis ini hanya akan melakukan klasifikasi dan prediksi untuk
menentukan keputusan apa yang akan diambil berdasarkan hasil analisis
klasifikasi.
1.4 Tujuan Penelitian
Tujuan penelitian ini berdasarkan dari rumusan masalah yang sudah

dijabarkan diatas adalah sebagai berikut:
1. Mengimplementasikan algoritma K-means Clustering dan Decision

Tree pada penilaian kinerja karyawan organisasi Xyz.
2. Mengelompokan karyawan berdasarkan penilaian kinerjanya dan
memberikan keputusan sesuai dengan pengelompokan.
3. Memudahkan staf administrasi dalam mengambil keputusan untuk
meningkatkan kinerja karyawan dan organisasi.
1.5 Manfaat Penelitian
Manfaat penelitian ini bagi penulis, civitas AMIKOM, dan bagi masyarakat
adalah sebagai berikut:
1. Memperdalam pemahaman tentang metode K-means Clustering dan

Decision Tree.
2. Memberi pengetahuan tentang penerapan metode K-means Clustering
dan Decision Tree Algorithm.
BAB II
LANDASAN TEORI
2.1 Tinjauan Pustaka
Penilaian prestasi kinerja adalah suatu proses penilaian prestasi kinerja

pegawai yang dilakukan pemimpin perusahaan secara sistematik berdasarkan
pekerjaan yang ditugaskan kepadanya[2].
Clustering merupakan suatu metode untuk mencari dan

mengelompokkan data yang memiliki kemiripan karakteriktik (similarity) antara
satu data dengan data yang lain. Clustering merupakan salah satu metode data
mining yang bersifat tanpa arahan (unsupervised)[3].
1. K-means Clustering
K-means clustering merupakan tipe dari unsupervised learning,
yang menggunakan data tidak ber-label. Tujuan dari algoritma ini adalah
untuk mencari kelompok di dalam data, dengan kelompok angka yang
direpresentasikan sebagai K[4]. Algoritma ini bekerja secara berulang untuk
menentukan setiap poin data ke salah satu kelompok K berdasarkan dari
karakteriktik yang disediakan. Poin data dikelompokkan sesuai dengan
kemiripan karakteriktik.
K-means clustering bertujuan untuk membagi objek n kedalam
kluster k yang mana setiap objek adalah milik kluster yang paling dekat
dengan mean. Metode ini menghasilkan tepat kluster k yang berdasarkan
dari perbedaan terbesar. Jumlah terbaik dari kluster k menuju pada
pemisahan terbesar (jarak) tidak dikenal sebagai apriori dan harus dihitung
melalui data. Tujuan dari K-means clustering adalah untuk meminimalkan
total varian intra-kluster atau kesalahan fungsi kuadrat. Seperangkat data
atau dokumen diberikan (x1, x2, ..., xi), di mana setiap titik data adalah
vektor nyata dimensi-M, tujuan algoritme ini adalah untuk mempartisi n
dokumen menjadi k cluster (k ≤ n) dengan meminimalkan suatu fungsi
obyektif, yang dapat dinyatakan sebagai berikut ini,
𝑘 𝑛
(𝑗) 2
𝐽 = ∑ ∑ ‖𝑋𝑖 − 𝐶𝑗 ‖ (1)
𝑗=𝑙 𝑖=𝑙
J adalah fungsi objek, k adalah jumlah kluster, n adalah jumlah

2
(𝑗) (𝑗)
kasus, dan ‖𝑋𝑖 − 𝐶𝑗 ‖ adalah jarak hitung pilihan antara poin data 𝑋𝑖
dan kluster tengah 𝐶𝑗 . Algoritma dan flow-chart dari K-means clustering
diberikan dibawah ini.
Langkah 1: Ambil jumlah cluster untuk mengelompokkan data ke

dalam dan dataset untuk mengelompok sebagai nilai input
Langkah 2: Inisialisasi kluster K pertama
• Ambil contoh pertama atau
• Ambil sampel acak elemen k
Langkah 3: Hitung rata-rata aritmatika dari setiap cluster yang

terbentuk dalam dataset.
Langkah 4: K-means menetapkan setiap catatan dalam dataset hanya

untuk satu dari kluster awal.
Langkah 5: K-means menugaskan kembali setiap catatan dalam

dataset ke cluster yang paling mirip dan menghitung ulang rata-rata
aritmatika dari semua cluster dalam dataset.
Gambar 2.1. Flowchart dari K-means clustering

2. Decision Tree Algorithm
Data mining[5] merupakan proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar[6].
Decision Tree Algorithm adalah metode klasifikasi dan prediksi
yang sudah terbukti powerfull dan sangat terkenal. Metode ini berfungsi
untuk mengubah fakta menjadi pohon keputusan yang merepresentasikan
aturan yang dapat mudah dimengerti dengan bahasa alami. Proses dari
pohon keputusan ini dimulai dari node akar hingga node daun yang
dilakukan secara rekursif dimana setiap percabangan menyatakan kondisi
dan setiap ujung pohon akan menyatakan keputusan[7].
Arsitektur pohon keputusan dibuat sedemikian rupa agar
menyerupai pohon asli, dimana terdapat beberapa bagian yaitu:
- Root Node: Node ini terletak pada bagian paling atas dari pohon
keputusan.
- Internal Node: Node ini merupakan percabangan dimana
membutuhkan satu input dan mengeluarkan maksimal dua
output.
- Leaf Node: Node ini merupakan node yang terletak pada ujung
pohon. Node ini hanya memiliki satu input dan tidak memiliki
output.
Pohon keputusan memiliki beberapa kekurangan dan kelebihan,

yakni[7]:
1. Kelebihan Pohon Keputusan

- Daerah pengambilan keputusan yang kompleks dapat
diubah menjadi sederhana.
- Dapat menghilangkan perhitungan yang tidak penting
karena proses pengujian hanya berdasarkan kriteria yang
diperlukan saja.
- Proses pemilihan fitur dari internal node yang berbeda
lebih fleksibel. Fitur yang telah dipilih ini akan menjadi
pembeda antara kriteria yang satu dengan kriteria yang
lainnya.
- Metode ini dapat menghindari munculnya permasalahan
dengan cara menggunakan kriteria dengan jumlah yang
sedikit pada node internal tanpa mengurangi kualitas
keputusan yang dihasilkan.
2. Kekurangan Pohon Keputusan
- Dapat terjadi overlap apabila hasil keputusan dan kriteria
yang digunakan jumlahnya sangat banyak. Hal ini juga
dapat berakibat bertambahnya waktu yang digunakan
untuk pengambilan keputusan dan jumlah memori yang
dibutuhkan semakin tinggi.
- Akumulasi jumlah error dari setiap tingkat pohon
keputusan besar.
- Mendesain pohon keputusan yang optimal sulit.
- Kualitas keputusan yang didapatkan sangat tergantung
dengan bagaimana pohon tersebut didesain.
Decision Tree akan menghasilkan pohon keputusan dari data latih

yang diberikan. Decision Tree adalah teknik yang paling banyak digunakan,
karena Decision Tree membuat pohon keputusan dari data yang diberikan
menggunakan persamaan sederhana terutama tergantung pada perhitungan
rasio keuntungan, yang secara otomatis memberikan semacam bobot pada
atribut yang digunakan, dan peneliti secara implisit dapat mengenali atribut
yang paling efektif pada target yang diprediksi. Sebagai hasil dari teknik ini,
pohon keputusan akan dibangun dengan aturan klasifikasi yang dihasilkan
darinya. Decision Tree disini akan digunakan untuk memprediksi Kinerja
Karyawan.
BAB III
METODE PENELITIAN
3.1 Alat dan Bahan Penelitian

3.1.1 Alat Penelitian
Alat penelitian berupa komputer yang akan digunakan dalam

pelaksanaan penelitian ini berupa komputer dengan spesifikasi komputer laptop
pada umumnya.
Penelitian ini menggunakan alat penelitian berupa perangkat keras dan

perangkat lunak, yaitu:
1. Perangkat keras
- Laptop ASUS GL552-VW
- Processor Intel i7-6700HQ 3200Mhz
- Besar memori RAM 16249 MB
- Kapasitas SSD 120 GB
- Perangkat mouse dan keyboard.
2. Perangkat lunak
- Sistem operasi Windows 10 Enterprise 64-bit
- RapidMiner Studio Version 9.0.
3.1.2 Bahan Penelitian
Bahan penelitian yang akan digunakan oleh penulis adalah dataset yang
diambil dari penilaian kinerja karyawan organisasi Xyz tahun 2018.
3.2 Alur Penelitian
Gambar 3.1 Flowchart alur penelitian
3.3 Strategi Pemecahan Masalah
3.4 Struktur Data yang Digunakan

DAFTAR PUSTAKA
[1] J. O. Ong, “Implementasi Algoritma K-Means Clustering Untuk

Menentukan Strategi Marketing President University,” J. Ilm. Tek. Ind.,
vol. 12, no. April, pp. 10–20, 2013.
[2] E. Nurmianto and N. Siswanto, “Perancangan Penilaian Kinerja Karyawan
Berdasarkan Kompetensi Spencer Dengan Metode Analytical Hierarchy
Process,” October, vol. 8, no. July 2008, pp. 1–51, 2006.
[3] D. Rima Ramadhani, “Data Mining Menggunakan Algoritma K-Means
Clustering Untuk Menentukan Strategi Promosi,” Ind. Mark. Manag., vol.
1, no. 1, pp. 1–9, 2014.
[4] A. Sarker, S. M. Shamim, S. Zama, and M. Rahman, “Employee’s
Performance Analysis and Prediction using K-Means Clustering &
Decision Tree Algorithm,” vol. 18, no. 1, 2018.
[5] J. P. Jiawei Han, Micheline Kamber, Data Mining – Concepts &
Techniques. 2011.
[6] M. Ridwan, H. Suyono, and M. Sarosa, “Penerapan Data Mining Untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive
Bayes Classifier,” vol. 7, no. 1, pp. 59–64, 2013.
[7] F. F. Harryanto and S. Hansun, “Penerapan Algoritma C4.5 untuk
Memprediksi Penerimaan Calon Pegawai Baru di PT WISE,” J. Tek.
Inform. Dan Sist. Inf., vol. 3, no. 2, pp. 95–103, 2017.

Muhammad Ammar Farhan Putra

Diunggah oleh

Hak Cipta:

Format Tersedia

Muhammad Ammar Farhan Putra

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Muhammad Ammar Farhan Putra

Diunggah oleh

Hak Cipta:

Format Tersedia

PROPOSAL USULAN PENELITIAN

ANALISIS DAN IMPLEMENTASI ALGORITMA K-MEANS DAN

Studi Kasus: Organisasi Xyz

Muhammad Ammar Farhan Putra

PROGRAM STUDI INFORMATIKA

1.1 Latar Belakang

Kualitas Sumber Daya Manusia (SDM) merupakan salah satu faktor

Tujuan utama dari penelitian ini adalah untuk membagi karyawan

Berdasarkan dari latar belakang tersebut, dapat dirumuskan hal-hal

1. Apakah prediksi kinerja karyawan dapat dioptimalkan dengan

Dari rumusan masalah diatas, harus ada pembatasan masalah untuk

1. Software yang digunakan pada penelitian ini menggunakan RapidMiner

1.4 Tujuan Penelitian

Tujuan penelitian ini berdasarkan dari rumusan masalah yang sudah

1. Mengimplementasikan algoritma K-means Clustering dan Decision

1.5 Manfaat Penelitian

1. Memperdalam pemahaman tentang metode K-means Clustering dan

2.1 Tinjauan Pustaka

Penilaian prestasi kinerja adalah suatu proses penilaian prestasi kinerja

Clustering merupakan suatu metode untuk mencari dan

J adalah fungsi objek, k adalah jumlah kluster, n adalah jumlah

Langkah 1: Ambil jumlah cluster untuk mengelompokkan data ke

Langkah 3: Hitung rata-rata aritmatika dari setiap cluster yang

Langkah 4: K-means menetapkan setiap catatan dalam dataset hanya

Langkah 5: K-means menugaskan kembali setiap catatan dalam

Gambar 2.1. Flowchart dari K-means clustering

Pohon keputusan memiliki beberapa kekurangan dan kelebihan,

1. Kelebihan Pohon Keputusan

Decision Tree akan menghasilkan pohon keputusan dari data latih

3.1 Alat dan Bahan Penelitian

Alat penelitian berupa komputer yang akan digunakan dalam

Penelitian ini menggunakan alat penelitian berupa perangkat keras dan

3.1.2 Bahan Penelitian

Gambar 3.1 Flowchart alur penelitian

3.3 Strategi Pemecahan Masalah

3.4 Struktur Data yang Digunakan

[1] J. O. Ong, “Implementasi Algoritma K-Means Clustering Untuk

Anda mungkin juga menyukai