Muhammad Ammar Farhan Putra

Unduh sebagai docx, pdf, atau txt
Unduh sebagai docx, pdf, atau txt
Anda di halaman 1dari 10

PROPOSAL USULAN PENELITIAN

ANALISIS DAN IMPLEMENTASI ALGORITMA K-MEANS DAN


DECISION TREE ALGORITHM UNTUK PREDIKSI KINERJA
KARYAWAN

Studi Kasus: Organisasi Xyz

Muhammad Ammar Farhan Putra

16.11.0627

PROGRAM STUDI INFORMATIKA


FAKULTAS ILMU KOMPUTER
UNIVERSITAS AMIKOM YOGYAKARTA
2019
BAB I

PENDAHULUAN

1.1 Latar Belakang

Kualitas Sumber Daya Manusia (SDM) merupakan salah satu faktor


yang dapat meningkatkan produktivitas kinerja organisasi maupun instansi.
Dewasa ini banyak organisasi atau instansi yang sudah mempunyai sistem penilaian
kinerja karyawan. Penilaian kinerja karyawan terkadang hanya dilakukan dua atau
satu kali dalam setahun. Penilaian kinerja yang baik pasti akan secara jelas
menguntungkan organisasi dan dapat membantu karyawan untuk mencapai tujuan
organisasi dengan memungkinkan karyawan tahu apa yang diharapkan dari mereka,
dan dapat menghasilkan informasi untuk membuat keputusan kerja, seperti
kenaikan gaji, promosi, atau pelepasan karyawan. Mengembangkan suatu sistem
yang efektif dan efisien bukanlah merupakan suatu hal yang mudah. Karyawan
dapat meningkatkan kinerja mereka dengan cara melihat perkembangan kinerja
mereka. Clustering dan Decision Tree Algorithm merupakan metode yang dapat
digunakan untuk mencari key characteristics dari prediksi suatu organisasi.
Clustering merupakan suatu metode untuk mencari dan mengelompokkan data
yang memiliki kemiripan karakteristik antara satu data dengan data yang lain [1].
Metode ini merupakan prosedur yang sudah banyak digunakan untuk prediksi dan
waktu yang dibutuhkan untuk menjalankan metode ini relatif cepat.

Tujuan utama dari penelitian ini adalah untuk membagi karyawan


menjadi grup homogen sesuai dengan karakteristik dan kemampuan menggunakan
algoritma clustering. Hal ini membuat hasil dari analisis cluster menjadi pembagian
karyawan ke dalam kelompok berdasarkan dengan kinerja mereka. Decision tree
bertugas membuat keputusan untuk karyawan. Berdasarkan hasil dari kinerja
karyawan dapat diberikan keputusan apakah akan diberikan pelatihan lanjutan atau
kualifikasi lebih lanjut diperlukan atau tidak. Implementasi ini juga akan
memudahkan staf administrasi untuk meningkatkan kualitas dari organisasi
maupun instansi terkait.
1.2 Rumusan Masalah

Berdasarkan dari latar belakang tersebut, dapat dirumuskan hal-hal


sebagai berikut:

1. Apakah prediksi kinerja karyawan dapat dioptimalkan dengan


menggunakan algoritma K-means Clustering dan Decision Tree?
2. Bagaimana cara kerja metode K-means Clustering dan Decision Tree
dalam menentukan prediksi kinerja karyawan di masa mendatang?
3. Bagaimana penerapan algoritma K-means Clustering dan Decision Tree
menggunakan software RapidMiner Studio 9.0?
1.3 Batasan Masalah

Dari rumusan masalah diatas, harus ada pembatasan masalah untuk


pembahasan yang lebih jelas. Batasan masalah dari “Analisis dan Implementasi
Algoritma K-means dan Decision Tree Algorithm untuk Prediksi Kinerja
Karyawan, Studi Kasus: Organisasi Xyz.” Adalah sebagai berikut:

1. Software yang digunakan pada penelitian ini menggunakan RapidMiner


Studio 9.0.
2. Data yang digunakan merupakan data kinerja karyawan organisasi xyz
tahun 2018.
3. Analisis ini hanya akan melakukan klasifikasi dan prediksi untuk
menentukan keputusan apa yang akan diambil berdasarkan hasil analisis
klasifikasi.

1.4 Tujuan Penelitian

Tujuan penelitian ini berdasarkan dari rumusan masalah yang sudah


dijabarkan diatas adalah sebagai berikut:

1. Mengimplementasikan algoritma K-means Clustering dan Decision


Tree pada penilaian kinerja karyawan organisasi Xyz.
2. Mengelompokan karyawan berdasarkan penilaian kinerjanya dan
memberikan keputusan sesuai dengan pengelompokan.
3. Memudahkan staf administrasi dalam mengambil keputusan untuk
meningkatkan kinerja karyawan dan organisasi.

1.5 Manfaat Penelitian

Manfaat penelitian ini bagi penulis, civitas AMIKOM, dan bagi masyarakat
adalah sebagai berikut:

1. Memperdalam pemahaman tentang metode K-means Clustering dan


Decision Tree.
2. Memberi pengetahuan tentang penerapan metode K-means Clustering
dan Decision Tree Algorithm.
BAB II

LANDASAN TEORI

2.1 Tinjauan Pustaka

Penilaian prestasi kinerja adalah suatu proses penilaian prestasi kinerja


pegawai yang dilakukan pemimpin perusahaan secara sistematik berdasarkan
pekerjaan yang ditugaskan kepadanya[2].

Clustering merupakan suatu metode untuk mencari dan


mengelompokkan data yang memiliki kemiripan karakteriktik (similarity) antara
satu data dengan data yang lain. Clustering merupakan salah satu metode data
mining yang bersifat tanpa arahan (unsupervised)[3].

1. K-means Clustering
K-means clustering merupakan tipe dari unsupervised learning,
yang menggunakan data tidak ber-label. Tujuan dari algoritma ini adalah
untuk mencari kelompok di dalam data, dengan kelompok angka yang
direpresentasikan sebagai K[4]. Algoritma ini bekerja secara berulang untuk
menentukan setiap poin data ke salah satu kelompok K berdasarkan dari
karakteriktik yang disediakan. Poin data dikelompokkan sesuai dengan
kemiripan karakteriktik.
K-means clustering bertujuan untuk membagi objek n kedalam
kluster k yang mana setiap objek adalah milik kluster yang paling dekat
dengan mean. Metode ini menghasilkan tepat kluster k yang berdasarkan
dari perbedaan terbesar. Jumlah terbaik dari kluster k menuju pada
pemisahan terbesar (jarak) tidak dikenal sebagai apriori dan harus dihitung
melalui data. Tujuan dari K-means clustering adalah untuk meminimalkan
total varian intra-kluster atau kesalahan fungsi kuadrat. Seperangkat data
atau dokumen diberikan (x1, x2, ..., xi), di mana setiap titik data adalah
vektor nyata dimensi-M, tujuan algoritme ini adalah untuk mempartisi n
dokumen menjadi k cluster (k ≤ n) dengan meminimalkan suatu fungsi
obyektif, yang dapat dinyatakan sebagai berikut ini,
𝑘 𝑛
(𝑗) 2
𝐽 = ∑ ∑ ‖𝑋𝑖 − 𝐶𝑗 ‖ (1)
𝑗=𝑙 𝑖=𝑙

J adalah fungsi objek, k adalah jumlah kluster, n adalah jumlah


2
(𝑗) (𝑗)
kasus, dan ‖𝑋𝑖 − 𝐶𝑗 ‖ adalah jarak hitung pilihan antara poin data 𝑋𝑖
dan kluster tengah 𝐶𝑗 . Algoritma dan flow-chart dari K-means clustering
diberikan dibawah ini.

Langkah 1: Ambil jumlah cluster untuk mengelompokkan data ke


dalam dan dataset untuk mengelompok sebagai nilai input
Langkah 2: Inisialisasi kluster K pertama
• Ambil contoh pertama atau
• Ambil sampel acak elemen k

Langkah 3: Hitung rata-rata aritmatika dari setiap cluster yang


terbentuk dalam dataset.

Langkah 4: K-means menetapkan setiap catatan dalam dataset hanya


untuk satu dari kluster awal.

Langkah 5: K-means menugaskan kembali setiap catatan dalam


dataset ke cluster yang paling mirip dan menghitung ulang rata-rata
aritmatika dari semua cluster dalam dataset.

Gambar 2.1. Flowchart dari K-means clustering


2. Decision Tree Algorithm
Data mining[5] merupakan proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar[6].
Decision Tree Algorithm adalah metode klasifikasi dan prediksi
yang sudah terbukti powerfull dan sangat terkenal. Metode ini berfungsi
untuk mengubah fakta menjadi pohon keputusan yang merepresentasikan
aturan yang dapat mudah dimengerti dengan bahasa alami. Proses dari
pohon keputusan ini dimulai dari node akar hingga node daun yang
dilakukan secara rekursif dimana setiap percabangan menyatakan kondisi
dan setiap ujung pohon akan menyatakan keputusan[7].
Arsitektur pohon keputusan dibuat sedemikian rupa agar
menyerupai pohon asli, dimana terdapat beberapa bagian yaitu:
- Root Node: Node ini terletak pada bagian paling atas dari pohon
keputusan.
- Internal Node: Node ini merupakan percabangan dimana
membutuhkan satu input dan mengeluarkan maksimal dua
output.
- Leaf Node: Node ini merupakan node yang terletak pada ujung
pohon. Node ini hanya memiliki satu input dan tidak memiliki
output.

Pohon keputusan memiliki beberapa kekurangan dan kelebihan,


yakni[7]:

1. Kelebihan Pohon Keputusan


- Daerah pengambilan keputusan yang kompleks dapat
diubah menjadi sederhana.
- Dapat menghilangkan perhitungan yang tidak penting
karena proses pengujian hanya berdasarkan kriteria yang
diperlukan saja.
- Proses pemilihan fitur dari internal node yang berbeda
lebih fleksibel. Fitur yang telah dipilih ini akan menjadi
pembeda antara kriteria yang satu dengan kriteria yang
lainnya.
- Metode ini dapat menghindari munculnya permasalahan
dengan cara menggunakan kriteria dengan jumlah yang
sedikit pada node internal tanpa mengurangi kualitas
keputusan yang dihasilkan.
2. Kekurangan Pohon Keputusan
- Dapat terjadi overlap apabila hasil keputusan dan kriteria
yang digunakan jumlahnya sangat banyak. Hal ini juga
dapat berakibat bertambahnya waktu yang digunakan
untuk pengambilan keputusan dan jumlah memori yang
dibutuhkan semakin tinggi.
- Akumulasi jumlah error dari setiap tingkat pohon
keputusan besar.
- Mendesain pohon keputusan yang optimal sulit.
- Kualitas keputusan yang didapatkan sangat tergantung
dengan bagaimana pohon tersebut didesain.

Decision Tree akan menghasilkan pohon keputusan dari data latih


yang diberikan. Decision Tree adalah teknik yang paling banyak digunakan,
karena Decision Tree membuat pohon keputusan dari data yang diberikan
menggunakan persamaan sederhana terutama tergantung pada perhitungan
rasio keuntungan, yang secara otomatis memberikan semacam bobot pada
atribut yang digunakan, dan peneliti secara implisit dapat mengenali atribut
yang paling efektif pada target yang diprediksi. Sebagai hasil dari teknik ini,
pohon keputusan akan dibangun dengan aturan klasifikasi yang dihasilkan
darinya. Decision Tree disini akan digunakan untuk memprediksi Kinerja
Karyawan.
BAB III

METODE PENELITIAN

3.1 Alat dan Bahan Penelitian


3.1.1 Alat Penelitian

Alat penelitian berupa komputer yang akan digunakan dalam


pelaksanaan penelitian ini berupa komputer dengan spesifikasi komputer laptop
pada umumnya.

Penelitian ini menggunakan alat penelitian berupa perangkat keras dan


perangkat lunak, yaitu:

1. Perangkat keras
- Laptop ASUS GL552-VW
- Processor Intel i7-6700HQ 3200Mhz
- Besar memori RAM 16249 MB
- Kapasitas SSD 120 GB
- Perangkat mouse dan keyboard.
2. Perangkat lunak
- Sistem operasi Windows 10 Enterprise 64-bit
- RapidMiner Studio Version 9.0.

3.1.2 Bahan Penelitian

Bahan penelitian yang akan digunakan oleh penulis adalah dataset yang
diambil dari penilaian kinerja karyawan organisasi Xyz tahun 2018.
3.2 Alur Penelitian

Gambar 3.1 Flowchart alur penelitian

3.3 Strategi Pemecahan Masalah

3.4 Struktur Data yang Digunakan


DAFTAR PUSTAKA

[1] J. O. Ong, “Implementasi Algoritma K-Means Clustering Untuk


Menentukan Strategi Marketing President University,” J. Ilm. Tek. Ind.,
vol. 12, no. April, pp. 10–20, 2013.
[2] E. Nurmianto and N. Siswanto, “Perancangan Penilaian Kinerja Karyawan
Berdasarkan Kompetensi Spencer Dengan Metode Analytical Hierarchy
Process,” October, vol. 8, no. July 2008, pp. 1–51, 2006.
[3] D. Rima Ramadhani, “Data Mining Menggunakan Algoritma K-Means
Clustering Untuk Menentukan Strategi Promosi,” Ind. Mark. Manag., vol.
1, no. 1, pp. 1–9, 2014.
[4] A. Sarker, S. M. Shamim, S. Zama, and M. Rahman, “Employee’s
Performance Analysis and Prediction using K-Means Clustering &
Decision Tree Algorithm,” vol. 18, no. 1, 2018.
[5] J. P. Jiawei Han, Micheline Kamber, Data Mining – Concepts &
Techniques. 2011.
[6] M. Ridwan, H. Suyono, and M. Sarosa, “Penerapan Data Mining Untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive
Bayes Classifier,” vol. 7, no. 1, pp. 59–64, 2013.
[7] F. F. Harryanto and S. Hansun, “Penerapan Algoritma C4.5 untuk
Memprediksi Penerimaan Calon Pegawai Baru di PT WISE,” J. Tek.
Inform. Dan Sist. Inf., vol. 3, no. 2, pp. 95–103, 2017.

Anda mungkin juga menyukai