DATA MINING : METODE HARD CLUSTERING
STUDI KASUS ANALISA PELANGGAN PERUSAHAAN DAERAH AIR MINUM
KOTAMADYA SURABAYA
Taufik
Departemen Matematika, Fak. Sains dan Teknologi Universitas
Airlangga E-mail : taufik2003@gmail.com
Abstrak
Dunia bisnis yang penuh persaingan membuat para pelakunya
harus selalu memikirkan strategi-strategi terobosan yang dapat menjamin
kelangsungan bisnis mereka. Salah satu aset utama yang dimiliki oleh perusahaan
masa kini adalah data bisnis dalam jumlah yang luar biasa banyak. Ini
melahirkan kebutuhan akan adanya teknologi yang dapat memanfaatkannya untuk
membangkitkan “pengetahuan-pengetahuan” baru, yang dapat membantu dalam
pengaturan strategi bisnis. Teknologi data mining hadir sebagai solusi.
Penelitian ini memberikan alternatif pengelompokan data pdam kota Surabaya
dengan menerapkan metode Algoritma Clustering, K-Means. Dengan adanya
fakta-fakta tersebut maka penelitian ini akan menerapkan rekategori
pengelompokkan pelanggan, untuk kelompok pelanggan rumah tangga selain berdasar
lebar jalan/kelas jalan juga berdasarkan nilai NJOP, daya listrik dan luas
bangunan. Dengan klasifikasi kelompok pelanggan yang baru ini, diharapkan dari
sisi keadilan dapat tercapai tepat sasaran. Pengujian yang telah dijalankan
menunjukkan bahwa pencapaian algoritma K-mean adalah baik. Dengan Adanya aplikasi
ini dapat menyediakan informasi untuk membantu menganalisa karakteristik
pelanggan Perusahaan Daerah Air Minum (PDAM) Kota Surabaya.
Kata kunci : Data mining, Cluster, K-Means, karakteristik
pelanggan
Abstract
The business world is full of competition makes the
perpetrators should always think about breakthrough strategies that can ensure
the continuity of their business. One of main assets owned by the company today
is a business data in many outstanding quantities. This led to the need for
technology that can use it to generate new knowledges, which can help in
setting business strategy.Present data mining technology as a solution. This
study provides an alternative grouping of data PDAM Surabaya by applying
clustering algorithm, K-Means. Given these facts, this study will apply the re
-grouping categories of customer, for the customer's household in addition
based on road width / road grade is also based on the value of NJOP, electrical
power and building area. With the classification of a new group of customers,
are expected from the side of justice can be achieved on target. Tests that
have been carried out showing that the achievement of K-means algorithm is
good. With the existence of this application can provide information to help
analyze customer characteristics Regional Water Company (PDAM) Surabaya.
Key words: Data mining, Cluster, K-Means, customer
characteristics
PENDAHULUAN
Data perkembangan harga air riil (tahun 1983) selama periode
1991 hingga 1999 bergerak tidak continue (rata-rata tumbuh 1.6 persen per
tahun) dan mencapai titik terendah pada tahun 1999. Fenomena krisis ekonomi
mengakibatkan hampir keseluruhan, 29 dari 37 PDAM tidak menaikkan harga dan
menghadapi persoalan keuangan. Dalam posisi ini PDAM Kota Surabaya umumnya
tidak punya pilihan untuk berinvestasi dan mengembangkan kegiatannya.
Langkah operasional untuk mening-katkan pendapatan adalah
dengan mendiskriminasi tarif air terutama di dalam kelompok pelanggan.
Diskriminasi tarif air dilakukan berdasarkan guna persil, luas tanah, luas
bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP (Nilai Jual
Objek Pajak) dan jumlah kran. Diskriminasi tarif ini dimaksudkan untuk
memperbaiki krisis ekonomi yang sedang dialami PDAM Kota Surabaya.
Kondisi ini melahirkan kebutuhan akan adanya teknologi yang
dapat memanfaatkan data pelanggan yang luar biasa banyak untuk membangkitkan
informasi-informasi baru yang berguna seperti informasi diskriminasi tarif air
pada pelanggan PDAM Kota Surabaya. Teknologi data mining dan metode k-means
clustering merupakan solusi yang tepat.
Metode k-means clustering
merupakan solusi yang tepat bagi permasalahan diatas, karena
metode k-means clustering memiliki akurasi estimasi jumlah kelompok yang lebih
baik dibandingkan metode yang lainnya.
Mengacu kepada latar belakang masalah diatas maka rumusan
masalah dapat dijabarkan sebagai berikut :
Bagaimana pengelompokan
pelanggan berdasarkan guna persil, luas tanah, luas
bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP
dan jumlah kran. Bagaimana mendapatkan pola dan pengetahuan
dari data-data yang banyak seperti data kuesioner pelanggan pada Perusahaan
Daerah Air Minum Kota Surabaya.
Perencanaan diskriminasi tarif air diantara kelompok
pelanggan Perusahaan Daerah Air Minum Kota Surabaya.
Adapun tujuan dari perancangan dan pembuatan data mining ini
adalah sebagai berikut :
Untuk mengetahui pengelompokan pelanggan Perusahaan Daerah
Air Minum Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan,
jumlah lantai bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan
menggunakan metode k-means
clustering.
Untuk mengetahui informasi diskriminasi tarif diantara
kelompok pelanggan Perusahaan Daerah Air Minum Kota Surabaya berdasarkan
pengelompokan pelanggan yang telah ditentukan.
Sedangkan manfaat dari perancangan Data Mining Dengan Metode
K-Means
Clustering Untuk Menganalisa
Karakteristik Pelanggan PDAM Kota Surabaya ini adalah:
Membantu organisasi-organisasi
khususnya Perusahaan Daerah Air Minum Kota Surabaya untuk
mengetahui karakteristik dari pelanggan sehingga
dapat menghasilkan informasi
diskriminasi tarif air yang berguna. Membantu Perusahaan
Daerah Air
Minum dalam melakukan
pengelompokan (clustering) pelanggan dari data-data
kuesioner yang telah terkumpul.
Mempermudah kinerja manajer dalam menentukan diskriminasi
tarif air Perusahaan Daerah Air Minum Kota Surabaya.
MATERI DAN METODE Data Mining
Data mining adalah suatu teknik yang terotomasi dan mudah
digunakan untuk mendapatkan pola dan pengetahuan dari data-data yang banyak
seperti dari database yang besar, gudang data suatu
perusahaan, atau tempat-tempat
penyimpanan data yang lainnya. Tanpa data mining, kita hanya
akan mempunyai sekumpulan/segudang data yang sangat banyak namun tidak tahu
data tersebut harus diapakan. Kita tidak tahu bagaimana cara menganalisis data
tersebut, baik karena banyaknya data tersebut maupun karena kompleksnya data
tersebut. Bila tidak diolah, akan tercipta suatu kondisi yang disebut “Data
rich but information poor” dan orang-orang biasa menyebut databasenya sebagai
“kuburan data”. Data mining bisa mengubah semua itu menjadi
pengetahuan-pengetahuan yang
ditambang dari data yang ada.
Data mining berkaitan dengan ilmu probabilitas dan
statistik, sedangkan machine learning menjadi alat analisis dalam data mining.
Bidang-bidang ini berkaitan antara yang satu dengan yang lain, seperti pada
gambar di bawah ini.
g p
Perbedaan dari gambar di atas sebagai berikut:
Statistik : lebih berdasarkan teori, lebih fokus pada
pengujian hipotesis.
Machine Learning : lebih bersifat heuristik, fokus pada
perbaikan performansi dari suatu teknik learning.
Data Mining : gabungan teori dan heuristik, fokus pada
seluruh proses penemuan knowledge/pola termasuk data cleaning, learning, dan
visualisasi dari hasilnya.
Clustering
Salah satu metode dalam data mining yang sering dipakai
adalah clustering. Clustering mengidentifikasi orang-orang yang memiliki
kesamaan karakteristik tertentu berdasarkan kategori atau cluster, dan kemudian
menggunakan karakteristik tersebut sebagai vektor karakteristik atau centroid.
Kategori-kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau
mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau
saling menumpu (overlapping). Pengelompokan ini digunakan oleh perusahaan untuk
membuat laporan mengenai karakteristik umum dari pelanggan (customer) yang
berbeda.
Tujuan utama dari metode clustering adalah pengelompokan
sejumlah data/objek ke dalam cluster (grup) sehingga dalam setiap cluster akan
berisi data yang semirip mungkin. Dalam clustering kita berusaha untuk
menempatkan objek yang mirip (jaraknya dekat) dalam satu cluster dan membuat
jarak antar cluster sejauh mungkin. Ini berarti objek dalam satu cluster sangat
mirip satu sama lain dan berbeda dengan objek dalam cluster-cluster yang lain.
Dalam teknik ini kita tidak tahu sebelumnya berapa jumlah cluster dan
bagaimana pengelompokannya.
Clustering adalah salah satu teknik unsupervised learning
dimana kita tidak perlu melatih metode tersebut atau tidak ada fase learning.
Unsupervised learning adalah metode-metode yang tidak membutuhkan label ataupun
keluaran dari setiap data yang kita investigasi.
K-Means
K-means merupakan salah satu metode yang paling sederhana
dan umum dikenal. K-means berusaha mempartisi data yang ada ke dalam bentuk
satu atau lebih cluster/kelompok. Metode ini
mempartisi data ke dalam
cluster/kelompok sehingga data yang memiliki karakteristik
yang sama dikelompokkan ke dalam satu cluster
yang sama dan data yang mempunyai
karakteristik yang berbeda
dikelompokkan ke dalam kelompok yang lain. Adapun kelebihan
dari metode k-means ini adalah sebagai berikut:
K-means sangat cepat dalam proses clustering.
Meminimalisasikan objective function yang diset dalam proses clustering.
Meminimalisasikan variasi di
dalam suatu cluster dan
memaksimalisasikan variasi antar cluster.
Sering digunakan pada data mining karena kesesuaian untuk
pengolahan klasifikasi data dalam ukuran besar. Sedangkan beberapa kelemahan
yang sering muncul pada saat menggunakan metode k-means adalah sebagai berikut:
1. K-means
sangat sensitif pada pembangkitan centroids awal secara random.
2. Hasil
clustering dengan k-means bersifat tidak unik (selalu berubah-ubah). Terkadang
baik, terkadang jelek.
3. K-Means
sangat sulit untuk mencapai global optimum.
Untuk melakukan clustering ini, nilai k harus ditentukan
terlebih dahulu. Secara detail kita bisa menggunakan
ukuran ketidakmiripan untuk
mengelompokkan objek. Ketidakmiripan bisa diterjemahkan
dalam konsep jarak. Jika jarak dua objek atau data titik cukup dekat, maka dua
objek itu mirip. Semakin
dekat berarti semakin tinggi
kemiripannya. Semakin tinggi nilai jarak, semakin tinggi
ketidakmiripannya. Dasar metode k-means adalah sebagai berikut:
1. Tentukan
jumlah k cluster.
2. Inisialisasi
k pusat cluster (centroid), dapat diperoleh secara acak.
3. Tempatkan
setiap data ke centroid terdekat. Kedekatan dua data ditentukan berdasar jarak
kedua data tersebut. Dalam tahap ini perlu dihitung jarak tiap data ke tiap
centroid. Jarak paling dekat antara satu data dengan satu cluster tertentu akan
menentukan suatu data masuk
dalam cluster mana. Untuk menghitung jarak digunakan metode
pengukuran jarak euclidean distance.
n
dxy = 1 (xi yi )2
−
1 i=1
4. Hitung kembali centroid dengan keanggotaan cluster yang
sekarang. centroid baru adalah mean (rata-rata) dari semua data/objek dalam
satu cluster. Kemudian hitung jumlah square Error.
ci = 1 Ix (2)
mi x Ci
ε
k
SSE =
5. Ulangi langkah 3 dan 4 hingga konvergen. Kriteria
konvergen adalah fungsi SSE berada di bawah batas error ( ξ ) atau jumlah
iterasi berada pada batas maksimal iterasi.
METODOLOGI PENELITIAN
Perancangan data mining ini
menggunakan model proses
pengembangan sistem perangkat lunak yaitu model System
Development Life Cycle (SDLC). Menurut Kendall and Kendall dalam buku Analisis
dan Perancangan Sistem Jilid 6 [2003:11], SDLC adalah pendekatan melalui
beberapa tahap untuk menganalisa dan merancang sistem dimana sistem tersebut
telah dikembangkan dengan sangat baik melalui penggunaan siklus kegiatan penganalisis
dan pemakai secara spesifik.
Gambar 2. Tujuh Tahap System
Development Life Cycle (SDLC)
PERANCANGAN SISTEM
Use Case Diagram
Pada perancangan data mining ini terdapat satu aktor yaitu
pemakai, sedangkan use case yang dibutuhkan ada tiga yaitu: use case koneksi
database, klasterisasi dan hasil klaster. Use case koneksi database bersifat
include terhadap use case klasterisasi, yang artinya sebelum klasterisasi harus
dilakukan koneksi database terlebih dahulu. Use case hasil klaster juga
bersifat include terhadap use case klasterisasi.
Tabel 1. Tabel Use Case
No Nama Proses Keterangan
1. Koneksi
database Use case ini
digunakan untuk
mengatur koneksi
aplikasi ke DBMS.
2. Klasterisasi Use case ini
digunakan untuk
melakukan proses
klasterisasi dataset.
3. Hasil
klaster Use case ini
digunakan untuk
menampilkan hasil analisa klasterisasi.
Gambar 3. Use Case Diagram
Class Diagram
Pada class diagram terdapat empat kelas yang digunakan dalam
aplikasi ini.
Kelas-kelas tersebut adalah kelas halaman utama, koneksi
database, k-means dan output klasterisasi.
Dari gambar 4 di atas terlihat bahwa kelas koneksi database
dan kelas k-means berasal dari kelas halaman utama. Satu halaman utama bisa
digunakan untuk melakukan satu koneksi database. Satu halaman utama bisa melakukan
satu k-means. Satu k-means bisa menghasilkan satu atau lebih output
klasterisasi. Satu output klasterisasi bisa dihasilkan satu atau lebih k-means.
Gambar 4. Class Diagram
Entity Relationship Diagram
Data Mining ini menggunakan 9 tabel dalam database. Sembilan
tabel tersebut dibagi menjadi dua kelompok yaitu kelompok tabel dimensi dan
tabel fakta. Kelompok tabel dimensi meliputi tabel persil, tanah, bangunan,
lantai_bangunan, jalan, listrik, njop dan kran. Dan yang termasuk dalam
kelompok tabel fakta meliputi tabel kuesioner.
HASIL DAN PEMBAHASAN
Teknologi
Untuk mengimplementasikan data mining ini, maka dibutuhkan
beberapa hardware pendukung dan software pendukung sebagai berikut:
Kebutuhan hardware
Perangkat keras (hardware) yang dibutuhkan untuk
mengimplementasikan data mining ini antara lain:
• PC
Pentium (Minimal Pentium IV).
• Sistem
Operasi Windows XP Profesional atau Windows Vista.
• Memory
dengan kapasitas minimal 512 Mega byte.
• Harddisk
minimal 40 Giga byte.
Kebutuhan software
Untuk mejalankan Data Mining Dengan Metode K-Means
Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya, maka
komputer yang digunakan harus sudah terinstal software yang digunakan yaitu
Java Development Kit 1.6, Netbeans 6.1 dan Microsoft SQL Server 2005 dengan
sistem operasi Windows XP Profesional atau Windows Vista.
Implementasi Sistem
Dalam implementasi sistem ini, yang dapat dilakukan pada
Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik
Pelanggan PDAM Kota Surabaya ini yaitu:
Bisa menghasilkan informasi penge-lompokan pelanggan PDAM
Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai
bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan menggunakan
metode k-means clustering.
Bisa menghasilkan informasi diskriminasi tarif diantara
kelompok pelanggan PDAM Kota Surabaya berdasarkan pengelompokan pelanggan yang
telah ditentukan.
Gambar 5. Entity Relationship Diagram
Kebutuhan hardware
Perangkat keras (hardware) yang dibutuhkan untuk
mengimplementasikan data mining ini antara lain:
• PC
Pentium (Minimal Pentium IV).
• Sistem
Operasi Windows XP Profesional atau Windows Vista.
• Memory
dengan kapasitas minimal 512 Mega byte.
• Harddisk
minimal 40 Giga byte.
Kebutuhan software
Untuk mejalankan Data Mining Dengan Metode K-Means
Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya, maka
komputer yang digunakan harus sudah terinstal software yang digunakan yaitu
Java Development Kit 1.6, Netbeans 6.1 dan Microsoft SQL Server 2005 dengan
sistem operasi Windows XP Profesional atau Windows Vista.
Implementasi Sistem
Dalam implementasi sistem ini, yang dapat dilakukan pada
Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik
Pelanggan PDAM Kota Surabaya ini yaitu:
Bisa menghasilkan informasi penge-lompokan pelanggan PDAM
Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai
bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan menggunakan
metode k-means clustering.
Bisa menghasilkan informasi diskriminasi tarif diantara
kelompok pelanggan PDAM Kota Surabaya berdasarkan pengelompokan pelanggan yang
telah ditentukan.
Contoh Kasus:
Tentukan informasi pengelompokan pelanggan dan diskriminasi
tarif PDAM Kota Surabaya berdasarkan dari data-data kuesioner yang telah
terkumpul. Misalkan:
• Jumlah
pengelompokan yang
diinginkan sebanyak 10 pelanggan.
• Nilai
Batas Error yang diinginkan adalah 20%.
• Nilai
iterasi maksimal sebanyak 3 iterasi.
Langkah-langkah
Sebelum melakukan proses klasterisasi, pemakai harus
melakukan koneksi database terlebih dahulu. Dari halaman utama pilih menu file
→ koneksi database.
Gambar 6. Halaman Utama
Masukkan nama server untuk koneksi pada database. Setelah
koneksi pada database berhasil, pemakai bisa menekan tombol ok.
Isi konfigurasi klasterisasi sesuai dengan kasus di atas
seperti yang ditunjukkan pada Gambar 8. Setelah menentukan konfigurasi
klasterisasi, pemakai bisa menekan tombol start klaster untuk memulai proses
klasterisasi.
Pada saat proses klasterisasi, program akan mengelompokkan
data kuesioner tersebut berdasarkan jarak terdekat dengan centroid, menghitung
lamanya waktu yang diperlukan, dan menghitung prosentase sum of the squared
error.
Gambar 7. Halaman Koneksi Database
Gambar 8 Halaman Klasterisasi
Setelah proses klasterisasi selesai, hasil dari klasterisasi
tersebut akan ditampilkan pada FrmHasil.java dan disimpan ke dalam database
dalam bentuk pengelompokan.
HASIL IMPLEMENTASI SISTEM
History Klasterisasi
Pada halaman ini akan ditampilkan history dari proses
klasterisasi mulai dari inisialisasi awal sampai akhir iterasi. Data pada tabel
menunjukkan data jarak tiap objek dengan masing-masing centroid. Data pada text
area menunjukkan jumlah data pada masing-masing cluster. Estmasi waktu
merupakan waktu yang dibutuhkan untuk menghasilkan cluster.
Pengelompokan Pelanggan
Pada halaman ini akan ditampilkan hasil klasterisasi berupa
informasi spesifikasi pengelompokan pelanggan berdasarkan parameter yang telah
ditentukan pemakai sebelumnya.
Gambar 9. Halaman History Klasterisasi
Gambar 10. Halaman Pengelompokan
Pelanggan
Tabel 2. Spesifikasi Pengelompokan Pelanggan
Cluster Spesifikasi
1 Guna
persil : tempat tinggal
Luas tanah : >= 300 m2
Luas bangunan : >= 300 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : >= Rp 500 juta
Jumlah kran : 2
2 Guna
persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 120 m2 <= Luas Bangunan < 200
m2
Jumlah lantai : 1 Lantai
Lebar jalan : 6.5 m <= Lebar Jalan < 12 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 250 juta <= NJOP < Rp 500 juta
Jumlah kran : 2
3 Guna
persil : Usaha
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 36 m2 <= Luas Bangunan < 120
m2
Jumlah lantai : 1 Lantai
Lebar jalan : 6.5 m <= Lebar Jalan < 12 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 150 juta <= NJOP < Rp 250 juta
Jumlah kran : 4
4 Guna
persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 200 m2 <= Luas Bangunan < 300
m2
Jumlah lantai : 2 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 250 juta <= NJOP < Rp 500 juta
Jumlah kran : 2
5 Guna
persil : Rumah & Usaha/ Toko
Luas tanah : 36 m2 <= Luas Tanah < 120 m22
Luas bangunan : 200 m2 <= Luas Bangunan < 300
m2
Jumlah lantai : 1 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 150 juta <= NJOP < Rp 250 juta
Jumlah kran : 6
Tabel 3. Lanjutan Spesifikasi Pengelompokan Pelanggan
Cluster Spesifikasi
6 Guna
persil : Rumah & Usaha/ Toko
Luas tanah : 120 m2 <= Luas Tanah < 200 m2
Luas bangunan : >= 300 m2
Jumlah lantai : 3 Lantai
Lebar jalan : 6.5 m <= Lebar Jalan < 12 m
Daya listrik : >= 4400 VA
Njop : >= Rp 500 juta
Jumlah kran : 3
7 Guna
persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2 Luas
bangunan : 36 m2 <= Luas Bangunan < 120 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 3 m <= Lebar Jalan < 5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 50 juta <= NJOP < Rp 150 juta Jumlah kran :
2
8 Guna
persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 120 m2 <= Luas Bangunan <
200 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 3 m <= Lebar Jalan < 5 m
Daya listrik : < 1300 VA
Njop : Rp 50 juta <= NJOP < Rp 150 juta
Jumlah kran : 5
9 Guna
persil : Tempat tinggal
Luas tanah : 120 m2 <= Luas Tanah < 200 m2
Luas bangunan : >= 300 m2
Jumlah lantai : 2 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : >= 4400 VA
Njop : >= Rp 500 juta
Jumlah kran : 6
10 Guna
persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2 Luas
bangunan : 36 m2 <= Luas Bangunan < 120 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m Daya listrik
: < 1300 VA
Njop : Rp 50 juta <= NJOP < Rp 150 juta Jumlah kran :
1
Gambar Clustering
Pada halaman ini akan ditampilkan gambar dari hasil
clustering. Gambar sebelah kiri merupakan gambar klasterisasi untuk iterasi
pertama sedangkan gambar sebelah kanan merupakan gambar akhir klasterisasi.
Gambar 11. Halaman Gambar Clustering
Diskriminasi Tarif
Pada halaman ini akan ditampilkan informasi diskriminasi
tarif air berdasarkan pengelompokan pelanggan yang telah terbentuk.
Gambar 12. Halaman Diskriminasi Tarif
Dari gambar diatas, dapat disimpulkan bahwa hasil pengujian
diskriminasi tarif air pelanggan PDAM Kota Surabaya sebagai berikut:
Tabel 4. Diskriminasi Tarif
Cluster Kode Tarif Pemakaian Tarif
0-10 4000
1 4C 11-20 6000
21-30 7500
0-10 4000
2 4C 11-20 6000
21-30 7500
0-10 1500
3 3B 11-20 3500
21-30 6000
4 1 Non Progressif 600
0-10 6000
5 4D 11-20 8000
21-30 9500
0-10 4000
6 4C 11-20 6000
21-30 7500
Tabel 5. Lanjutan Diskriminasi Tarif
Cluster
Kode Tarif Pemakaian Tarif
0-10 4000
7 4C 11-20 6000
21-30 7500
8 1 Non Progressif 600
0-10 4000
9 4C 11-20 6000
21-30 7500
0-10 1000
10 4A 11-20 1500
21-30 2500
DAFTAR PUSTAKA
KESIMPULAN
Setelah Data Mining Dengan Metode Kmeans Clustering Untuk
Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini selesai dibuat,
dapat diambil kesimpulan sebagai berikut:
1. Kelebihan
Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik
Pelanggan PDAM Kota Surabaya adalah:
2. Data
mining ini sangat bermanfaat untuk mempermudah pengelompokan pelanggan PDAM
Kota Surabaya berdasarkan parameter yang telah ditentukan sebelumnya.
3. Mempermudah
dalam penentuan diskriminasi tarif air berdasarkan dari pengelompokan pelanggan
yang sudah terbentuk.
4. Kelemahan
Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik
Pelanggan PDAM Kota Surabaya adalah:
5. Penentuan
parameter atau dataset pada data mining ini masih dilakukan pada satu tabel
fakta. Sehingga pembacaan dataset dilakukan mulai dari awal kolom hingga akhir
kolom.
6. Estimasi
waktu proses klasterisasi tergantung dari jumlah record dan
Tidak ada komentar:
Posting Komentar