Sabtu, 19 Juli 2014



DATA MINING : METODE HARD CLUSTERING
STUDI KASUS ANALISA PELANGGAN PERUSAHAAN DAERAH AIR MINUM KOTAMADYA SURABAYA
Taufik
Departemen Matematika, Fak. Sains dan Teknologi Universitas Airlangga E-mail : taufik2003@gmail.com
Abstrak
Dunia bisnis yang penuh persaingan membuat para pelakunya harus selalu memikirkan strategi-strategi terobosan yang dapat menjamin kelangsungan bisnis mereka. Salah satu aset utama yang dimiliki oleh perusahaan masa kini adalah data bisnis dalam jumlah yang luar biasa banyak. Ini melahirkan kebutuhan akan adanya teknologi yang dapat memanfaatkannya untuk membangkitkan “pengetahuan-pengetahuan” baru, yang dapat membantu dalam pengaturan strategi bisnis. Teknologi data mining hadir sebagai solusi. Penelitian ini memberikan alternatif pengelompokan data pdam kota Surabaya dengan menerapkan metode Algoritma Clustering, K-Means. Dengan adanya fakta-fakta tersebut maka penelitian ini akan menerapkan rekategori pengelompokkan pelanggan, untuk kelompok pelanggan rumah tangga selain berdasar lebar jalan/kelas jalan juga berdasarkan nilai NJOP, daya listrik dan luas bangunan. Dengan klasifikasi kelompok pelanggan yang baru ini, diharapkan dari sisi keadilan dapat tercapai tepat sasaran. Pengujian yang telah dijalankan menunjukkan bahwa pencapaian algoritma K-mean adalah baik. Dengan Adanya aplikasi ini dapat menyediakan informasi untuk membantu menganalisa karakteristik pelanggan Perusahaan Daerah Air Minum (PDAM) Kota Surabaya.
Kata kunci : Data mining, Cluster, K-Means, karakteristik pelanggan
Abstract
The business world is full of competition makes the perpetrators should always think about breakthrough strategies that can ensure the continuity of their business. One of main assets owned by the company today is a business data in many outstanding quantities. This led to the need for technology that can use it to generate new knowledges, which can help in setting business strategy.Present data mining technology as a solution. This study provides an alternative grouping of data PDAM Surabaya by applying clustering algorithm, K-Means. Given these facts, this study will apply the re -grouping categories of customer, for the customer's household in addition based on road width / road grade is also based on the value of NJOP, electrical power and building area. With the classification of a new group of customers, are expected from the side of justice can be achieved on target. Tests that have been carried out showing that the achievement of K-means algorithm is good. With the existence of this application can provide information to help analyze customer characteristics Regional Water Company (PDAM) Surabaya.
Key words: Data mining, Cluster, K-Means, customer characteristics


PENDAHULUAN
Data perkembangan harga air riil (tahun 1983) selama periode 1991 hingga 1999 bergerak tidak continue (rata-rata tumbuh 1.6 persen per tahun) dan mencapai titik terendah pada tahun 1999. Fenomena krisis ekonomi mengakibatkan hampir keseluruhan, 29 dari 37 PDAM tidak menaikkan harga dan menghadapi persoalan keuangan. Dalam posisi ini PDAM Kota Surabaya umumnya tidak punya pilihan untuk berinvestasi dan mengembangkan kegiatannya.
Langkah operasional untuk mening-katkan pendapatan adalah dengan mendiskriminasi tarif air terutama di dalam kelompok pelanggan. Diskriminasi tarif air dilakukan berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP (Nilai Jual Objek Pajak) dan jumlah kran. Diskriminasi tarif ini dimaksudkan untuk memperbaiki krisis ekonomi yang sedang dialami PDAM Kota Surabaya.
Kondisi ini melahirkan kebutuhan akan adanya teknologi yang dapat memanfaatkan data pelanggan yang luar biasa banyak untuk membangkitkan informasi-informasi baru yang berguna seperti informasi diskriminasi tarif air pada pelanggan PDAM Kota Surabaya. Teknologi data mining dan metode k-means clustering merupakan solusi yang tepat.
Metode k-means               clustering
merupakan solusi yang tepat bagi permasalahan diatas, karena metode k-means clustering memiliki akurasi estimasi jumlah kelompok yang lebih baik dibandingkan metode yang lainnya.
Mengacu kepada latar belakang masalah diatas maka rumusan masalah dapat dijabarkan sebagai berikut :
Bagaimana          pengelompokan
pelanggan berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP

dan jumlah kran. Bagaimana mendapatkan pola dan pengetahuan dari data-data yang banyak seperti data kuesioner pelanggan pada Perusahaan Daerah Air Minum Kota Surabaya.
Perencanaan diskriminasi tarif air diantara kelompok pelanggan Perusahaan Daerah Air Minum Kota Surabaya.
Adapun tujuan dari perancangan dan pembuatan data mining ini adalah sebagai berikut :
Untuk mengetahui pengelompokan pelanggan Perusahaan Daerah Air Minum Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan
menggunakan    metode k-means
clustering.
Untuk mengetahui informasi diskriminasi tarif diantara kelompok pelanggan Perusahaan Daerah Air Minum Kota Surabaya berdasarkan pengelompokan pelanggan yang telah ditentukan.
Sedangkan manfaat dari perancangan Data Mining Dengan Metode K-Means
Clustering            Untuk    Menganalisa
Karakteristik Pelanggan PDAM Kota Surabaya ini adalah:
Membantu          organisasi-organisasi
khususnya Perusahaan Daerah Air Minum Kota Surabaya untuk mengetahui karakteristik dari pelanggan sehingga
dapat     menghasilkan     informasi
diskriminasi tarif air yang berguna. Membantu Perusahaan Daerah Air
Minum  dalam    melakukan
pengelompokan (clustering) pelanggan dari data-data kuesioner yang telah terkumpul.
Mempermudah kinerja manajer dalam menentukan diskriminasi tarif air Perusahaan Daerah Air Minum Kota Surabaya.
MATERI DAN METODE Data Mining


Data mining adalah suatu teknik yang terotomasi dan mudah digunakan untuk mendapatkan pola dan pengetahuan dari data-data yang banyak seperti dari database yang besar, gudang data suatu
perusahaan,        atau       tempat-tempat
penyimpanan data yang lainnya. Tanpa data mining, kita hanya akan mempunyai sekumpulan/segudang data yang sangat banyak namun tidak tahu data tersebut harus diapakan. Kita tidak tahu bagaimana cara menganalisis data tersebut, baik karena banyaknya data tersebut maupun karena kompleksnya data tersebut. Bila tidak diolah, akan tercipta suatu kondisi yang disebut “Data rich but information poor” dan orang-orang biasa menyebut databasenya sebagai “kuburan data”. Data mining bisa mengubah semua itu menjadi
pengetahuan-pengetahuan           yang
ditambang dari data yang ada.
Data mining berkaitan dengan ilmu probabilitas dan statistik, sedangkan machine learning menjadi alat analisis dalam data mining. Bidang-bidang ini berkaitan antara yang satu dengan yang lain, seperti pada gambar di bawah ini.
g             p
Perbedaan dari gambar di atas sebagai berikut:
Statistik : lebih berdasarkan teori, lebih fokus pada pengujian hipotesis.
Machine Learning : lebih bersifat heuristik, fokus pada perbaikan performansi dari suatu teknik learning.
Data Mining : gabungan teori dan heuristik, fokus pada seluruh proses penemuan knowledge/pola termasuk data cleaning, learning, dan visualisasi dari hasilnya.
Clustering

Salah satu metode dalam data mining yang sering dipakai adalah clustering. Clustering mengidentifikasi orang-orang yang memiliki kesamaan karakteristik tertentu berdasarkan kategori atau cluster, dan kemudian menggunakan karakteristik tersebut sebagai vektor karakteristik atau centroid. Kategori-kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpu (overlapping). Pengelompokan ini digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik umum dari pelanggan (customer) yang berbeda.
Tujuan utama dari metode clustering adalah pengelompokan sejumlah data/objek ke dalam cluster (grup) sehingga dalam setiap cluster akan berisi data yang semirip mungkin. Dalam clustering kita berusaha untuk menempatkan objek yang mirip (jaraknya dekat) dalam satu cluster dan membuat jarak antar cluster sejauh mungkin. Ini berarti objek dalam satu cluster sangat mirip satu sama lain dan berbeda dengan objek dalam cluster-cluster yang lain. Dalam teknik ini kita tidak tahu sebelumnya berapa jumlah cluster dan
bagaimana          pengelompokannya.
Clustering adalah salah satu teknik unsupervised learning dimana kita tidak perlu melatih metode tersebut atau tidak ada fase learning. Unsupervised learning adalah metode-metode yang tidak membutuhkan label ataupun keluaran dari setiap data yang kita investigasi.
K-Means
K-means merupakan salah satu metode yang paling sederhana dan umum dikenal. K-means berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode ini
mempartisi          data       ke           dalam
cluster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster


yang sama dan data yang mempunyai
karakteristik        yang      berbeda
dikelompokkan ke dalam kelompok yang lain. Adapun kelebihan dari metode k-means ini adalah sebagai berikut:
K-means sangat cepat dalam proses clustering. Meminimalisasikan objective function yang diset dalam proses clustering. Meminimalisasikan variasi di
dalam    suatu     cluster   dan
memaksimalisasikan variasi antar cluster.
Sering digunakan pada data mining karena kesesuaian untuk pengolahan klasifikasi data dalam ukuran besar. Sedangkan beberapa kelemahan yang sering muncul pada saat menggunakan metode k-means adalah sebagai berikut:
1.            K-means sangat sensitif pada pembangkitan centroids awal secara random.
2.            Hasil clustering dengan k-means bersifat tidak unik (selalu berubah-ubah). Terkadang baik, terkadang jelek.
3.            K-Means sangat sulit untuk mencapai global optimum.
Untuk melakukan clustering ini, nilai k harus ditentukan terlebih dahulu. Secara detail kita bisa menggunakan
ukuran   ketidakmiripan   untuk
mengelompokkan objek. Ketidakmiripan bisa diterjemahkan dalam konsep jarak. Jika jarak dua objek atau data titik cukup dekat, maka dua objek itu mirip. Semakin
dekat     berarti   semakin               tinggi
kemiripannya. Semakin tinggi nilai jarak, semakin tinggi ketidakmiripannya. Dasar metode k-means adalah sebagai berikut:
1.            Tentukan jumlah k cluster.
2.            Inisialisasi k pusat cluster (centroid), dapat diperoleh secara acak.
3.            Tempatkan setiap data ke centroid terdekat. Kedekatan dua data ditentukan berdasar jarak kedua data tersebut. Dalam tahap ini perlu dihitung jarak tiap data ke tiap centroid. Jarak paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk

dalam cluster mana. Untuk menghitung jarak digunakan metode pengukuran jarak euclidean distance.
n
dxy = 1  (xi yi )2
1 i=1
4. Hitung kembali centroid dengan keanggotaan cluster yang sekarang. centroid baru adalah mean (rata-rata) dari semua data/objek dalam satu cluster. Kemudian hitung jumlah square Error.
ci =  1 Ix               (2)
mi x Ci
ε
k
SSE =
5. Ulangi langkah 3 dan 4 hingga konvergen. Kriteria konvergen adalah fungsi SSE berada di bawah batas error ( ξ ) atau jumlah iterasi berada pada batas maksimal iterasi.
METODOLOGI PENELITIAN
Perancangan data mining ini
menggunakan    model    proses
pengembangan sistem perangkat lunak yaitu model System Development Life Cycle (SDLC). Menurut Kendall and Kendall dalam buku Analisis dan Perancangan Sistem Jilid 6 [2003:11], SDLC adalah pendekatan melalui beberapa tahap untuk menganalisa dan merancang sistem dimana sistem tersebut telah dikembangkan dengan sangat baik melalui penggunaan siklus kegiatan penganalisis dan pemakai secara spesifik.


Gambar 2. Tujuh Tahap System
Development Life Cycle (SDLC)
PERANCANGAN SISTEM
Use Case Diagram
Pada perancangan data mining ini terdapat satu aktor yaitu pemakai, sedangkan use case yang dibutuhkan ada tiga yaitu: use case koneksi database, klasterisasi dan hasil klaster. Use case koneksi database bersifat include terhadap use case klasterisasi, yang artinya sebelum klasterisasi harus dilakukan koneksi database terlebih dahulu. Use case hasil klaster juga bersifat include terhadap use case klasterisasi.
Tabel 1. Tabel Use Case
No          Nama Proses      Keterangan
1.                           Koneksi database             Use        case       ini
digunakan           untuk
mengatur            koneksi
aplikasi ke DBMS.
2.                           Klasterisasi          Use        case       ini
digunakan           untuk
melakukan          proses
klasterisasi dataset.
3.                           Hasil klaster        Use        case       ini
digunakan           untuk
menampilkan hasil analisa klasterisasi.

Gambar 3. Use Case Diagram
Class Diagram
Pada class diagram terdapat empat kelas yang digunakan dalam aplikasi ini.

Kelas-kelas tersebut adalah kelas halaman utama, koneksi database, k-means dan output klasterisasi.
Dari gambar 4 di atas terlihat bahwa kelas koneksi database dan kelas k-means berasal dari kelas halaman utama. Satu halaman utama bisa digunakan untuk melakukan satu koneksi database. Satu halaman utama bisa melakukan satu k-means. Satu k-means bisa menghasilkan satu atau lebih output klasterisasi. Satu output klasterisasi bisa dihasilkan satu atau lebih k-means.

Gambar 4. Class Diagram
Entity Relationship Diagram
Data Mining ini menggunakan 9 tabel dalam database. Sembilan tabel tersebut dibagi menjadi dua kelompok yaitu kelompok tabel dimensi dan tabel fakta. Kelompok tabel dimensi meliputi tabel persil, tanah, bangunan, lantai_bangunan, jalan, listrik, njop dan kran. Dan yang termasuk dalam kelompok tabel fakta meliputi tabel kuesioner.
HASIL DAN PEMBAHASAN
Teknologi
Untuk mengimplementasikan data mining ini, maka dibutuhkan beberapa hardware pendukung dan software pendukung sebagai berikut:
Kebutuhan hardware
Perangkat keras (hardware) yang dibutuhkan untuk mengimplementasikan data mining ini antara lain:
             PC Pentium (Minimal Pentium IV).


             Sistem Operasi Windows XP Profesional atau Windows Vista.
             Memory dengan kapasitas minimal 512 Mega byte.
             Harddisk minimal 40 Giga byte.
Kebutuhan software
Untuk mejalankan Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya, maka komputer yang digunakan harus sudah terinstal software yang digunakan yaitu Java Development Kit 1.6, Netbeans 6.1 dan Microsoft SQL Server 2005 dengan sistem operasi Windows XP Profesional atau Windows Vista.
Implementasi Sistem

Dalam implementasi sistem ini, yang dapat dilakukan pada Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini yaitu:
Bisa menghasilkan informasi penge-lompokan pelanggan PDAM Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan menggunakan metode k-means clustering.
Bisa menghasilkan informasi diskriminasi tarif diantara kelompok pelanggan PDAM Kota Surabaya berdasarkan pengelompokan pelanggan yang telah ditentukan.


Gambar 5. Entity Relationship Diagram


Kebutuhan hardware
Perangkat keras (hardware) yang dibutuhkan untuk mengimplementasikan data mining ini antara lain:
             PC Pentium (Minimal Pentium IV).
             Sistem Operasi Windows XP Profesional atau Windows Vista.
             Memory dengan kapasitas minimal 512 Mega byte.
             Harddisk minimal 40 Giga byte.
Kebutuhan software
Untuk mejalankan Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya, maka komputer yang digunakan harus sudah terinstal software yang digunakan yaitu Java Development Kit 1.6, Netbeans 6.1 dan Microsoft SQL Server 2005 dengan sistem operasi Windows XP Profesional atau Windows Vista.
Implementasi Sistem
Dalam implementasi sistem ini, yang dapat dilakukan pada Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini yaitu:
Bisa menghasilkan informasi penge-lompokan pelanggan PDAM Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan menggunakan metode k-means clustering.
Bisa menghasilkan informasi diskriminasi tarif diantara kelompok pelanggan PDAM Kota Surabaya berdasarkan pengelompokan pelanggan yang telah ditentukan.
Contoh Kasus:
Tentukan informasi pengelompokan pelanggan dan diskriminasi tarif PDAM Kota Surabaya berdasarkan dari data-data kuesioner yang telah terkumpul. Misalkan:
             Jumlah pengelompokan yang
diinginkan sebanyak 10 pelanggan.
             Nilai Batas Error yang diinginkan adalah 20%.
             Nilai iterasi maksimal sebanyak 3 iterasi.

Langkah-langkah
Sebelum melakukan proses klasterisasi, pemakai harus melakukan koneksi database terlebih dahulu. Dari halaman utama pilih menu file → koneksi database.

Gambar 6. Halaman Utama
Masukkan nama server untuk koneksi pada database. Setelah koneksi pada database berhasil, pemakai bisa menekan tombol ok.
Isi konfigurasi klasterisasi sesuai dengan kasus di atas seperti yang ditunjukkan pada Gambar 8. Setelah menentukan konfigurasi klasterisasi, pemakai bisa menekan tombol start klaster untuk memulai proses klasterisasi.
Pada saat proses klasterisasi, program akan mengelompokkan data kuesioner tersebut berdasarkan jarak terdekat dengan centroid, menghitung lamanya waktu yang diperlukan, dan menghitung prosentase sum of the squared error.

Gambar 7. Halaman Koneksi Database



Gambar 8 Halaman Klasterisasi
Setelah proses klasterisasi selesai, hasil dari klasterisasi tersebut akan ditampilkan pada FrmHasil.java dan disimpan ke dalam database dalam bentuk pengelompokan.
HASIL IMPLEMENTASI SISTEM
History Klasterisasi
Pada halaman ini akan ditampilkan history dari proses klasterisasi mulai dari inisialisasi awal sampai akhir iterasi. Data pada tabel menunjukkan data jarak tiap objek dengan masing-masing centroid. Data pada text area menunjukkan jumlah data pada masing-masing cluster. Estmasi waktu merupakan waktu yang dibutuhkan untuk menghasilkan cluster.
Pengelompokan Pelanggan
Pada halaman ini akan ditampilkan hasil klasterisasi berupa informasi spesifikasi pengelompokan pelanggan berdasarkan parameter yang telah ditentukan pemakai sebelumnya.

Gambar 9. Halaman History Klasterisasi


Gambar 10. Halaman Pengelompokan
Pelanggan
Tabel 2. Spesifikasi Pengelompokan Pelanggan
Cluster  Spesifikasi
1             Guna persil : tempat tinggal
Luas tanah : >= 300 m2
Luas bangunan : >= 300 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : >= Rp 500 juta
Jumlah kran : 2
2             Guna persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 120 m2 <= Luas Bangunan < 200
m2
Jumlah lantai : 1 Lantai
Lebar jalan : 6.5 m <= Lebar Jalan < 12 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 250 juta <= NJOP < Rp 500 juta
Jumlah kran : 2
3             Guna persil : Usaha
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 36 m2 <= Luas Bangunan < 120
m2
Jumlah lantai : 1 Lantai
Lebar jalan : 6.5 m <= Lebar Jalan < 12 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 150 juta <= NJOP < Rp 250 juta
Jumlah kran : 4
4             Guna persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 200 m2 <= Luas Bangunan < 300
m2
Jumlah lantai : 2 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 250 juta <= NJOP < Rp 500 juta
Jumlah kran : 2
5             Guna persil : Rumah & Usaha/ Toko
Luas tanah : 36 m2 <= Luas Tanah < 120 m22
Luas bangunan : 200 m2 <= Luas Bangunan < 300
m2
Jumlah lantai : 1 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 150 juta <= NJOP < Rp 250 juta
Jumlah kran : 6


Tabel 3. Lanjutan Spesifikasi Pengelompokan Pelanggan
Cluster  Spesifikasi
6             Guna persil : Rumah & Usaha/ Toko
Luas tanah : 120 m2 <= Luas Tanah < 200 m2
Luas bangunan : >= 300 m2
Jumlah lantai : 3 Lantai
Lebar jalan : 6.5 m <= Lebar Jalan < 12 m
Daya listrik : >= 4400 VA
Njop : >= Rp 500 juta
Jumlah kran : 3
7             Guna persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2 Luas bangunan : 36 m2 <= Luas Bangunan < 120 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 3 m <= Lebar Jalan < 5 m
Daya listrik : 2200 VA <= Daya Listrik < 4400 VA
Njop : Rp 50 juta <= NJOP < Rp 150 juta Jumlah kran : 2
8             Guna persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2
Luas bangunan : 120 m2 <= Luas Bangunan <
200 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 3 m <= Lebar Jalan < 5 m
Daya listrik : < 1300 VA
Njop : Rp 50 juta <= NJOP < Rp 150 juta
Jumlah kran : 5
9             Guna persil : Tempat tinggal
Luas tanah : 120 m2 <= Luas Tanah < 200 m2
Luas bangunan : >= 300 m2
Jumlah lantai : 2 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m
Daya listrik : >= 4400 VA
Njop : >= Rp 500 juta
Jumlah kran : 6
10           Guna persil : tempat tinggal
Luas tanah : 36 m2 <= Luas Tanah < 120 m2 Luas bangunan : 36 m2 <= Luas Bangunan < 120 m2
Jumlah lantai : 1 Lantai
Lebar jalan : 5 m <= Lebar Jalan < 6.5 m Daya listrik : < 1300 VA
Njop : Rp 50 juta <= NJOP < Rp 150 juta Jumlah kran : 1
Gambar Clustering
Pada halaman ini akan ditampilkan gambar dari hasil clustering. Gambar sebelah kiri merupakan gambar klasterisasi untuk iterasi pertama sedangkan gambar sebelah kanan merupakan gambar akhir klasterisasi.


Gambar 11. Halaman Gambar Clustering
Diskriminasi Tarif
Pada halaman ini akan ditampilkan informasi diskriminasi tarif air berdasarkan pengelompokan pelanggan yang telah terbentuk.

Gambar 12. Halaman Diskriminasi Tarif
Dari gambar diatas, dapat disimpulkan bahwa hasil pengujian diskriminasi tarif air pelanggan PDAM Kota Surabaya sebagai berikut:
Tabel 4. Diskriminasi Tarif
Cluster  Kode Tarif           Pemakaian          Tarif
                              0-10       4000
1             4C          11-20     6000
                              21-30     7500
                              0-10       4000
2             4C          11-20     6000
                              21-30     7500
                              0-10       1500
3             3B          11-20     3500
                              21-30     6000
4             1             Non Progressif   600
                              0-10       6000
5             4D          11-20     8000
                              21-30     9500
                              0-10       4000
6             4C          11-20     6000
                              21-30     7500
Tabel 5. Lanjutan Diskriminasi Tarif


Cluster
Kode Tarif           Pemakaian          Tarif
                              0-10       4000
7             4C          11-20     6000
                              21-30     7500
8             1             Non Progressif   600
                              0-10       4000
9             4C          11-20     6000
                              21-30     7500
                              0-10       1000
10           4A          11-20     1500
                              21-30     2500

DAFTAR PUSTAKA
KESIMPULAN
Setelah Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini selesai dibuat, dapat diambil kesimpulan sebagai berikut:
1.            Kelebihan Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya adalah:
2.            Data mining ini sangat bermanfaat untuk mempermudah pengelompokan pelanggan PDAM Kota Surabaya berdasarkan parameter yang telah ditentukan sebelumnya.
3.            Mempermudah dalam penentuan diskriminasi tarif air berdasarkan dari pengelompokan pelanggan yang sudah terbentuk.
4.            Kelemahan Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya adalah:
5.            Penentuan parameter atau dataset pada data mining ini masih dilakukan pada satu tabel fakta. Sehingga pembacaan dataset dilakukan mulai dari awal kolom hingga akhir kolom.
6.            Estimasi waktu proses klasterisasi tergantung dari jumlah record dan


Tidak ada komentar:

Posting Komentar