Membantu Mengerjakan Tesis dan Disertasi S3 - hubungi Meruya Statistik 0812 1944 9060

DATA MINING : METODE HARD CLUSTERING

STUDI KASUS ANALISA PELANGGAN PERUSAHAAN DAERAH AIR MINUM KOTAMADYA SURABAYA

Taufik

Departemen Matematika, Fak. Sains dan Teknologi Universitas Airlangga E-mail : taufik2003@gmail.com

Abstrak

Dunia bisnis yang penuh persaingan membuat para pelakunya harus selalu memikirkan strategi-strategi terobosan yang dapat menjamin kelangsungan bisnis mereka. Salah satu aset utama yang dimiliki oleh perusahaan masa kini adalah data bisnis dalam jumlah yang luar biasa banyak. Ini melahirkan kebutuhan akan adanya teknologi yang dapat memanfaatkannya untuk membangkitkan “pengetahuan-pengetahuan” baru, yang dapat membantu dalam pengaturan strategi bisnis. Teknologi data mining hadir sebagai solusi. Penelitian ini memberikan alternatif pengelompokan data pdam kota Surabaya dengan menerapkan metode Algoritma Clustering, K-Means. Dengan adanya fakta-fakta tersebut maka penelitian ini akan menerapkan rekategori pengelompokkan pelanggan, untuk kelompok pelanggan rumah tangga selain berdasar lebar jalan/kelas jalan juga berdasarkan nilai NJOP, daya listrik dan luas bangunan. Dengan klasifikasi kelompok pelanggan yang baru ini, diharapkan dari sisi keadilan dapat tercapai tepat sasaran. Pengujian yang telah dijalankan menunjukkan bahwa pencapaian algoritma K-mean adalah baik. Dengan Adanya aplikasi ini dapat menyediakan informasi untuk membantu menganalisa karakteristik pelanggan Perusahaan Daerah Air Minum (PDAM) Kota Surabaya.

Kata kunci : Data mining, Cluster, K-Means, karakteristik pelanggan

Abstract

The business world is full of competition makes the perpetrators should always think about breakthrough strategies that can ensure the continuity of their business. One of main assets owned by the company today is a business data in many outstanding quantities. This led to the need for technology that can use it to generate new knowledges, which can help in setting business strategy.Present data mining technology as a solution. This study provides an alternative grouping of data PDAM Surabaya by applying clustering algorithm, K-Means. Given these facts, this study will apply the re -grouping categories of customer, for the customer's household in addition based on road width / road grade is also based on the value of NJOP, electrical power and building area. With the classification of a new group of customers, are expected from the side of justice can be achieved on target. Tests that have been carried out showing that the achievement of K-means algorithm is good. With the existence of this application can provide information to help analyze customer characteristics Regional Water Company (PDAM) Surabaya.

Key words: Data mining, Cluster, K-Means, customer characteristics

PENDAHULUAN

Data perkembangan harga air riil (tahun 1983) selama periode 1991 hingga 1999 bergerak tidak continue (rata-rata tumbuh 1.6 persen per tahun) dan mencapai titik terendah pada tahun 1999. Fenomena krisis ekonomi mengakibatkan hampir keseluruhan, 29 dari 37 PDAM tidak menaikkan harga dan menghadapi persoalan keuangan. Dalam posisi ini PDAM Kota Surabaya umumnya tidak punya pilihan untuk berinvestasi dan mengembangkan kegiatannya.

Langkah operasional untuk mening-katkan pendapatan adalah dengan mendiskriminasi tarif air terutama di dalam kelompok pelanggan. Diskriminasi tarif air dilakukan berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP (Nilai Jual Objek Pajak) dan jumlah kran. Diskriminasi tarif ini dimaksudkan untuk memperbaiki krisis ekonomi yang sedang dialami PDAM Kota Surabaya.

Kondisi ini melahirkan kebutuhan akan adanya teknologi yang dapat memanfaatkan data pelanggan yang luar biasa banyak untuk membangkitkan informasi-informasi baru yang berguna seperti informasi diskriminasi tarif air pada pelanggan PDAM Kota Surabaya. Teknologi data mining dan metode k-means clustering merupakan solusi yang tepat.

Metode k-means clustering

merupakan solusi yang tepat bagi permasalahan diatas, karena metode k-means clustering memiliki akurasi estimasi jumlah kelompok yang lebih baik dibandingkan metode yang lainnya.

Mengacu kepada latar belakang masalah diatas maka rumusan masalah dapat dijabarkan sebagai berikut :

Bagaimana pengelompokan

pelanggan berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP

dan jumlah kran. Bagaimana mendapatkan pola dan pengetahuan dari data-data yang banyak seperti data kuesioner pelanggan pada Perusahaan Daerah Air Minum Kota Surabaya.

Perencanaan diskriminasi tarif air diantara kelompok pelanggan Perusahaan Daerah Air Minum Kota Surabaya.

Adapun tujuan dari perancangan dan pembuatan data mining ini adalah sebagai berikut :

Untuk mengetahui pengelompokan pelanggan Perusahaan Daerah Air Minum Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan

menggunakan metode k-means

clustering.

Untuk mengetahui informasi diskriminasi tarif diantara kelompok pelanggan Perusahaan Daerah Air Minum Kota Surabaya berdasarkan pengelompokan pelanggan yang telah ditentukan.

Sedangkan manfaat dari perancangan Data Mining Dengan Metode K-Means

Clustering Untuk Menganalisa

Karakteristik Pelanggan PDAM Kota Surabaya ini adalah:

Membantu organisasi-organisasi

khususnya Perusahaan Daerah Air Minum Kota Surabaya untuk mengetahui karakteristik dari pelanggan sehingga

dapat menghasilkan informasi

diskriminasi tarif air yang berguna. Membantu Perusahaan Daerah Air

Minum dalam melakukan

pengelompokan (clustering) pelanggan dari data-data kuesioner yang telah terkumpul.

Mempermudah kinerja manajer dalam menentukan diskriminasi tarif air Perusahaan Daerah Air Minum Kota Surabaya.

MATERI DAN METODE Data Mining

Data mining adalah suatu teknik yang terotomasi dan mudah digunakan untuk mendapatkan pola dan pengetahuan dari data-data yang banyak seperti dari database yang besar, gudang data suatu

perusahaan, atau tempat-tempat

penyimpanan data yang lainnya. Tanpa data mining, kita hanya akan mempunyai sekumpulan/segudang data yang sangat banyak namun tidak tahu data tersebut harus diapakan. Kita tidak tahu bagaimana cara menganalisis data tersebut, baik karena banyaknya data tersebut maupun karena kompleksnya data tersebut. Bila tidak diolah, akan tercipta suatu kondisi yang disebut “Data rich but information poor” dan orang-orang biasa menyebut databasenya sebagai “kuburan data”. Data mining bisa mengubah semua itu menjadi

pengetahuan-pengetahuan yang

ditambang dari data yang ada.

Data mining berkaitan dengan ilmu probabilitas dan statistik, sedangkan machine learning menjadi alat analisis dalam data mining. Bidang-bidang ini berkaitan antara yang satu dengan yang lain, seperti pada gambar di bawah ini.

g p

Perbedaan dari gambar di atas sebagai berikut:

Statistik : lebih berdasarkan teori, lebih fokus pada pengujian hipotesis.

Machine Learning : lebih bersifat heuristik, fokus pada perbaikan performansi dari suatu teknik learning.

Data Mining : gabungan teori dan heuristik, fokus pada seluruh proses penemuan knowledge/pola termasuk data cleaning, learning, dan visualisasi dari hasilnya.

Clustering

Salah satu metode dalam data mining yang sering dipakai adalah clustering. Clustering mengidentifikasi orang-orang yang memiliki kesamaan karakteristik tertentu berdasarkan kategori atau cluster, dan kemudian menggunakan karakteristik tersebut sebagai vektor karakteristik atau centroid. Kategori-kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpu (overlapping). Pengelompokan ini digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik umum dari pelanggan (customer) yang berbeda.

Tujuan utama dari metode clustering adalah pengelompokan sejumlah data/objek ke dalam cluster (grup) sehingga dalam setiap cluster akan berisi data yang semirip mungkin. Dalam clustering kita berusaha untuk menempatkan objek yang mirip (jaraknya dekat) dalam satu cluster dan membuat jarak antar cluster sejauh mungkin. Ini berarti objek dalam satu cluster sangat mirip satu sama lain dan berbeda dengan objek dalam cluster-cluster yang lain. Dalam teknik ini kita tidak tahu sebelumnya berapa jumlah cluster dan

bagaimana pengelompokannya.

Clustering adalah salah satu teknik unsupervised learning dimana kita tidak perlu melatih metode tersebut atau tidak ada fase learning. Unsupervised learning adalah metode-metode yang tidak membutuhkan label ataupun keluaran dari setiap data yang kita investigasi.

K-Means

K-means merupakan salah satu metode yang paling sederhana dan umum dikenal. K-means berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode ini

mempartisi data ke dalam

cluster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster

yang sama dan data yang mempunyai

karakteristik yang berbeda

dikelompokkan ke dalam kelompok yang lain. Adapun kelebihan dari metode k-means ini adalah sebagai berikut:

K-means sangat cepat dalam proses clustering. Meminimalisasikan objective function yang diset dalam proses clustering. Meminimalisasikan variasi di

dalam suatu cluster dan

memaksimalisasikan variasi antar cluster.

Sering digunakan pada data mining karena kesesuaian untuk pengolahan klasifikasi data dalam ukuran besar. Sedangkan beberapa kelemahan yang sering muncul pada saat menggunakan metode k-means adalah sebagai berikut:

1. K-means sangat sensitif pada pembangkitan centroids awal secara random.

2. Hasil clustering dengan k-means bersifat tidak unik (selalu berubah-ubah). Terkadang baik, terkadang jelek.

3. K-Means sangat sulit untuk mencapai global optimum.

Untuk melakukan clustering ini, nilai k harus ditentukan terlebih dahulu. Secara detail kita bisa menggunakan

ukuran ketidakmiripan untuk

mengelompokkan objek. Ketidakmiripan bisa diterjemahkan dalam konsep jarak. Jika jarak dua objek atau data titik cukup dekat, maka dua objek itu mirip. Semakin

dekat berarti semakin tinggi

kemiripannya. Semakin tinggi nilai jarak, semakin tinggi ketidakmiripannya. Dasar metode k-means adalah sebagai berikut:

1. Tentukan jumlah k cluster.

2. Inisialisasi k pusat cluster (centroid), dapat diperoleh secara acak.

3. Tempatkan setiap data ke centroid terdekat. Kedekatan dua data ditentukan berdasar jarak kedua data tersebut. Dalam tahap ini perlu dihitung jarak tiap data ke tiap centroid. Jarak paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk

dalam cluster mana. Untuk menghitung jarak digunakan metode pengukuran jarak euclidean distance.

dxy = 1 (xi yi )2

−

1 i=1

4. Hitung kembali centroid dengan keanggotaan cluster yang sekarang. centroid baru adalah mean (rata-rata) dari semua data/objek dalam satu cluster. Kemudian hitung jumlah square Error.

ci = 1 Ix (2)

mi x Ci

SSE =

5. Ulangi langkah 3 dan 4 hingga konvergen. Kriteria konvergen adalah fungsi SSE berada di bawah batas error ( ξ ) atau jumlah iterasi berada pada batas maksimal iterasi.

METODOLOGI PENELITIAN

Perancangan data mining ini

menggunakan model proses

pengembangan sistem perangkat lunak yaitu model System Development Life Cycle (SDLC). Menurut Kendall and Kendall dalam buku Analisis dan Perancangan Sistem Jilid 6 [2003:11], SDLC adalah pendekatan melalui beberapa tahap untuk menganalisa dan merancang sistem dimana sistem tersebut telah dikembangkan dengan sangat baik melalui penggunaan siklus kegiatan penganalisis dan pemakai secara spesifik.

Gambar 2. Tujuh Tahap System

Development Life Cycle (SDLC)

PERANCANGAN SISTEM

Use Case Diagram

Pada perancangan data mining ini terdapat satu aktor yaitu pemakai, sedangkan use case yang dibutuhkan ada tiga yaitu: use case koneksi database, klasterisasi dan hasil klaster. Use case koneksi database bersifat include terhadap use case klasterisasi, yang artinya sebelum klasterisasi harus dilakukan koneksi database terlebih dahulu. Use case hasil klaster juga bersifat include terhadap use case klasterisasi.

Tabel 1. Tabel Use Case

No Nama Proses Keterangan

1. Koneksi database Use case ini

digunakan untuk

mengatur koneksi

aplikasi ke DBMS.

2. Klasterisasi Use case ini

digunakan untuk

melakukan proses

klasterisasi dataset.

3. Hasil klaster Use case ini

digunakan untuk

menampilkan hasil analisa klasterisasi.

Gambar 3. Use Case Diagram

Class Diagram

Pada class diagram terdapat empat kelas yang digunakan dalam aplikasi ini.

Kelas-kelas tersebut adalah kelas halaman utama, koneksi database, k-means dan output klasterisasi.

Dari gambar 4 di atas terlihat bahwa kelas koneksi database dan kelas k-means berasal dari kelas halaman utama. Satu halaman utama bisa digunakan untuk melakukan satu koneksi database. Satu halaman utama bisa melakukan satu k-means. Satu k-means bisa menghasilkan satu atau lebih output klasterisasi. Satu output klasterisasi bisa dihasilkan satu atau lebih k-means.

Gambar 4. Class Diagram

Entity Relationship Diagram

Data Mining ini menggunakan 9 tabel dalam database. Sembilan tabel tersebut dibagi menjadi dua kelompok yaitu kelompok tabel dimensi dan tabel fakta. Kelompok tabel dimensi meliputi tabel persil, tanah, bangunan, lantai_bangunan, jalan, listrik, njop dan kran. Dan yang termasuk dalam kelompok tabel fakta meliputi tabel kuesioner.

HASIL DAN PEMBAHASAN

Teknologi

Untuk mengimplementasikan data mining ini, maka dibutuhkan beberapa hardware pendukung dan software pendukung sebagai berikut:

Kebutuhan hardware

Perangkat keras (hardware) yang dibutuhkan untuk mengimplementasikan data mining ini antara lain:

• PC Pentium (Minimal Pentium IV).

• Sistem Operasi Windows XP Profesional atau Windows Vista.

• Memory dengan kapasitas minimal 512 Mega byte.

• Harddisk minimal 40 Giga byte.

Kebutuhan software

Untuk mejalankan Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya, maka komputer yang digunakan harus sudah terinstal software yang digunakan yaitu Java Development Kit 1.6, Netbeans 6.1 dan Microsoft SQL Server 2005 dengan sistem operasi Windows XP Profesional atau Windows Vista.

Implementasi Sistem

Dalam implementasi sistem ini, yang dapat dilakukan pada Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini yaitu:

Bisa menghasilkan informasi penge-lompokan pelanggan PDAM Kota Surabaya berdasarkan guna persil, luas tanah, luas bangunan, jumlah lantai bangunan, lebar jalan, daya listrik, NJOP dan jumlah kran dengan menggunakan metode k-means clustering.

Bisa menghasilkan informasi diskriminasi tarif diantara kelompok pelanggan PDAM Kota Surabaya berdasarkan pengelompokan pelanggan yang telah ditentukan.

Gambar 5. Entity Relationship Diagram

Kebutuhan hardware

Perangkat keras (hardware) yang dibutuhkan untuk mengimplementasikan data mining ini antara lain:

• PC Pentium (Minimal Pentium IV).

• Sistem Operasi Windows XP Profesional atau Windows Vista.

• Memory dengan kapasitas minimal 512 Mega byte.

• Harddisk minimal 40 Giga byte.

Kebutuhan software

Implementasi Sistem

Dalam implementasi sistem ini, yang dapat dilakukan pada Data Mining Dengan Metode K-Means Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini yaitu:

Bisa menghasilkan informasi diskriminasi tarif diantara kelompok pelanggan PDAM Kota Surabaya berdasarkan pengelompokan pelanggan yang telah ditentukan.

Contoh Kasus:

Tentukan informasi pengelompokan pelanggan dan diskriminasi tarif PDAM Kota Surabaya berdasarkan dari data-data kuesioner yang telah terkumpul. Misalkan:

• Jumlah pengelompokan yang

diinginkan sebanyak 10 pelanggan.

• Nilai Batas Error yang diinginkan adalah 20%.

• Nilai iterasi maksimal sebanyak 3 iterasi.

Langkah-langkah

Sebelum melakukan proses klasterisasi, pemakai harus melakukan koneksi database terlebih dahulu. Dari halaman utama pilih menu file → koneksi database.

Gambar 6. Halaman Utama

Masukkan nama server untuk koneksi pada database. Setelah koneksi pada database berhasil, pemakai bisa menekan tombol ok.

Isi konfigurasi klasterisasi sesuai dengan kasus di atas seperti yang ditunjukkan pada Gambar 8. Setelah menentukan konfigurasi klasterisasi, pemakai bisa menekan tombol start klaster untuk memulai proses klasterisasi.

Pada saat proses klasterisasi, program akan mengelompokkan data kuesioner tersebut berdasarkan jarak terdekat dengan centroid, menghitung lamanya waktu yang diperlukan, dan menghitung prosentase sum of the squared error.

Gambar 7. Halaman Koneksi Database

Gambar 8 Halaman Klasterisasi

Setelah proses klasterisasi selesai, hasil dari klasterisasi tersebut akan ditampilkan pada FrmHasil.java dan disimpan ke dalam database dalam bentuk pengelompokan.

HASIL IMPLEMENTASI SISTEM

History Klasterisasi

Pada halaman ini akan ditampilkan history dari proses klasterisasi mulai dari inisialisasi awal sampai akhir iterasi. Data pada tabel menunjukkan data jarak tiap objek dengan masing-masing centroid. Data pada text area menunjukkan jumlah data pada masing-masing cluster. Estmasi waktu merupakan waktu yang dibutuhkan untuk menghasilkan cluster.

Pengelompokan Pelanggan

Pada halaman ini akan ditampilkan hasil klasterisasi berupa informasi spesifikasi pengelompokan pelanggan berdasarkan parameter yang telah ditentukan pemakai sebelumnya.

Gambar 9. Halaman History Klasterisasi

Gambar 10. Halaman Pengelompokan

Pelanggan

Tabel 2. Spesifikasi Pengelompokan Pelanggan

Cluster Spesifikasi

1 Guna persil : tempat tinggal

Luas tanah : >= 300 m2

Luas bangunan : >= 300 m2

Jumlah lantai : 1 Lantai

Lebar jalan : 5 m <= Lebar Jalan < 6.5 m

Daya listrik : 2200 VA <= Daya Listrik < 4400 VA

Njop : >= Rp 500 juta

Jumlah kran : 2

2 Guna persil : tempat tinggal

Luas tanah : 36 m2 <= Luas Tanah < 120 m2

Luas bangunan : 120 m2 <= Luas Bangunan < 200

Jumlah lantai : 1 Lantai

Lebar jalan : 6.5 m <= Lebar Jalan < 12 m

Daya listrik : 2200 VA <= Daya Listrik < 4400 VA

Njop : Rp 250 juta <= NJOP < Rp 500 juta

Jumlah kran : 2

3 Guna persil : Usaha

Luas tanah : 36 m2 <= Luas Tanah < 120 m2

Luas bangunan : 36 m2 <= Luas Bangunan < 120

Jumlah lantai : 1 Lantai

Lebar jalan : 6.5 m <= Lebar Jalan < 12 m

Daya listrik : 2200 VA <= Daya Listrik < 4400 VA

Njop : Rp 150 juta <= NJOP < Rp 250 juta

Jumlah kran : 4

4 Guna persil : tempat tinggal

Luas tanah : 36 m2 <= Luas Tanah < 120 m2

Luas bangunan : 200 m2 <= Luas Bangunan < 300

Jumlah lantai : 2 Lantai

Lebar jalan : 5 m <= Lebar Jalan < 6.5 m

Daya listrik : 2200 VA <= Daya Listrik < 4400 VA

Njop : Rp 250 juta <= NJOP < Rp 500 juta

Jumlah kran : 2

5 Guna persil : Rumah & Usaha/ Toko

Luas tanah : 36 m2 <= Luas Tanah < 120 m22

Luas bangunan : 200 m2 <= Luas Bangunan < 300

Jumlah lantai : 1 Lantai

Lebar jalan : 5 m <= Lebar Jalan < 6.5 m

Daya listrik : 2200 VA <= Daya Listrik < 4400 VA

Njop : Rp 150 juta <= NJOP < Rp 250 juta

Jumlah kran : 6

Tabel 3. Lanjutan Spesifikasi Pengelompokan Pelanggan

Cluster Spesifikasi

6 Guna persil : Rumah & Usaha/ Toko

Luas tanah : 120 m2 <= Luas Tanah < 200 m2

Luas bangunan : >= 300 m2

Jumlah lantai : 3 Lantai

Lebar jalan : 6.5 m <= Lebar Jalan < 12 m

Daya listrik : >= 4400 VA

Njop : >= Rp 500 juta

Jumlah kran : 3

7 Guna persil : tempat tinggal

Luas tanah : 36 m2 <= Luas Tanah < 120 m2 Luas bangunan : 36 m2 <= Luas Bangunan < 120 m2

Jumlah lantai : 1 Lantai

Lebar jalan : 3 m <= Lebar Jalan < 5 m

Daya listrik : 2200 VA <= Daya Listrik < 4400 VA

Njop : Rp 50 juta <= NJOP < Rp 150 juta Jumlah kran : 2

8 Guna persil : tempat tinggal

Luas tanah : 36 m2 <= Luas Tanah < 120 m2

Luas bangunan : 120 m2 <= Luas Bangunan <

200 m2

Jumlah lantai : 1 Lantai

Lebar jalan : 3 m <= Lebar Jalan < 5 m

Daya listrik : < 1300 VA

Njop : Rp 50 juta <= NJOP < Rp 150 juta

Jumlah kran : 5

9 Guna persil : Tempat tinggal

Luas tanah : 120 m2 <= Luas Tanah < 200 m2

Luas bangunan : >= 300 m2

Jumlah lantai : 2 Lantai

Lebar jalan : 5 m <= Lebar Jalan < 6.5 m

Daya listrik : >= 4400 VA

Njop : >= Rp 500 juta

Jumlah kran : 6

10 Guna persil : tempat tinggal

Luas tanah : 36 m2 <= Luas Tanah < 120 m2 Luas bangunan : 36 m2 <= Luas Bangunan < 120 m2

Jumlah lantai : 1 Lantai

Lebar jalan : 5 m <= Lebar Jalan < 6.5 m Daya listrik : < 1300 VA

Njop : Rp 50 juta <= NJOP < Rp 150 juta Jumlah kran : 1

Gambar Clustering

Pada halaman ini akan ditampilkan gambar dari hasil clustering. Gambar sebelah kiri merupakan gambar klasterisasi untuk iterasi pertama sedangkan gambar sebelah kanan merupakan gambar akhir klasterisasi.

Gambar 11. Halaman Gambar Clustering

Diskriminasi Tarif

Pada halaman ini akan ditampilkan informasi diskriminasi tarif air berdasarkan pengelompokan pelanggan yang telah terbentuk.

Gambar 12. Halaman Diskriminasi Tarif

Dari gambar diatas, dapat disimpulkan bahwa hasil pengujian diskriminasi tarif air pelanggan PDAM Kota Surabaya sebagai berikut:

Tabel 4. Diskriminasi Tarif

Cluster Kode Tarif Pemakaian Tarif

0-10 4000

1 4C 11-20 6000

21-30 7500

0-10 4000

2 4C 11-20 6000

21-30 7500

0-10 1500

3 3B 11-20 3500

21-30 6000

4 1 Non Progressif 600

0-10 6000

5 4D 11-20 8000

21-30 9500

0-10 4000

6 4C 11-20 6000

21-30 7500

Tabel 5. Lanjutan Diskriminasi Tarif

Cluster

Kode Tarif Pemakaian Tarif

0-10 4000

7 4C 11-20 6000

21-30 7500

8 1 Non Progressif 600

0-10 4000

9 4C 11-20 6000

21-30 7500

0-10 1000

10 4A 11-20 1500

21-30 2500

DAFTAR PUSTAKA

KESIMPULAN

Setelah Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya ini selesai dibuat, dapat diambil kesimpulan sebagai berikut:

1. Kelebihan Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya adalah:

2. Data mining ini sangat bermanfaat untuk mempermudah pengelompokan pelanggan PDAM Kota Surabaya berdasarkan parameter yang telah ditentukan sebelumnya.

3. Mempermudah dalam penentuan diskriminasi tarif air berdasarkan dari pengelompokan pelanggan yang sudah terbentuk.

4. Kelemahan Data Mining Dengan Metode Kmeans Clustering Untuk Menganalisa Karakteristik Pelanggan PDAM Kota Surabaya adalah:

5. Penentuan parameter atau dataset pada data mining ini masih dilakukan pada satu tabel fakta. Sehingga pembacaan dataset dilakukan mulai dari awal kolom hingga akhir kolom.

6. Estimasi waktu proses klasterisasi tergantung dari jumlah record dan

Membantu Mengerjakan Tesis dan Disertasi S3 - hubungi Meruya Statistik 0812 1944 9060

Sabtu, 19 Juli 2014

Tidak ada komentar:

Posting Komentar