Sabtu, 07 April 2018

Konsep Data MIning contoh kasus KDD

MODEL DATA WAREHOUSE KEMISKINAN UNTUKPENGAMBILAN KEPUTUSAN DALAM PERENCANAANPEMBANGUNAN




Abstrak

Kemiskinan merupakan masalah pokok disuatu yang sedang berkembang, baik itu kemiskinan secara struktural, kultural dan natural. Artinya,kemiskinan tidak lagi dilihat sebagai tolok ukur gagalnya Pemerintah melindungi dan memenuhi hak-hak dasar warganya melainkan menjadi tantangan bangsa untuk mewujudkan masyarakat adil, sejahtera berdaulat dan bermartabat.Upaya yanng telah dilaksanakan pemerintah dalam menentukan langkah kebijakan dalam upaya menanggulangi kemiskinan, salah satunya dengan melakukan survey untuk mendata penduduk miskin. Hasil dari kegiatan survey dari berbagai organisasi tersebut diperoleh berbagai versi database kemiskinan untuk daerah atau lokasi tersebut. Informasi yang dihasilkan dari database kemiskinan tersebut hanya meliputi rekapitulasi jumlah warga miskin untuk daerah atau lokasi tersebut. Untuk mempermudah proses pengambilan keputusan maka diperlukan sebuah model data warehouse yang bisa dijadikan gudang data untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pemerintah dalam perencanaan pembangunan dalam pengentasan kemiskinan.

Kata kunci: data warehouse, kemiskinan, database


 1. Pendahuluan

Kemiskinan adalah kondisi seseorang yang tidak memiliki pendapatan untuk memenuhi kebutuhan dasar makanan, dan tidak memiliki kemampuan dasar manusiawi untuk menunjang keberlanjutan hidup (http://www.scribd.com). Kemiskinan merupakan masalah pokok disuatu Negara baik dinegara berkembang sampai kepada naegara yang sedang berkembang, baik itu kemiskinan secara struktural, cultural dan natural. Di negara sedang berkembang kemiskinan adalah pekerjaan nomor satu pemerintah yang harus segera diatasi dan harus segera diselesaikan.Kemiskinan mempunyai dampak negatif yang bersifat menyebar (multiplier effects) terhadap tatanan kemasyarakatan secara menyeluruh. Berbagai peristiwa konflik di Tanah Air yang terjadi sepanjang krisis ekonomi, misalnya, menunjukkan bahwa ternyata persoalan kemiskinan bukanlah semata-mata mempengaruhi ketahanan ekonomi yang ditampilkan oleh rendahnya daya beli masyarakat, melainkan pula mempengaruhi ketahanan sosial masyarakat dan ketahanan nasional. Pengertian kemiskinan merupakan sesuatu yang kompleks, dalam arti tidak hanya berkaitan dengan dimensi ekonomi saja tetapi juga dengan dimensi-dimensi lain diluar ekonomi. Namun selama ini kemiskinan lebih sering dikonsepsikan dalam konteks ketidakcukupan pendapatan dan harta (lack of income and assets) untuk memenuhi kebutuhan-kebutuhan dasar seperti pangan, sandang, perumahan, pendidikan dan kesehatan, yang mana semuanya berada dalam lingkup dimensi ekonomi. 
Menurut Badan Pusat Statistik (BPS) penduduk yang tidak mampu memenuhi kebutuhan dasar minimum dikategorikan sebagai penduduk miskin. Nilai garis kemiskinan yang digunakan mengacu pada kebutuhan minimum 2.100 kkal per kapita per hari ditambah dengan kebutuhan minimum non makanan yang merupakan kebutuhan dasar seseorang yang meliputi kebutuhan dasar untuk papan, sandang, sekolah, transportasi, serta kebutuhan rumahtangga dan individu yang mendasar lainnya. Besarnya nilai pengeluaran (dalam rupiah) untuk memenuhi kebutuhan dasar minimum makanan dan non makanan tersebut disebut garis kemiskinan (BPS, 2007). Beberapa kriteria kemiskinan yang ditetapkan oleh instansi lainnya, antara lain: BKKBN (Badan Koordinasi Keluarga Berencana Nasional), World Bank dan UNDP (United Nations for Development Programs). Metode penghitungan penduduk miskin yang dilakukan BPS sejak pertama kali hingga saat ini menggunakan pendekatan yang sama yaitu pendekatan kebutuhan dasar (basic needs approach). Dengan pendekatan ini, kemiskinan didefinisikan sebagai ketidakmampuan dalam memenuhi kebutuhan dasar. Dengan kata lain, kemiskinan dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan makanan maupun non makanan yang bersifat mendasar.
Berdasarkan Peraturan Menteri Dalam Negeri Nomor 42 Tahun 2010 Tentang Tim Koordinasi Penanggulangan Kemiskinan Provinsi Dan Kabupaten/Kota, pasal 1 menyebutkan Program penanggulangan kemiskinan adalah kegiatan yang dilakukan oleh pemerintah, pemerintah daerah, dunia usaha, serta masyarakat untuk meningkatkan kesejahteraan masyarakat miskin melalui bantuan sosial, pemberdayaan masyarakat, pemberdayaan usaha ekonomi mikro dan kecil, serta program lain dalam rangka meningkatkan kegiatan ekonomi. Untuk tingkat kabupaten Bupati/Walikota bertanggung jawab atas pelaksanaan percepatan penanggulangan kemiskinan di kabupaten/kota.

Berbagai upaya sudah dilakukan pemerintah dalam menentukan langkah kebijakan dalam upaya menanggulangi kemiskinan, salah satunya dengan melakukan survey untuk mendata penduduk miskin. Langkah ini dilakukan oleh dinas atau organisasi yang membutuhkan data masyarakat miskin untuk melaksanakan program peningkatan kesejateraan rakyat. Bahkan baru-baru ini Team Nasional Pergerakan Penanggulangan Kemiskinan (TNP2K) meluncurkan website Basis Data Terpadu untuk Program Batuan Sosial, dengan tujuan agar Program Bantuan Sosial bisa dilaksanakan secara tepat sesuai dengan keikutsertaan dan tujuan program. Hasil dari kegiatan survey dari berbagai organisasi tersebut diperoleh berbagai versi database kemiskinan untuk daerah atau lokasi tersebut. Informasi yang dihasilkan dari database kemiskinan tersebut hanya meliputi rekapitulasi jumlah warga miskin untuk daerah atau lokasi tersebut.
Untuk mempermudah proses pengambilan keputusan maka diperlukan sebuah model data warehouse yang bisa dijadikan gudang data untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pemerintah dalam perencanaan pembangunan dalam pengentasan kemiskinan.Data warehouse adalah sebuah database yang secara khusus didesain dengan struktur untuk melakukan query dan analisis (Nolan & Huguelet, 2000). Data warehouse perusahaan adalah sebuah database komprehensif yang mendukung semua analisis keputusan yang diperlukan oleh suatu organisasi dengan menyediakan ringkasan dan rincian informasi (Turban, dkk, 2005). Data warehouse menyediakan suatu wadah untuk menampung data - data yang diperlukan untuk menganalisis suatu kondisi dalam organisasi dengan hanya mengambil data yang dibutuhkan untuk keperluan saja. Data yang digunakandalam data warehouse dapat berasal dari data yang sifatnya operasional yang ada setiap harinya saat proses berjalan. Menurut W.H Inmon (Reddy, dkk, 2010), sebuah data warehouse merupakan kumpulan data yang bersifat subject-oriented, terintegrasi, time variant, dan non volatile yang membantu manajemen perusahaan dalam proses pembuatan keputusan. Data warehouse menyediakan suatu tool yang disebut OnLine Analytical Processing (OLAP) untuk melakukan analisis data multidimensional secara interaktif yang nantinya akan menjadi fasilitas yang memudahkan untuk melakukan proses data mining (Reddy, dkk, 2010).

Keuntungan dari menerapkan data warehouse adalah kemampuan mengakses

data enterprise, kemampuan dalam konsistensi data, kemampuan menampilkan hasil analisis secara cepat, menemukan gap antara pengetahuan bisnis dan bisnis proses,

mengurangi biaya administrasi, dan menampilkan informasi yang memang dibutuhkan secara efektif (Nolan & Huguelet, 2000). Dengan adanya keuntungan yang dijanjikan oleh data warehouse maka akan sangat membantu pihak manajemen perusahaan dalam membuat keputusan yang akan berdampak pada kelangsungan hidup perusahaannya sendiri.

1.1. Rumusan Masalah

Berdasarkan pengamatan sementara maka dapat dirumuskan suatu masalah yaitu bagaimana merancang sebuah aplikasi data warehouse dan OLAP (On Line Analytical Processing) yang dapat mengolah data kemiskinan sedemikian rupa sehingga menghasilkan suatu informasi yang dapat membantu pemerintah dalam mengambil langkah-langkah yang tepat untuk perencanaan pembangunan ?

1.2. Tujuan dan Manfaat Penelitian

Tujuan dari penelitian ini adalah membangun data warehouse dan menghasilkan informasi yang dapat membantu pemerintah dalam mengambil langkah-langkah yang tepat dalam perencananan pembangunan. Penelitian ini diharapkan dapat membantu pemerintah terkait dalam melakukan analisis terhadap data kemiskinan dengan menggunakan informasi yang dihasilkan oleh data warehouse.

2. Metode.

Dalam melakukan penelitian ini metode yang digunakan adalah metode Knowledge Discovey in Database (KDD). Menurut Santoso (2007), Knowledge Discovery In Database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menentukan keteraturan, pola atau hubungan dalam sebuah set data yang berukuran besar. Keluaran dari data mining banyak digunakan untuk pengambilan keputusan dimasa depan. Gambaran dari proses KDD terlihat seperti gambar berikut :

Knowledge Discovery in Database



Dari gambar diatas terlihat  bahwa proses KDD terdiri dari :
1. Pemahaman (Data Understanding) memahami data berdasarkan kebutuhan data (Data Requirement). Proses ini meliputi pengumpulan data (initial data collection) dan pendeskripsian data (data description).
2. Data preparation, yaitu preprocecing yang penyeleksian data (data selection), dan pembersihan (cleaning) data, pada proses ini dilakukan pemilihan data yang disesuaikan dengan kebutuhan dan pembersihan data dari data-data yang sifatnya redundansi atau data dengan type data yang salah.
3. Data transformation, yaitu proses mengkonversikan data kedalam format lain yang sesuai dengan kebutuhan analisa.
4. Modeling data mining, yaitu proses untuk memperoleh pola dan karakteristik data, dalam fase ini digunakan metode clustering yang tujuannya adalah untuk mengelompokkan data kemiskinan berdasarkan dengan karakteristik yang sama ke suatu wilayah dengan karakteristik yang berbeda ke wilayah yang lain. Pada tahapan clustering ini pengelompokan data dikelompokan berdasarkan pengelompokan data berdasarkan wilayah tempat tinggal penduduk miskin dan indikator- indikator kemiskinan.
5. Interpretation/Evaluation, melakukan interpretasi dan evaluasi terhadap masalah yang dihadapi berdasarkan data yang dianalisa.

Untuk tahapan pembuatan model data warehouse peneliti hanya melakukan tahapan KDD sampai pada tahap data trasformation, untuk tahapan berikutnya akan dilanjutkan pada penelitian data mining kemiskinan.


3. Landasan Teori

3.1 Data Warehouse
Data warehouse merupakan suatu kumpulan data yang bersifat subjectoriented, terintegrasi, terus-menerus dan time variant yang membantu enterprise atau organisasi dalam membuat keputusan. Sebagai pembuat keputusan maka dibutuhkan query beberapa nilai dari satu subjek untuk melakukan proses analisis secara realtime.
Data warehouse dengan model multidimensional biasanya diimplementasikan dalam bentuk star scheme agar memenuhi persyaratan. Pada model multidimensional, data warehouse biasanya menyimpan data dalam bentuk database relasional. Data warehouse didefinisikan sebagai sekumpulan data yang bersifat subjectoriented, terintegrasi, time variant, nonvolatile yang melayani sebagai implementasi fisik dari sebuah model data untuk mengambil keputusan dan menyimpan informasi untuk kebutuhan enterprise atas keputusan yang bersifat strategis. Teknologi dalam data warehouse meliputi data cleaning, integrasi data, dan OLAP sebagai teknik analisis dengan fungsi seperti menyimpulkan, konsolidasi dan agregasi sebaik kemampuan memandang informasi dari berbagai sudut (Reddy, dkk, 2010).

3.2. Indikator Kemiskinan
Indikator-indikator kemiskinan sebagaimana di kutip dari Badan Pusat Statistika, antara lain sebagi berikut:

Tabel 1. Indikator Kemiskinan

4. Pembahasan Hasil
Penelitian yang dilakukan mengikuti langkah-langkah dalam metode Knowledge Discovery in Database (KDD).
4.1.Data Understanding (Pemahaman Data)
4.1.1. Data Requirement

Agar pemahaman data yang dilakukan bisa tepat sasaran, maka peneliti melakukan observasi ke instansi pemerintah yang berwenang dan bertanggung jawab atas arahan perencanaan yang pembangunan yang akan dilaksanakan pemerintah setiap tahunnya. Usulan perencanaan itu berasal dari masyarakat yang disalurkan melalui muresbang kecamatan serta usulan dari instansi-instansi pemerintah /SKPD seperti Dinas Pekerjaaan Umum, Dinas Sosial, dll. Masalah kemiskinan bukan merupakan masalah baru yang dihadapi oleh pemerintah dari tahun ke tahun. Ini terkait dengan perencanaan pembangunan yang akan dilaksanakan terutama berkaitan dengan pembangunan infrastruktur seperti sekolah, jalan, jembatan, saranan air bersih, listrik dan lain-lain. Program pemberdayaan masyarakat miskin semakin digalakkan, bukan lagi hanya sekedar penyaluran bantuan tunai yang bersifat sementara dan cendrung tidak optimal dalam pengentasan kemiskinan.

Dari hasil observasi yang dilakukan di Badan Perencanaan Pembangunan (BAPPEDA) di beberapa kabupaten di wilayah provinsi Sumatera Selatan (sampel yang diambil adalah kabupaten Ogan Komering Ilir (OKI) dan kabupaten Banyuasin), terdapat beberapa prioritas pembangunan yang menjadi fokus pemerintah, diantaranya adalah priorotas untuk penanggulangan kemiskinan dan pengangguran, yang berfokus kepada pengurangan pengeluaran masyarakat miskin (seperti pendidikan gratis, berobat gratis, bantuan kematian, bantuan hukum, rumah layak huni, dll) dan peningkatan pendapatan keluarga miskin (seperti bantuan bibit unggul, bantuan modal, dll). Untuk mendukung program penanggulangan kemiskinan tersebut diperlukan data kemiskinan yang ada di setiap daerah mulai dari tingkat kecamatan sampai pedesaan. Adapun informasi yang dibutuhkan dari data kemiskinan tersebut bisa didefinisikan sebagai berikut :

1. Dibutuhkan informasi tentang penyebaran penduduk miskin untuk setiap wilayah kecamatan, kelurahan dan desa.

2.  Dibutuhkan informasi tentang tingkat pendidikan penduduk dengan tingkat kemiskinan diwilayah kecamatan, kelurahan dan desa.

3.  Dibutuhkan   informasi   tentang   usia (anak-anak, produktif, non produktif) dengan tingkat kemiskinan per kecamatan, kelurahan dan desa.

4.  Dibutuhkan  informasi  tentang  kondisi tempat tinggal dengan tingkat kemiskinan diwilayah kecamatan, kelurahan dan desa.

5.  Dibutuhkan informasi cara perolehan air minum dan penerangan dengan tingkat kemiskinan per kecamatan, kelurahan dan desa.

6.  Dibutuhkan informasi pekerjaan dengan tingkat kemiskinan per kecamatan, kelurahan dan desa.

7.   Dibutuhkan   informasi   jenis   kelamin dengan tingkat kemiskinan diwilayah kecamatan, kelurahan dan desa.


4.1.2. Initial Data Collection

Proses ini merupakan proses pengumpulan data dimana data yang dikumpulkan dan digunakan berasal dari database kemiskinan PPLS yang dirancang oleh BPS bekerja sama dengan TNP2K tahun 2011 di kabupaten Ogan Komering Ilir (OKI) di provinsi Sumatera Selatan.

Data Kemiskinan

Data yang digunakan meliputi data keluarga dan data kemiskinan yang berasal dari 18 kecamatan di kabupaten Ogan Komering Ilir provinsi Sumatera Selatan.

 4.1.3. Data Decription

Merupakan proses pendeskripsian data dimana data keluarga meliputi hubungan keluarga dengan kepala keluarga, umur, jenis kelamin, status perkawinan, cacat fisik, sekolah, ijazah dan pekerjaan. Sedangkan data kemiskinan terdiri dari atribut alamat, indikator kemiskinan dan dan klas kemiskinan (Hampir Miskin/Miskin/Sangat Miskin). Indikator kemiskian dapat dikelompokkan menjadi beberapa kelompok, antara laim kondisi perumahan, sumber air bersih, penerangan/listrik, bahan bakar yang digunakan, tempat pembuangan, kepemilikan kendaraan dan keikutan peserta program bantuan (PKH & RASKIN).

4.2. Preparation Data

4.2.1. Data Selection

Data yang digunakan dalam penelitian ini meliputi data keluarga sejumlah 269590 record (tabel a1602) dan data kemiskinan sebanyak 78684 record (tabel r1602). Selain itu terdapat beberapa tabel master yang menyimpan informasi nama kecamatan dan nama kelurahan.

4.2.2. Cleaning Data
Tahap data cleaning merupakan tahap awal dari proses KDD. Pada tahapan ini data yang yang tidak relevan, missingvalue, dan redundant harus di bersihkan. Hal ini dikarenakan data yang relevan, tidak missingvalue, dan tidak redundant merupakan syarat awal dalam melakukan data mining. Suatu data dikatakan missing value jika terdapat atribut dalam dataset yang tidak berisi nilai atau kosong, sedangkan data dikatakan redundant jika dalam satu dataset terdapat lebih dari satu record yang berisi nilai yang sama.


4.3. Data Transformation

Tahapan transformation data merupakan tahap merubah data ke dalam bentuk data warehouse. Pada tahap ini dilakukan penggabungan/integrasi terlebih dahulu terhadap dari beberapa data source yang meliputi data keluarga, data kemiskinan, data kecamatan dan data desa menjadi sebuah data integrasi yang disesuikan dengan target data yang akan digunakan oleh dalam proses OLAP data. Seperti dijabarkan pada gambar berikut ini:

Data Transformation

Pada gambar 3 menggambarkan proses penggabungan dua data source yaitu tabel

keluarga(a1602) dan tabel kemiskinan(r1602). Proses penggabungan dua tabel tersebut membentuk tabel facta yaitu kemiskinan_fact_table. Tabel tersebut akan direlasikan dengan tabel provinsi(prop1600), tabel kebupaten (kabu1602), tabel kecamatan (keca1602) dan tabel desa (desa1602) sebagai tabel dimensi yang akan digunakan dalam proses OLAP data. Berikut salah satu model OLAP


OLAP


 5.  Simpulan

1.      Model data warehouse yang terbentuk dapat digunakan sebagai gudang data untuk mempermudah melakukan analisis terhadap data kemiskinan.
2.    Data warehouse yang terbentuk dapat menghasilkan multidimensi data yang berguna bagi pemerintah dalam pengambilan langkah kebijakan untuk perencanaaan pembangunan yang tepat sasaran sehingga dapat membantu dalam penganggulangan kemiskinan.


sumber : http://eproceeding.undiksha.ac.id/index.php/senari/article/view/764/544



Nama  : Muhammad Lafasha . A
Npm : 1B117090
Kelas : 4KA44

Tidak ada komentar:

Posting Komentar