Jumat, 11 Oktober 2013

(01) Data Mining

Filled under:

***Konsep Data Mining***

Beberapa Literatur yang membahas data mining banya kita jumpai saat ini dan layak untuk dibaca. Tidak ada buku yang sanggup memberikan informasi lengkap karena Data Mining merupakan bidang yang sangat luas penerapannya. Untuk perkuliahan ini beberapa materi diambil dari buku referensi tersebut (kompilasi) sesuai dengan perkembangan terkini yang cenderung mengarah ke sistem Soft Computing yang baik dalam mengatasi permasalahan yang ada saat ini.

Data Mining menurut David Hand, Heikki Mannila, dan Padharaic Smyth dari MIT adalah analisa terhadap data (baisanya data berukuran besar) untuk menemukan hubungan yang jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut (Larose, 2006). Disebutkan bahwa cara yang digunakan adalah cara terkini (Novel) karena perkembangan teknologi yang terus berkembang dan database administrator harus mampu mengikuti perkembangan yang ada. Salah satu jenis algoritma yang saat ini banyak dikembangkan dan dapat dilihat pada jurnal-jurnal baik nasional maupun internasional adalah soft computing. Algoritma ini mampu mengatasi berbagai halangan yang sering dijumpai pada jenis algoritma konvensional tersebut antara lain : kurang lengkapnya data, ketidakpastian, dan sejenisnya.

Data Mining sudah ada sejak lama dan teori-teorinya pun sudah banyak dibahas dalam berbagai literatur. Teori-teori tersebut antara lain: Naive-Bayes dan Nearest Neighbour, Pohon Keputusan, Aturan Asosiasi, k-Means Clustering, dan Text Mining (Bramer, 2007. Sedangkan perkembangan terkini menghadirkan algoritma-algoritma yang baru dikembangkan antara lain : Jaringan Syaraf Tiruan (JST), Algoritma Genetik, Fuzzy C-Means, Support Vektor Machine (SVM). dan lain-lain (Larose, 2006). Sejak perkembangannya dari tahun 90-an, data mining yang sebelumnya dikuasai oleh para pakar statistik, ternyata di tahun 2000-an banyak dikembangkan oleh ilmu komputer yang berusaha untuk memperbaiki kinerja dari teori-teori statistik yang ada. Menurut Daryl Pregibon disebutkan bahwa Data Mining adalah perpaduan dari Statistik, Artificial Intelegent dan Database (Gorunescu, 2011). Data Mining kemudian dikenal dengan nama Knowledge-discovery in Database (KDD).

Ada baiknya kita membedakan mana aktivitas data mining dan mana yang bukan. Mencari sesuatu misalnya mencari situs-situs yang mengandung kata "mining" di search engine bukan merupakan aktivitas data mining, tetapi membuat group mining text, mining image, dan sejenisnya termasuk dalam kategori data mining. Contoh lainnya adalah mencari lokasi spa dari daftar spa yang ada bukan merupakan aktivitas data mining, tetapi mengelompokkan spa berdasarkan spa untuk penyakit tertentu merupakan aktivitas data mining
(Sumber: Penerapan Data Mining dng MATLAB-Prabowo Pudjo Widodo-Rahmadya Trias Handayanto-Herlawati)

0 komentar:

Posting Komentar