Minggu, 13 Oktober 2013

(04) Data Mining

Filled under:

*** Pencarian Hukum Asosiasi (Association Rule Discovery)***
Dalam satu grup, tiap orang memiliki hubungan satu dengan yang lain, juga terhadap grup-grup yang lain. Keterhubungan itu selanjutnya dibuat hukum/aturan yang dapat dijadikan patokan kebijakan dari pengguna. Sebagai contoh  data yang berasal dari penjualan supermarket. Misalnya berdasarkan data yang ada terbanyak pembelian beberapa botol minuman bir disertai dengan popok bayi. Sehingga pengaturan letak posisi stan penjualan minuman bir sebaiknya berdekatan dengan stan penjualan popok bayi. Contoh yang lain adalah pada aplikasi berbasis web, dimana kecenderungan suatu user mengakses situs tertentu setelah suatu situs dia akses dapat dijadikan patokan suatu perusahaan dalam menawarkan produk ke user tersebut. Kecenderungan user dapat diketahui dari aktivitasnya menelusuri dunia maya, misalnya setelah dia mengakses situs A akan cenderung mengakses situs B, dan seterusnya.

***Pencarian Pola Berurutan (Sequential Pattern Discovery)***
Banyak sistem yang cara kerjanya berurutan seperti prosedure-prosedur tertentu, akses ke suatu halaman situs, protein dalam rangkaian Asam Dioksi Ribonukleat (DNA), dan sebagainya. Dengan memiliki riwayat data pada sistem-sistem tersebut kita dapat mengetahui pola-pola yang dihasilkannya. Tugas perancang data mining adalah mengetahui pola-pola berurutan dari data-data yang tersebar tersebut. Contoh aplikasi-aplikasi yang diterapkan misalnya :

  1. Dalam suatu pasar swalayan diketahui data transaksi nasabah yang belanja di situ. Jika ditelusuri, seorang nasabah akan diketahui rangkaian urutan belanja dalam rentang waktu tertentu.
  2. Dalam dunia kedokteran beberapa penyakit memiliki gejala-gejala yang berurutan. Misalnya demam berdarah dimulai dengan demam yang disertai bercak-bercak tertentu pada kulit, dilanjutkan dengan fase kritis dimana demam mula mereda, dan seterusnya.
  3. Dalam dunia meteorologi, rangkaian cuaca dapat digunakan untuk memprediksi iklim yang terjadi dan dapat memprediksi adanya badai, sunami, dan bencana lainnya yang melibatkan perubahan cuaca.
***Regresi***
Regresi telah dikembangkan sejak abad XIX oleh Sir Francis Galton dengan tulisannya yang berjudul "Regresi Menuju Rata-rata". Prinsip yang dicetuskannya adalah bahwa dari dua variabel tidak bebas (Independent variabel) satu variabel tidak dipengaruhi langsung oleh variabel lainnya melainkan dipengaruhi oleh rata-ratanya. Misalnya seorang ayah yang tinggi bisa saja memiliki anak yang bertinggi badan lebih rendah dan sebaliknya bisa saja seorang ayah yang rendah memiliki anak yang lebih tinggi.
 
Dalam ilmu statistik, regresi mempelajari hubungan antara satu variabel dengan variabel yang lain. Misalnya dalam menentukan hubungan antara tinggi dengan berat badan seseorang. Berdasarkan data yang dikumpulkan dapat diketahui berat ideal terhadap tinggi badan seseorang. Regresi dimanfaatkan selain untuk menentukan hubungan kuantitatif antara variabel juga untuk meramalkan nilai dari variabel dimasa yang akan datang. Teknik ini banyak dikembangkan dalam bidang penjualan, brasa saham, meteorologi, dan pengobatan.
 
***Deteksi Penyimpangan (Deviation/Anomaly Detection)***
Terkadang kita tidak mengetahui adanya suatu penyimpangan sebelum kita mengumpulkan data-data yang ada dan kemudian diolah dengan teknik-teknik tertent dalam  data mining. Dengan mengetahui adaya suatu data yang menyimpang dapat deimanfaatkan oleh para pengambil kebijakan untuk menghindari adanya kerusakan yang mungkin terjadi di kemudian hari. Resiko yang mungkin terjadi dapat ditekan sekecil mungkin. Pemodelan data mining berbeda dengan pemodelan sistem biasa yang sering kita jumpai seperti absensi, penjualan, pembelian, stok dan sejenisnya. Salah satu pembeda adalah kempleksitas yang dimiliki dalam data mining. Terkadang data yang diterima sangat sulit untuk diukur atau dipresentasikan seperti badai, gerakan, dan data spesifik yang lainnya. Oleh karena itu, diperluakan pengkajian yang lebih mendalam dan terukur guna mendapatkan model yang terbaik.

Pemodelan dimulai dengan memformulasikan suatu kasus dalam suatu persamaan matematis. Persamaan matematis ini sedekat mungkin mirip dengan kenyataan yang ada. Jika pemodelan matematis sudah selesai, proses berikutnya adalah perakitan model matematis itu dalam suatu perangkat lunak. Jika perangkat lunak yang dihasilkan selesai, berikutnya dilanjutkan dengan pengujian untuk mengetahui akurasinya. Model yang baik diketahui dari akurasi yang mendeteksi kenyataan di lapangan.

1 komentar:

  1. Best Casino 2021 USA - Mapyro
    Casinos in New Jersey 인천광역 출장샵 · CasinoCity · MGM National Harbor · Caesars Palace 구미 출장샵 · Golden 삼척 출장안마 Nugget Casino · 밀양 출장마사지 Tropicana Las 울산광역 출장샵 Vegas · Hollywood

    BalasHapus