Senin, 28 Februari 2011

Pertemuan 1 : Pengertian dan Macam-Macam Metode Data Mining


By Zulrifan Noor
Banjarbaru, 28 Februari 2011

Pengertian

  • Data mining merupakan proses berulang-ulang, di mana penyelesaian didefinisikan oleh penemuan, baik secara otomatis atau metode manual. (Kantardzic, 2003)
  • Data mining (DM) adalah ekstraksi dari suatu informasi yang manarik atau berguna dari database besar (DB). Dengan pencarian otomatis pengetahuan implisit dalam DBs, menggunakan DM analisis statistik canggih dan teknik pemodelan untuk menemukan pola dan hubungan tersembunyi dalam organisasi DBs (Wang, 2003)
  • Data mining merujuk pada ekstraksi atau \ pertambangan "pengetahuan dari data dalam jumlah besar (Han, 2005)
  • Non-trivial ekstraksi implisit, yang sebelumnya tidak dikenal dan berpotensi menjadi informasi yang berguna dari data (Tan, 2003)
Macam - Macam Model Data Mining

A. Metode Prediksi
Dengan menggunakan beberapa variabel untuk memprediksi nilai yang belum diketahui (unknown) atau nilai selanjutnya (future) atau variabel lain.

Contoh :

1. Classification
  • Pada persoalan klasifikasi, kita memiliki sejumlah kasus (sampel data) dan ingin mempresiksi beberapa class yang ada pada sampel data tersebut.
  • Tiap isntan data berisi banyak atribut, dimana masing-masing atribut memiliki satu dari beberapa kemungkinan nilai.
  • Hanya satu atribut diantara banyak aribut tersebut yang disebut atribut target, sedangkan atribut yang lain disebut sebagai atribut prediktor.
2. Regression
3. Deviation Detection

B. Metode Deskripsi
Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia.

Contoh :

1. Clustering
  • Teknik yang berguna untuk mengeksplorasi data
  • digunakan pada saat banyak kasus dan tidak memiliki pengelompokan secara alami. (Dalam hal ini algoritma data mining dapat digunakan untuk mencari pengelompokan yang ada pada peta).
  • Clustering model berbeda dari model prediktif dikarenakan pada clustering tidak perlu ada atribut target.
  • Clustering juga dapat diorganisasi ke dalam sturktur hirarkikal akan mendefinisikan taksonomi dari data.
2. Association Rule Discovery
  • Sering disebut "Market Basket Analysis" yang digunakan untk menemukan relasi atau korelasi diantara himpunan item-item.
  • Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan bisnis.
  • Bisa dinyatakan sebagai, misal : "70 % dari orang-orang yang memebeli mie, juice dan saus akan membeli juga roti tawar."
3. Sequential Pattern Discovery


0 komentar:

Posting Komentar

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | cheap international calls