Dipublikasi pada 15 Februari 2017 oleh Drizzer Silverberg
Istilah data mining dapat diartikan juga sebagai istilah dalam kegiatan-kegiatan mencari informasi yang terkandung dalam data. Kegiatan-kegiatan (tasks) tersebut salah satunya dikelompokan sebagai berikut:
Pencarian pola (Find patterns)
Mencari suatu pola (patterns) atau keteraturan (regularities) di dalam data, khususnya yang tidak terlihat secara kasat mata. Task ini bisa dipecah menjadi beberapa bagian kecil seperti berikut:
Mengurangi noise pada data, seperti menghilangkan data kosong atau data yang tidak masuk akal.
Mengurangi dimensi, seperti menghilangkan suatu atribut atau variabel yang tidak terlalu berpengaruh atau bahkan tidak ada pengaruhnya sama sekali.
Menemukan variabel atau kombinasi yang penting untuk penggalian informasi.
Pencarian kasus (Find cases)
Mencari kasus dalam arti lain adalah menemukan data yang atraktif atau bertolak belakang terhadap data lainnya. Hal ini bisa disebut juga dengan mencari grup atau kelompok di dalam data. Kegiatan ini bedakan lagi menjadi kegiatan-kegiatan berikut:
Clustering
Kegiatan untuk mencari kumpulan padat suatu titik yang terasosiasi satu sama lain dan mungkin memiliki fungsionalitas yang sama untuk tujuan tertentu.
Classification
Kegiatan untuk memilih dan membedakan data yang memiliki tujuan yang berbeda.
Association Analysis
Kegiatan untuk mencari hubungan antar data yang terjadi dalam suatu waktu, seperti ketika A muncul dan B muncul dalam waktu bersamaan.
Anomaly Detection
Kegiatan ini merupakan pencarian atau deteksi hal yang tidak normal dan tidak cocok untuk kegiatan clustering, classification ataupun association analysis.
Prediksi nilai (Predict score)
Mencari atribut atau variabel yang bisa digunakan untuk memprediksi keluaran. Contoh kegiatan ini adalah regression, yaitu kegiatan untuk memprediksi nilai respon tunggal (dependent variable) berdasarkan parameter masukan (independent variables).
Adapun kegiatan data mining yang dibedakan atas struktur data, yaitu:
Sequence Mining
Kegiatan yang dilakukan pada data yang terurut secara waktu. Kegiatan ini seperti mencari peristiwa (event) yang menyebabkan sesuatu terjadi secara berulang
Text Mining
Kegiatan yang dilakukan pada data teks yang tidak terstruktur. Kegiatan ini seperti mencari suatu makna yang terkandung dalam kumpulan kata dan dapat dibedakan atau dikelompokkan. Meskipun data tersebut tidak terstruktur, kita bisa mencari makna dari data tersebut tanpa harus membuatnya menjadi terstruktur terlebih dahulu.