Naive Bayes Classifier adalah algoritma klasifikasi yang menggunakan prinsip probabilitas berdasarkan Teorema Bayes. Algoritma ini sangat sederhana namun efektif, terutama untuk klasifikasi teks dan pemfilteran spam, karena mengasumsikan bahwa fitur-fiturnya independen satu sama lain. Algoritma ini memprediksi kemungkinan suatu data termasuk dalam kelas tertentu dengan menghitung probabilitas kemunculan setiap fitur dalam data tersebut.
Berikut adalah cara kerja dasar metode di atas:
- Probabilitas: Algoritma ini mengandalkan Teorema Bayes untuk menghitung probabilitas bersyarat (probabilitas suatu peristiwa terjadi dengan mempertimbangkan peristiwa lain).
- Asumsi independensi: Ciri khasnya adalah asumsi "naif" bahwa setiap fitur (karakteristik) bersifat independen dari fitur lainnya, terlepas dari nilai atribut grupnya. Hal ini membuat perhitungannya lebih sederhana.
- Klasifikasi: Untuk mengklasifikasikan suatu data, Naive Bayes akan menghitung probabilitas data tersebut masuk ke setiap kelas yang ada, lalu menempatkannya ke dalam kelas dengan probabilitas tertinggi.