Pre-processing merupakan hal penting sebelum melatih model. Pre-processing diperlukan untuk mengubah data mentah menjadi data bersih yang cocok untuk dianalisis. Pre-processing penting dilakukan karena berbagai alasan diantaranya untuk meningkatkan kualitas data, meningkatkan kinerja model dan meningkatkan efisiensi. Pada pembahasan kali ini akan menjelaskan data collection, data cleaning data transform dan data reduction . Data Collection Data collection adalah proses pengumpulan, pengukuran, dan analisis berbagai tipe informasi menggunakan teknik berstandar. Tujuan dari data collection adalah untuk mengumpulkan informasi dan data terpercaya sebanyak-banyaknya, yang kemudian dianalisis untuk membuat sebuah keputusan bisnis yang krusial. Ketika sudah berhasil dikumpulkan, data ini kemudian melalui sejumlah proses meliputi pembersihan dan pemrosesan data agar dapat digunakan oleh perusahaan. Dalam melakukan data collection harus diketahui dahulu beberapa poin yaitu seb...