Skip to main content

Posts

Showing posts from March, 2024

P3 - Pre-processing menggunakan Google Colab

 Pre-processing merupakan hal penting sebelum melatih model. Pre-processing diperlukan untuk mengubah data mentah menjadi data bersih yang cocok untuk dianalisis. Pre-processing penting dilakukan karena berbagai alasan diantaranya untuk meningkatkan kualitas data, meningkatkan kinerja model dan meningkatkan efisiensi. Pada pembahasan kali ini akan menjelaskan  data collection,  data cleaning data transform dan data reduction . Data Collection Data collection adalah proses pengumpulan, pengukuran, dan analisis berbagai tipe informasi menggunakan teknik berstandar. Tujuan dari data collection adalah untuk mengumpulkan informasi dan data terpercaya sebanyak-banyaknya, yang kemudian dianalisis untuk membuat sebuah keputusan bisnis yang krusial. Ketika sudah berhasil dikumpulkan, data ini kemudian melalui sejumlah proses meliputi pembersihan dan pemrosesan data agar dapat digunakan oleh perusahaan. Dalam melakukan data collection harus diketahui dahulu beberapa poin yaitu seb...

P2 - Data Preparation dan Data Visualization

 Data Preparation Data preparation adalah langkah penting dalam proses pembersihan dan transformasi data mentah sebelum diproses dan dianalisis. Data preparation sering kali melibatkan pemformatan ulang data, melakukan koreksi terhadap data, dan menggabungkan kumpulan data untuk memperkaya data. Tujuan data preparation adalah sebagai berikut. Membantu memperbaiki kesalahan sebelum diproses Meningkatkan kualitas data Melalui data yang berkualitas akan menghasilkan keputusan yang efisien dan tepat waktu cara memanggil data adalah pertama dengan mengimpor pustaka yang diperlukan seperti Pandas. selanjutnya memanggil data yang akan digunakan, disini saya mengambil dari folder drive pribadi yang mana dapat dilihat pada gambar di bawah ini. Dari gambar tersebut data CSV dipanggil menggunakan variabel 'df' dan ditampilkan sebanyak lima data pertama dalam bentuk seperti tabel yang terdiri kolom dan baris. Data Visualization Data visualization atau visualisasi data adalah menampilkan d...

P1 - Proses atau Tahapan Data Mining

Proses data mining adalah serangkaian langkah atau tahapan yang dilakukan untuk menghasilkan wawasan atau pengetahuan yang berharga dari kumpulan data. Tahapan-tahapan ini dirancang untuk memastikan bahwa analisis data dilakukan dengan benar dan hasilnya dapat diterapkan secara efektif dalam konteks bisnis atau penelitian. Berikut adalah tahapan dalam proses data mining: 1. Pembersihan data Pembersihan data bertujuan untuk membuang atau menghilangkan data yang tidak konsisten atau dianggap sebagai noise sehingga tidak dibutuhkan untuk tahapan data mining selanjutnya. Langkah pertama dalam pembersihan data adalah mengidentifikasi dan menangani nilai yang hilang, yang dapat mempengaruhi keakuratan analisis. Setelah itu, outlier, yaitu nilai yang ekstrim, juga perlu dideteksi dan diperlakukan secara khusus karena dapat mengganggu pola umum dalam data. Selain itu, jika data yang digunakan adalah data teks, pembersihan teks dilakukan untuk menghapus karakter khusus, mengonversi teks men...