Skip to main content

Posts

P3 - Pre-processing menggunakan Google Colab

 Pre-processing merupakan hal penting sebelum melatih model. Pre-processing diperlukan untuk mengubah data mentah menjadi data bersih yang cocok untuk dianalisis. Pre-processing penting dilakukan karena berbagai alasan diantaranya untuk meningkatkan kualitas data, meningkatkan kinerja model dan meningkatkan efisiensi. Pada pembahasan kali ini akan menjelaskan  data collection,  data cleaning data transform dan data reduction . Data Collection Data collection adalah proses pengumpulan, pengukuran, dan analisis berbagai tipe informasi menggunakan teknik berstandar. Tujuan dari data collection adalah untuk mengumpulkan informasi dan data terpercaya sebanyak-banyaknya, yang kemudian dianalisis untuk membuat sebuah keputusan bisnis yang krusial. Ketika sudah berhasil dikumpulkan, data ini kemudian melalui sejumlah proses meliputi pembersihan dan pemrosesan data agar dapat digunakan oleh perusahaan. Dalam melakukan data collection harus diketahui dahulu beberapa poin yaitu seb...

P2 - Data Preparation dan Data Visualization

 Data Preparation Data preparation adalah langkah penting dalam proses pembersihan dan transformasi data mentah sebelum diproses dan dianalisis. Data preparation sering kali melibatkan pemformatan ulang data, melakukan koreksi terhadap data, dan menggabungkan kumpulan data untuk memperkaya data. Tujuan data preparation adalah sebagai berikut. Membantu memperbaiki kesalahan sebelum diproses Meningkatkan kualitas data Melalui data yang berkualitas akan menghasilkan keputusan yang efisien dan tepat waktu cara memanggil data adalah pertama dengan mengimpor pustaka yang diperlukan seperti Pandas. selanjutnya memanggil data yang akan digunakan, disini saya mengambil dari folder drive pribadi yang mana dapat dilihat pada gambar di bawah ini. Dari gambar tersebut data CSV dipanggil menggunakan variabel 'df' dan ditampilkan sebanyak lima data pertama dalam bentuk seperti tabel yang terdiri kolom dan baris. Data Visualization Data visualization atau visualisasi data adalah menampilkan d...

P1 - Proses atau Tahapan Data Mining

Proses data mining adalah serangkaian langkah atau tahapan yang dilakukan untuk menghasilkan wawasan atau pengetahuan yang berharga dari kumpulan data. Tahapan-tahapan ini dirancang untuk memastikan bahwa analisis data dilakukan dengan benar dan hasilnya dapat diterapkan secara efektif dalam konteks bisnis atau penelitian. Berikut adalah tahapan dalam proses data mining: 1. Pembersihan data Pembersihan data bertujuan untuk membuang atau menghilangkan data yang tidak konsisten atau dianggap sebagai noise sehingga tidak dibutuhkan untuk tahapan data mining selanjutnya. Langkah pertama dalam pembersihan data adalah mengidentifikasi dan menangani nilai yang hilang, yang dapat mempengaruhi keakuratan analisis. Setelah itu, outlier, yaitu nilai yang ekstrim, juga perlu dideteksi dan diperlakukan secara khusus karena dapat mengganggu pola umum dalam data. Selain itu, jika data yang digunakan adalah data teks, pembersihan teks dilakukan untuk menghapus karakter khusus, mengonversi teks men...

MENENTUKAN KARDINALITAS DAN OPSIOANLITAS

Prodi diketuai oleh dosen (one to one) 2. Dosen ploting program studi (one to one) 3.   Mahasiswa dibimbing dosen (many to one) 4.  Dosen memiliki prodi(one to one) 5.  Dosen mengampu matakuliah (one to one) 6.   Prodi memiliki kelas (many to many) 7.  Mahasiswa memilih matakuliah (many to many) 8.  mahasiswa ploting kelas (many to many) 9.  Fakultas memiliki Prodi (one to many) 10.  Mahasiswa dibimbing dosen (many to one)

atribut, entitas, dan relasi dalam ERD

Entitas Entitas adalah “sesuatu” atau “objek” di dunia nyata yang dapat dibedakan dari objek lain. contohnya antara lain entitas mahasiswa, dosen, buah, hewan dan lain sebagainya.  Entitas bisa dibagi menjadi 2 yaitu: Entitas kongkrit, Contoh : Mahasiswa, Buku Entitas abstrak, Contoh : Pinjaman, Jadwal, Nilai Atribut Entitas mempunyai elemen yang disebut atribut, berfungsi untuk mendeskripsikan karakter entitas. Misalnya atribut NIM dari entitas mahasiswa . Setiap ERD bisa terdapat lebih dari satu atribut.  Tipe-tipeAtribut sebagai berikut. Simple dan Composite attributes – Atribut Simple : Atribut sederhana yang tidak dapat dibagi dalam beberapa bagian; – Atribut Komposit : Atribut yang dapat dibagi lagi dalam beberapa bagian; contoh : Nama; yang terdiri dari Nama depan dan Nama Belakang. Single-valued dan multi-valued attributes –Atribut Single-valued : Atribut yang memiliki paling banyak satu nilai untuk setiap baris data – Multi-valued attributes : Atribut yang dapat diis...

Apa itu Basis Data

 Basis Data adalah item data yang saling berhubungan satu dengan yang lainnya yang diorganisasikan berdasarkan skema atau struktur tertentu yang dapat disimpan dalam perangkat keras (hardware) dan dengan menggunakan perangkat lunak dalam manipulasi untuk kegunaan tertentu. Basis data juga dapat diartikan sebagai kumpulan records yang saling berhubungan yang disimpan secara bersama sedemikian rupa tanpa pengulangan yang tidak perlu untuk memenuhi kebutuhan.

Apa itu Conceptual DB

Conceptual desain   Database   adalah tahapan pertama dalam desain  database .  Tujuan dari tahapan ini adalah untuk merancang  database  yang independen dari  database software  dan detail fisik. Tahapan ini akan menghasilkan,  conceptual data model  yang menjelaskan entitas data, atribut, hubungan antara tabel, dan  constraints  di suatu  database . Design ini bersifat deskriptif dan naratif .             Semua elemen dari data yang dibutuhkan dalam suatu transaksi database harus dijabarkan di modelnya, dan semua elemen data yang ada harus digunakan setidaknya satu kali di suatu transaksi  database   itu.  Conceptual database  memiliki 4 tahapan yaitu: 1.      Analisis dan persyaratan data 2.      Normalisasi dan perancangan hubungan antar entitas 3.      Verifikasi data mode...