Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad

Pembersihan data bagi gudang dan perlombongan data atau nama ringkasnya CD4SWAM merupakan satu kajian yang menggabungkan dua pangkalan data dari format berbeza menjadi satu format piawai. Pangkalan data yang telah digabungkan itu kemudiannya akan mengalami proses pembersihan data menggunakan teknik...

Full description

Bibliographic Details
Main Author: Nazatushima , Mohd Arshad
Format: Thesis
Published: 2003
Subjects:
Online Access:http://studentsrepo.um.edu.my/11363/
http://studentsrepo.um.edu.my/11363/1/nazatushima.pdf
_version_ 1848774365830709248
author Nazatushima , Mohd Arshad
author_facet Nazatushima , Mohd Arshad
author_sort Nazatushima , Mohd Arshad
building UM Research Repository
collection Online Access
description Pembersihan data bagi gudang dan perlombongan data atau nama ringkasnya CD4SWAM merupakan satu kajian yang menggabungkan dua pangkalan data dari format berbeza menjadi satu format piawai. Pangkalan data yang telah digabungkan itu kemudiannya akan mengalami proses pembersihan data menggunakan teknik nilai yang hilang (missing values). Data yang telah dibersihkan itu kemudiannya akan dimasukkan ke dalam gudang data bagi memudahkan aktiviti perlombongan data. Proses pembersihan data merupakan mengenal pasti data-data yang bermasalah dan kemudiannya diperbetulkan menjadi data berguna (maklumat) CD4WAM ini akan bertindak selaku pembantu bagi pihak pentadbir gudang data dalam mengurus serta melancarkan tugasan harian mereka. Selain itu, ia juga membantu pihak pengurusan atasan dalam membuat kesimpulan dan keputusan berasaskan kepada himpunan data yang banyak. Terdapat 3 teknik yang dugunakan dalam proses pembersihan data iaitu nilai yang hilang (missing values), kebisingan data (noisy data) dan ketidakkonsistinan (inconsistent data) CD4WAM yang bakal dihasilkan ini akan memfokus kepada teknik nilai yang hilang. Bagi merealisasikannya, perisian-perisian seperti Visual Basic 6.0, Microsoft Access 2000 dan SQL Server 7.0 digunakan. Selain itu, CD4WAM dijangka mengelakan kesukaran capaian kembali maklumat yang diperlukan oleh pihak pentadbiran syarikat. Di samping itu juga, ia memastikan agar hanya maklumat yang berguna sahaja yang terdapat di dalam gudang data. Oleh itu, adalah diharapkan agar CD4WAM ini mampu memberi manfaat kepada pihak pentadbir gudang data dan menjadi salah satu sumber penting bagi memperolehi maklumat serta penyelenggaraan data.
first_indexed 2025-11-14T13:57:09Z
format Thesis
id um-11363
institution University Malaya
institution_category Local University
last_indexed 2025-11-14T13:57:09Z
publishDate 2003
recordtype eprints
repository_type Digital Repository
spelling um-113632020-07-07T17:51:59Z Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad Nazatushima , Mohd Arshad QA75 Electronic computers. Computer science Pembersihan data bagi gudang dan perlombongan data atau nama ringkasnya CD4SWAM merupakan satu kajian yang menggabungkan dua pangkalan data dari format berbeza menjadi satu format piawai. Pangkalan data yang telah digabungkan itu kemudiannya akan mengalami proses pembersihan data menggunakan teknik nilai yang hilang (missing values). Data yang telah dibersihkan itu kemudiannya akan dimasukkan ke dalam gudang data bagi memudahkan aktiviti perlombongan data. Proses pembersihan data merupakan mengenal pasti data-data yang bermasalah dan kemudiannya diperbetulkan menjadi data berguna (maklumat) CD4WAM ini akan bertindak selaku pembantu bagi pihak pentadbir gudang data dalam mengurus serta melancarkan tugasan harian mereka. Selain itu, ia juga membantu pihak pengurusan atasan dalam membuat kesimpulan dan keputusan berasaskan kepada himpunan data yang banyak. Terdapat 3 teknik yang dugunakan dalam proses pembersihan data iaitu nilai yang hilang (missing values), kebisingan data (noisy data) dan ketidakkonsistinan (inconsistent data) CD4WAM yang bakal dihasilkan ini akan memfokus kepada teknik nilai yang hilang. Bagi merealisasikannya, perisian-perisian seperti Visual Basic 6.0, Microsoft Access 2000 dan SQL Server 7.0 digunakan. Selain itu, CD4WAM dijangka mengelakan kesukaran capaian kembali maklumat yang diperlukan oleh pihak pentadbiran syarikat. Di samping itu juga, ia memastikan agar hanya maklumat yang berguna sahaja yang terdapat di dalam gudang data. Oleh itu, adalah diharapkan agar CD4WAM ini mampu memberi manfaat kepada pihak pentadbir gudang data dan menjadi salah satu sumber penting bagi memperolehi maklumat serta penyelenggaraan data. 2003 Thesis NonPeerReviewed application/pdf http://studentsrepo.um.edu.my/11363/1/nazatushima.pdf Nazatushima , Mohd Arshad (2003) Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad. Undergraduates thesis, University of Malaya. http://studentsrepo.um.edu.my/11363/
spellingShingle QA75 Electronic computers. Computer science
Nazatushima , Mohd Arshad
Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_full Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_fullStr Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_full_unstemmed Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_short Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_sort pembersihan data untuk gudang dan perlombongan data (cleaning data for warehousing and mining) / nazatushima mohd arshad
topic QA75 Electronic computers. Computer science
url http://studentsrepo.um.edu.my/11363/
http://studentsrepo.um.edu.my/11363/1/nazatushima.pdf