1. Organisasi Data
Ø Organisasi Data
Ø Organisasi Data
Data bisnis telah diorganisasikan menjadi
hirarki yang terdiri dari data field,catatan, dan file. Data
field adalah unit data terkecil. Contohnya, kode mata kuliah yang sedang diambil. Catatan adalah suatu kumpulan data field yang berhubungan seperti (MIS105) kode mata kuliah yang akan
memiliki hubungan dengan nama mata kuliah. File adalah suatu kumpulan
catatan yang berhubungan, seperti satu file dari seluruh catatan yang berisi field kode-kode mata kuliah dan namanya, seperti
Tabel 6.1 adalah satu contoh file yang dapat disebut MATA
KULIAH.
Basis
data adalah sekumpulan file. Definisi umum dari basis data adalah kumpulan
dari seluruh data basis komputer sebuah perusahaan. Definisi basis data lebih sempit adalah kumpulan data yang berada di bawah kendali peranti lunak sistem manajemen basis data, seperti data perusahaan yang dikendalikan dan diadministrasikan oleh sistem manajemen basis data tetapi berbeda dengan bila file komputer yang terdapat di dalam komputer pribadi seorang manajer dianggap di luar basis data.
Ø Spreadsheet sebagai Basis Data Sederhana
dari seluruh data basis komputer sebuah perusahaan. Definisi basis data lebih sempit adalah kumpulan data yang berada di bawah kendali peranti lunak sistem manajemen basis data, seperti data perusahaan yang dikendalikan dan diadministrasikan oleh sistem manajemen basis data tetapi berbeda dengan bila file komputer yang terdapat di dalam komputer pribadi seorang manajer dianggap di luar basis data.
Ø Spreadsheet sebagai Basis Data Sederhana
Tabel yang berisi baris dan kolom dapat disajikan
dalam suatu spreadsheet. Kolom dalam spreadsheet mencerminkan field data sedangkan judul kolom berisi
nama-nam field data. Baris-baris
dalam tabel berisi nilai-nilai field. Figur 6.1 menggambarkan speadsheet Excel yang berisi nilai-nilai dari tabel MATA KULIAH.
Konsep tabel merupakan konsep yang penting, karena struktur basis data yang
paling populer bagi organisasi bisni, struktur
basis data relasional, secara konseptual serupa dengan sekumpulan tabel
yang saling berhubungan.
Ø Flat Files
Flat
files (file datar) adalah suatu tabel yang tidak memiliki kolom-kolom yang
berulang. Lihatlah 6.2 huruf-huruf pada kode mata kuliah yang menunjukkan
bidang akademis telah dipisahkan dan ditempatkan pada satu kolom terpisah. Mata
kuliah untuk bidang akademis disajikan sebagai kolom dalam baris yang sama.
Kolom-kolom untuk kode mata kuliah dan uraiannya mengalami pengulangan sehingga
tabel tersebut bukanlah flat file. Kolom-kolom
yang berulang melanggar persyaratan bagi flat
file. Alasan dari sebuah tabel harus menjadi flat file adalah karena komputer membaca field-field data dari suatu record
secara berurutan.
Alasan kedua untuk
flat file adalah memungkinkan
struktur basis data relasional untuk dinormalisasi. Normalisasi adalah suatu proses formal untuk menghapus field data yang berulang sambil tetap
menjaga kemampuan basis data untuk menambah, mengubah, dan menghapus tanpa
menyebabkan kesalahan.
Ø Field-field Kunci
Tabel 6.3 menunjukkan
nilai-nilai dalam tabel BUKU dan menggambarkan
konsep dari suatu kunci. Kunci
(key) di dalam suatu tabel adalah satu field
yang berisi satu nilai yang unik mengidentifikasi masing-masing record. Artinya setiap baris dalam tabel
akan teridentifikasi secara unik. Satu field
dalam banyak kasus dapat menjadi kunci bagi suatu tabel. Nilia field ISBN adalah “X125”, sehingga
mengetahui nilai field JUDUL adalah
“Contoh-contoh Basis Data”. Field ISBN
adalah field kunci.
Terlihat bahwa nilai dari field JUDUL dapat mengidentifikasi setiap baris. Akan tetapi, judul
“Manajemen Bisnis” muncul dua kali, sehingga komputer tidak dapat mengetahui
apakah nilai ISBN untuk “P1963” atau “A129” yang seharusnya dipergunakan.
Beberapa tabel mungkin memiliki dua field
yang merupakan kandidat untuk menjadi kunci. Kandidat kunci adalah sebuah field
yang secara unik mengidentifikasi masing-masing baris tabel namun tidak
dipilih untuk menjadi kunci. Dalam tabel MATA KULIAH yang telah dijelaskan
dalam Tabel 6.1, field Uraian akan mengidentifikasi masing-masing baris. Field Kode yang dipilih menjadi kunci.
Nilai field yang panjang (seperti field Uraian versus field seperti Kode)
dihindari, karena memiliki risiko salah ketik lebih tinggi.
Tabel
6.4 menunjukkan proyek, namun tidak terdapat
satu nilai field data yang
teridentifikasi setiap baris. Nilai dalam kolom field Kode berulang di antara baris-baris. Tetapi, nilai-nilai
dalam field Kode dan Angka dikombinasikan, nilai hasil
kombinasi menjadi unik.
Ø Tabel-tabel yang Berhubungan
Hubungan
antar tabel-tabel MATA KULIAH dan PROYEK (Tabel 6.1 dan 6.4). Tabel tersebut
berbagi satu field yang sama, yaitu Kode dan nilai field Kode menentukan baris mana di dalam tabel yang tergabung.
Misalnya, ingin mengetahui proyek yang diisyaratkan untuk mata kuliah berjudul
“Literasi Sistem Informasi”, maka harus menemukan nilai yang cocok di field data yang dimilki kedua tabel.
“MIS105” adalah nilai field Kode di
dalam tabel PROYEK menunjukkan mata kuliah “Literasi Sistem Informasi”.
Sehingga, terhubung dengan nilai field
Kode di dalam tabel PROYEK yang menunjukkan mata kuliah “Literasi Sistem
Informasi” memiliki proyek tertentu “Pembuatan Home Page” dan “Bekerja dengan menggunakan Windows.
Tabel
6.5 tabel JURUSAN menunjukkan enam jurusan yang menawarkan mat kuliah dalam
tabel MATA KULIAH. Kedua tabel ini tidak berbagi kolom yang sama. Sehingga akan
menambahkan field Singkatan pada
tabel MATA KULIAH sehingga kedua tabel akan dapat digabungkan oleh satu field yang sama. Tabel 6.6 menunjukkan
tabel MATA KULIAH setelah ditambahkan Singkatan.
Lalu, seorang mahasiswa yang mengalami kesulitan dalam mata kuliah
“Pengantar Pemasaran” dapat mencocokkan nilai field Singkatan “MGTMKT” di dalam tabel MATA KULIAH dengan nilai field Singkatan “MGTMKT” di tabel JURUSAN dan menghubungi
“910-4500” untuk mendapatkan bantuan.
Tabel 6.5
Tabel 6.6
2. Struktur Basis Data
Istilah
database mengacu
pada semua data yang disimpan pada
sumber daya yang berbasis komputer milik organisasi. Sistem manajemen database (DBMS)
adalah suatu aplikasi perangkat lunak yang menyimpan struktur database, data
itu sendiri, hubungan antar data didalam database,
maupun fomulir dan laporan.
Ø Struktur Database Hierarkis
Sistem manajemen database mempunyai sejarah pendek.
Sistem pertama adalah IDS (Integrated Data Store), sistem ini
mempengaruhi kerja Comitte. Database IDS
mengikuti struktur database hierarkis
yaitu struktur kelompok data, subkelompok data, dan subkelompok cabang.
Struktur database hierarkis populer
karena bekerja sangat baik dengan sistem pemrosesan transaksi, dan aplikasi
informasi akuntansi. Tugas akuntansi adalah salah satu operasi bisnis pertama
yang dikomputerisasi.
Ø Struktur Database Jaringan
Struktur ini
memungkinkan satu catatan tertentu menunjuk catatan lain dalam database. Secara konseptual, tiap catatan
dalam database dapat memiliki
penunjuk ke tiap catatan lain dalam database.
Ø Struktur Database Relasional
Konsep dari
suatu struktur basis data yang terdiri atas table-tabel dimana relasi terbentuk
secara implisit dengan kecocokan nilai-nilai dalam field data yang sama, akan mudah untuk dipergunakan dan dipahami.
Contoh database relasional, misalkan senat mahasiswa ingin
membantu para mahasiswa menjual buku bekas mereka kepada mahasiswa yang
membutuhkannya. Dua minggu sebelum akhir semester senat mahasiswa menerima
daftar buku yang akan diperlukan mahasiswa semester depan. Seorang anggota
senat membuat tabel bernama BUKU dalam database
yang berisi nama buku, pengarang buku, dan jumlah buku yang diperlukan
untuk semester depan. Tabel 9.6 memperlihatkan isi tabel BUKU.
Seminggu sebelum akhir
semester para mahasiswa diminta untuk mendaftarkan buku yang ingin dijual.
Tabel 9.7 menunjukkan nilai-nilai dari field
nomor mahasiswa (ID), field nama
keluarga, nama depan, dan nama buku yang dijual. Tabel buku secara implisit
berhubungan dengan tabel MAHASISWA melalui kolom bersama “NamaBuku”. Dan berapa
mahasiswa yang mempunyai buku karangan McLeod dan Schell? Pertanyaan ini
memerlukan hubungan antara BUKU dan MAHASISWA.
Pemakai
database dapat
berupa orang atau program aplikasi, menggunakan database dari komputer personal dan mengambil data dan informasi
dengan menggunakan query language atau
laporan yang telah dirancang. Query language seperti SQL, adalah
sarana memenuhi permintaan. Gambar
dibawah ini memperlihatkan query-by-example
spesifik yang menanyakan siapa saja mahasiswa yang memiliki buku Banking Principles untuk dijual. Contoh Output OLAP: Harga Pembelian Rata-rata
On-line
analytical processing (OLAP) menjadi fitur umum dalam
perangkat lunak sistem manajemen database.
Para penjual memasukkan fitur untuk memungkinkan analisis data yang serupa
dengan tabulasi statistik.
Ø Suatu
Model Sistem Manajemen DATABASE
Model yang menunjukkan elemen utama meliputi data description language processor, performance statistic
processor, modul backup/recovery, dan manajer database. Data description language processor mengubah kamus data menjadi
skema database. Performance statistic processor memelihara statistik yang
mengidentifikasi data apa yang sedang digunakan, siapa yang menggunakan, dan
seterusnya seperti memecah tabel besar menjadi dua tabel terpisah (satu tabel
catatan yang jarang ditanyakan dan tabel kedua sebaliknya).
Suatu salinan cadangan (backup
copy) dari database dibuat secara
periodik, umumnya harian. Saat transaksi selanjutnya diproses terhadap file master, suatu log transaksi menyimpan catatan dari
semua perubahan. Kemuadian saat terjadi bencana, log transaksi diproses terhadap backup
database untuk merekonstruksi
database. Modul backup/recovery menyelesaikan
rekonstruksi ini. Manajer
database menangani permintaan data para pemakai.
Ø Pengelola
Database
Orang yang bertanggung jawab atas database. Tugas DBA:
- Perencanaan database meliputi kerja sama dengan para manajer untuk mendefinisikan skema perusahaan dan dengan para pemakai untuk mendefinisikan subskema.
- Penerapan database mencakup penciptaan database yang sesuai spesifikasi dari DBMS yang dipilih, menetapkan dan menegakkan kebijakan serta prosedur penggunaan database.
- Operasi database mencakup menawarkan program-program pendidikan bagi pemakai database dan menyediakan bantuan.
- Keamanan database meliputi pemantauan kegiatan database dengan menggunakan statistik yang disediakan DBMS.
Ø
Penemuan Pengetahuan dalam Database
Ø Data Warehousing
Adalah perkembangan dari konsep database yang menyediakan suatu sumber
daya data yang lebih baik dan memungkinkan pemakai memanipulasi dan menggunakan
data secara intuitif.
Ø Data Mart
Suatu database
yang berisi data yang hanya menjelaskan satu segmen dari operasi
perusahaan, misalnya suatu perusahaan memiliki data mart pemasaran, sumber daya data (warehouse).
Ø Data Mining
Adalah proses menemukan hubungan dalam data
yang tidak diketahui oleh pemakainya. Data ini membantu pemakai dengan
mengungkapkan berbagai hubungan dan menyajikan dalam suatu cara yang dapat
dimengerti sehingga dapat menjadi dasar pengambilan keputusan. Misalkan bank
memutuskan untuk menawarkan reksa dana
ke pelanggan. Ada jenis Data mining:
ü Data mining berdasarkan verifikasi
Satu pendekatan adalah para manajer
mengidentifikasi karakteristik yang mereka yakin dimiliki oleh pasar sasaran.
Misalkan para manejer ingin mengarah pada pasangan muda, berpenghasilan ganda,
dan kaya. Query dapat dimasukkan ke
dalam DBMS dan catatan yang tepat dapat dipanggil. Kekurangan pendekatan ini
adalah proses pemanggilan kembali diarahkan sepenuhnya oleh pemakai. Informasi
yang dipilih tidak lebih baik.
ü Data mining berdasarkan penemuan
Sistem ini menganalisis database, mencari kelompok dengan karakteristik umum. Misalnya
bank, sistem data mining mungkin
mengidentifikasi bukan hanya kelompok pasangan muda tetapi juga pasangan yang
sudah pensiun yang bergantung pada jaminan sosial dan pensiun.
ü Kombinasi dat mining verifikasi dan penemuan
Perkembangan data mining di masa depan mengkombinasikan pendekatan hipotesis dan
penemuan. Pengembangannya menggunakan penalaran yang sama yang mendasari konsep
sistem pendukung keputusan (DSS-decision
support system). Konsep tersebut memungkinkan pemakai dan komputer bekerja
sama menyelesaikan masalah. Pemakai menerapkan keahlian dalam area masalah, dan
komputermelakukan analisis data yang canggih untuk memilih data yang tepat dan
menempatkannya dalam format yang tepat untuk pengambilan keputusan.
·
Proses KDD
Langkah-langkah proses KDD:
- Mendefinisikan data dan tugas. Pemakai dapat bekerja sama dengan seorang pengelola database dan seorang analis sistem mengidentifikasi data apa yang diperlukan untuk memberikan dukungan pemakai yang diperlukan dalam area masalah tertentu.
- Mendapatkan data. Mengumpulkan data baru dan memasukkan ke dalam database.
- Membersihkan data. Semua data yang digunakan di edit untuk memastikan data ada dalam format yang tepat. Misal, inkonsistensi nama dan kode disesuaikan.
- Mengembangkan hipotesis dan model pencarian. Pemakai dan spesisalis informasi mendefinisikan karakteristik data yang akan dipanggil, dan spesialis menyediakan model matematika untuk membantu pemanggilan kembali dan analisis.
- Menggali data itu. Model menguji hipotesis dan mencari pola baru dan pengetahuan baru.
- Menguji dan memastikan. Model prediksi untuk memastikan data yang dipilih digunakan untuk mencapai tujuan pemakai.
- Menafsirkan dan menggunakan. Menggunakan pertimbangan menafsirkan data dan membuat keputusan yang diperlukan.
4. Menempatkan Sistem
Manajemen Basis Data dalam Perspektif.
Sistem manajemen database memungkinkan penciptaan database dalam penyimpanan akses acak komputer, pemeliharaan
isinya, dan penyediaan isi bagi pemakai tanpa pemrograman khusus yang mahal.
Kemudahan penggunaanya dapat membantu mengakses isi database tanpa pelatihan
mahal.
Ø Keuntungan DBMS
1. Mengurangi
pengulangan data
Jumlah total file dikurangi,
dibandingkan bila file komputer disimpan terpisah di tiap aplikasi komputer, dengan
menghapus data duplikasi di berbagai file.
Data duplikat file selebihnya
ditempatkan dalam satu file kecuali diperlukan untuk membentuk hubungan
implisit.
2. Mencapai
independensi data
Spesifikasi
data disimpan dalam skema dari pada dalam tiap program aplikasi. Perubahan
dapat dibuat pada struktur data tanpa mempengaruhi program yang mengakses data.
3. Mengintegrasikan
data dari beberapa file
Saat
file dibentuk sehingga menyediakan
kaitan logis, organisasi fisik tidak lagi menjadi kendala. Organisasi logis,
pandangan pemakai dan program aplikasi, tidak harus tercermin pada medium
penyimpanan fisik.
4. Mengambil
data dan informasi secara cepat
Hubungan
logis, data manipulation language, query
language memungkinkan pemakai mengambil data dalam hitungan detik atau
menit , seperti COBOL (memerlukan beberapa jam atau hari mengambil data karena
tidak ditulis untuk mengkases data.
5. Meningkatkan
keamanan
DBMS
mainframe maupun komputer mikro dapat
menyertakan beberapa lapis keamanan seperti kata sandi, directory pemakai, dan bahasa sandi.
Ø Kerugian DBMS
1. Memperoleh
perangkat lunak yang mahal
DBMS
mainframe merupakan pengeluaran yang
besar bagi organisasi kecil. Untungnya, hukum Moore masih berlaku sehingga
biaya perangkat terus turun.
2. Memperoleh
konfigurasi perangkat keras yang besar
DBMS memerlukan kapasitas penyimpanan
dan memori yang lebih besar, kemudahan menarik informasi mendorong lebih banyak
pengguna sehingga menyebabkan meningkatnya sumber daya komputer untuk mengakses
basis data.
3. Memperkerjakan
dan mempertahankan staf DBA
DBMS
menuntut pengetahuan khusus agar dapat memanfaatkan secara penuh dan
pengetahuan paling baik diberikan oleh administrator basis data.
No comments:
Post a Comment