Skripsi Pengembangan Aplikasi Text Mining Untuk Mengubah File Teks Yang Menggunakan Bahasa Alay Ke Dalam Bahasa Indonesia Yang Sesuai EYD
SKIRPSI - APLIKASI TEXT MINING UNTUK MENGKONVERSI BAHASA ALAY KE DALAM BAHASA INDONESIA BERBASIS WEB
Bahasa alay merupakan bahasa pergaulan anak remaja yang berasal dari
kelompok-kelompok tertentu yang sering disebut dengan anak layangan (anak
kampung). Bahasa ini tidak mempunyai aturan penulisan yang pasti karena
cenderung menggunakan gaya bahasa santai dan tidak memperhatikan norma
kesopanan. Uniknya, bahasa pergaulan yang sebenarnya diciptakan untuk kalangan
terbatas justru berkembang menjadi bahasa pergaulan yang digunakan bahasa
sehari-hari. Keberadaan bahasa alay
sudah mengubah gaya hidup generasi muda khusunya anak remaja pelajar.
Dampak dari kebiasaan menggunakan
bahasa alay di kalangan anak remaja
pelajar juga akan mempengaruhi pemilihan kata pada saat penulisan file laporan atau file dokumen lainnya yang notabene harus bersifat formal. Secara
tidak sadar terkadang mereka menggunakan kata-kata alay atau cenderung menyingkat kata yang tidak biasa dalam laporan
yang dibuatnya, yang tentunya tidak sesuai dengan kaidah penulisan bahasa
Indonesia yang sesuai dengan EYD. Berdasarkan uraian
tersebut, penulis bermaksud untuk mengembangkan aplikasi yang mampu mengubah
bahasa alay ke dalam bahasa Indonesia
yang sesuai dengan EYD (Ejaan Yang Disempurnakan) dengan menggunakan algoritma text mining
dalam sebuah file teks. Sistem akan
mengembalikan hasil pencarian kepada user
yang berupa list dari kata-kata
bahasa alay yang ditemukan dari
dokumen serta mengganti kata-kata tersebut secara otomatis.
Sistem ini dikembangkan dengan menggunakan script PHP, AJAX sebagai bahasa pemrograman, dan
MySQL sebagai
pengolah database. Dengan adanya
sistem ini diharapkan dapat memberikan kemudahan kepada manusia khususnya
kalangan intelektual untuk mengecek dan mengubah keberadaan bahasa alay
dalam dokumen yang dibuatnya.
Kata kunci: Penelitian pengembangan, bahasa alay, EYD, text
mining, file teks, dokumen.
SKRIPSI
DIAJUKAN UNTUK MELENGKAPI TUGAS-TUGAS DAN
Menyetujui,
Pembimbing I,
Made Windu Antara Kesiman,
S.T., M.Sc NIP 19821111
200812 1 001
|
Pembimbing II,
I Gede Mahendra Darmawiguna, S.Kom., M.Sc
NIP 19850104 201012 1 004
|
Skripsi oleh Kadek Anggaradana ini
telah dipertahankan di depan dewan penguji
pada tanggal 4 Februari 2013
Dewan Penguji
I Made Gede
Sunarya, S. Kom., M. Cs. Ketua
NIP 198307252008011008
Made Windu Antara Kesiman, S.T., M.Sc., Anggota
NIP 19821111 2008121001
I Gede
Mahendra Darmawiguna, S.Kom., M.Sc., Anggota
NIP 19850104 2010121004
Diterima oleh Panitia Ujian Fakultas Teknik dan Kejuruan Universitas Pendidikan Ganesha Singaraja guna memenuhi syarat-syarat untuk memenuhi gelar Sarjana Pendidikan
pada:
Hari :
.................................................
Tanggal :
.................................................
Mengetahui:
Ketua
Ujian,
I Gede Sudirtha, S.Pd.,
M.Pd
NIP 197106161996021001
|
Sekretaris
Ujian,
Made Windu
Antara Kesiman, S.T., M.Sc.
NIP 19821111 2008121001
|
Mengesahkan
Dekan Fakultas Teknik dan Kejuruan
Dra. I Dewa Ayu Made Budyani, M.Pd
NIP 1965012619921102001
|
PERNYATAAN
Dengan ini saya menyatakan bahwa karya tulis yang
berjudul “Pengembangan Aplikasi Text Mining untuk Mengubah File Teks yang Menggunakan Bahasa Alay ke dalam Bahasa Indonesia yang
sesuai EYD” beserta seluruh isinya adalah benar-benar karya sendiri, dan saya tidak
melakukan penjiplakan dan mengutip dengan cara-cara yang tidak sesuai dengan
etika yang berlaku dalam masyarakat keilmuan. Atas pernyataan ini, saya siap
menanggung risiko/sanksi yang dijatuhkan kepada saya apabila kemudian ditemukan
adanya pelanggaran atas etika keilmuan dalam karya saya ini, atau ada klaim
terhadap keaslian karya saya ini.
Singaraja, 4 Februari 2013
Yang membuat pernyataan,
Kadek Anggaradana
|
Motto
PRAKATA
Puji syukur penulis panjatkan kehadapan
Tuhan Yang Maha Esa karena atas berkat dan rahmat-Nya penulis dapat
menyelesaikan skripsi yang berjudul “Pengembangan Aplikasi Text Mining untuk Mengubah File Teks yang Menggunakan Bahasa Alay ke dalam Bahasa Indonesia yang
sesuai EYD” tepat
pada waktunya.
Dalam penulisan skripsi ini, penulis
memperoleh banyak bantuan, petunjuk, bimbingan dan segala fasilitas pendukung
lainnya sehingga dapat memperlancar penyelesaian skripsi ini. Maka melalui
kesempatan yang baik ini penulis ingin menyampaikan terimakasih kepada:
1.
Ibu Dra. I Dewa Ayu Made
Budyani, M.Pd., selaku Dekan Fakultas Teknik dan Kejuruan, telah memberikan pengarahan
baik selama perkuliahan maupun dalam penyusunan skripsi ini.
2.
Bapak Made Windu Antara Kesiman, S.T., M.Sc., selaku Ketua Jurusan Pendidikan Teknik Informatika sekaligus sebagai pembimbing
I yang telah memberikan motivasi,
bimbingan, arahan, dan petunjuk dalam menyelesaikan skripsi ini.
3.
Bapak I Gede Mahendra Darmawiguna, S.Kom., M.Sc., selaku dosen pembimbing II yang telah memberikan bimbingan, arahan,
petunjuk dan motivasi dalam menyelesaikan skripsi ini.
4. Staf dan dosen pengajar di lingkungan FTK
khususnya Jurusan Pendidikan Teknik Informatika.
5. Bapak, Ibu, kakak beserta
seluruh keluarga besar penulis yang teramat banyak membantu penulis baik dalam
pembuatan skripsi ataupun mendukung penulis baik secara moral atau materi
sehingga penulis dapat menyelesaikan skripsi ini tepat pada waktunya.
6. Luh Eni Indrayani kekasih
tercinta yang selalu setia mendampingi dan sekaligus memberikan dukungan serta
inspirasi sehingga skripsi ini dapat diselesaikan tepat pada waktunya.
7. Adi, Ayux, Melon_Crew,
keluarga besar ICT SMAN 3 Singaraja dan semua teman-teman yang tidak bisa
penulis sebutkan satu persatu, yang selalu memberikan semangat dan inspirasi
sehingga skripsi ini dapat diselesaikan tepat pada waktunya.
8. Notebook penulis yang setia membantu dalam pengerjaan siang ataupun
malam, serta motor penulis yang setia membantu penulis.
9. Semua pihak yang telah
bersedia untuk membantu dalam penyusunan skripsi ini.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna
sehingga pada kesempatan ini pula penulis mengharapkan adanya kritik serta
saran-saran dari pembaca demi penyempurnaan di masa
yang akan datang. Semoga skripsi ini dapat memberi manfaat, baik bagi penulis
maupun bagi para pembaca.
Singaraja, 4 Februari 2013
Penulis
PENGEMBANGAN APLIKASI TEXT MINING UNTUK MENGUBAH FILE TEKS YANG MENGGUNAKAN BAHASA ALAY KE DALAM BAHASA INDONESIA YANG SESUAI EYD
Oleh
Kadek Anggaradana, NIM 1015057121
Jurusan
Pendidikan Teknik Informatika
Email:
angara_dana@ymail.com
ABSTRAK
Bahasa alay merupakan bahasa pergaulan anak remaja yang berasal dari
kelompok-kelompok tertentu yang sering disebut dengan anak layangan (anak
kampung). Bahasa ini tidak mempunyai aturan penulisan yang pasti karena
cenderung menggunakan gaya bahasa santai dan tidak memperhatikan norma
kesopanan. Uniknya, bahasa pergaulan yang sebenarnya diciptakan untuk kalangan
terbatas justru berkembang menjadi bahasa pergaulan yang digunakan bahasa
sehari-hari. Keberadaan bahasa alay
sudah mengubah gaya hidup generasi muda khusunya anak remaja pelajar.
Dampak dari kebiasaan menggunakan
bahasa alay di kalangan anak remaja
pelajar juga akan mempengaruhi pemilihan kata pada saat penulisan file laporan atau file dokumen lainnya yang notabene harus bersifat formal. Secara
tidak sadar terkadang mereka menggunakan kata-kata alay atau cenderung menyingkat kata yang tidak biasa dalam laporan
yang dibuatnya, yang tentunya tidak sesuai dengan kaidah penulisan bahasa
Indonesia yang sesuai dengan EYD. Berdasarkan uraian
tersebut, penulis bermaksud untuk mengembangkan aplikasi yang mampu mengubah
bahasa alay ke dalam bahasa Indonesia
yang sesuai dengan EYD (Ejaan Yang Disempurnakan) dengan menggunakan algoritma text mining
dalam sebuah file teks. Sistem akan
mengembalikan hasil pencarian kepada user
yang berupa list dari kata-kata
bahasa alay yang ditemukan dari
dokumen serta mengganti kata-kata tersebut secara otomatis.
Sistem ini dikembangkan dengan menggunakan script PHP, AJAX sebagai bahasa pemrograman, dan
MySQL sebagai
pengolah database. Dengan adanya
sistem ini diharapkan dapat memberikan kemudahan kepada manusia khususnya
kalangan intelektual untuk mengecek dan mengubah keberadaan bahasa alay
dalam dokumen yang dibuatnya.
Kata kunci: Penelitian pengembangan, bahasa alay, EYD, text
mining, file teks,
dokumen.
DAFTAR ISI
LAMPIRAN....................................................................................................... 125
DAFTAR TABEL
Tabel 4.6 Sample Uji Kasus White Box Testing........................................................
DAFTAR GAMBAR
Gambar 3.21 Form Menu Kiri Administrator............................................................
DAFTAR LAMPIRAN
BAB I
PENDAHULUAN
1.1 LATAR BELAKANG
Pada
kehidupan sehari-hari bahasa memberikan peranan yang penting sebagai alat untuk
berkomunikasi. Komunikasi akan menumbuhkan adanya konsep diri,
pengaktualisasian diri, serta dapat memupuk hubungan dengan orang lain. Hakikat
komunikasi adalah proses pernyataan pikiran atau perasaan seseorang kepada orang lain dengan
menggunakan bahasa sebagai alat penyalurnya.
Dalam
proses komunikasi, bahasa sebagai lambang verbal paling banyak dan paling
sering digunakan. Bahasa dapat didefinisikan sebagai seperangkat simbol, dengan
aturan untuk mengkombinasikan simbol-simbol tersebut, yang digunakan dan
dipahami suatu komunitas. Atau bisa diartikan sebagai penggunaan kode yang
merupakan gabungan fonem sehingga membentuk kata dengan aturan sintaks untuk
membentuk kalimat yang memiliki arti.
Bahasa
dan masyarakat akan selalu menjadi pasangan yang mengisi satu sama lain, karena
adanya interaksi sosial yang menggunakan bahasa sebagai alat komunikasi,
sebenarnya masih ada alat lain untuk berkomunikasi akan tetapi bahasa mungkin
yang terbaik dalam berkomunikasi. Didalamnya ada penutur dan
juga tindak tutur, bahasa yang bersifat universal
sangat memungkinkan untuk melahirkan kata-kata atau padanan baru dalam bahasa
tersebut.
Bahasa
hanya bisa muncul akibat adanya interaksi sosial. Dalam interaksi sosial
terjadi saling pengaruh mempengaruhi. Dalam proses interaksi, orang yang lebih
aktif melakukan komunikasi akan mendominasi interaksi tersebut. Maka tidak
heran apabila suatu bahasa lebih banyak dipakai, maka bahasa itu akan
berkembang.
Saat
ini kita sudah sangat sering dan sangat familiar sekali dengan yang namanya
komunitas anak layangan atau yang lebih dikenal dengan nama alay. Alay itu sendiri adalah singkatan
dari Anak layangan, Alah lebay, Anak Layu, atau Anak kelayapan yang
menghubungkannya dengan anak jarpul (Jarang Pulang). Tapi yang paling santer
adalah anak layangan. Dominannya, istilah ini untuk menggambarkan anak yang sok
keren, secara fashion, karya (musik)
maupun kelakuan secara umum. Konon asal usulnya, alay dapat diartikan sebagai “anak
kampung”, karena anak kampung yang rata-rata berambut merah dan berkulit
sawo gelap karena kebanyakan main layangan. Gejala anak layang ini biasanya
ditunjukan dengan cara mengubah gaya tulisan, dan gaya berpakain, sekaligus
meningkatkan kenarsisan.
Bahasa
alay dapat diartikan sebagai variasi
bahasa yang bersifat sementara yang biasanya berupa singkatan menggabungkan
huruf dengan angka, memperpanjang atau memperpendek dan mencampurkan huruf
besar dan kecil membentuk sebuah kata maupun kalimat. Bahasa alay lebih sering digunakan oleh
anak-anak remaja seumuran SMP, SMU maupun mahasiswa, yang secara tidak langsung
bahasa tersebut menjadi suatu budaya. Uniknya, bahasa pergaulan yang sebenarnya
diciptakan untuk kalangan terbatas justru berkembang menjadi bahasa pergaulan
yang digunakan bahasa sehari-hari. Hal itu, karena terjadi kebocoran ragam
bahasa. Bocor dari kelompok sosial tertentu ke kelompok sosial lainnya.
Dampak
dari kebiasaan menggunakan bahasa alay
juga akan mempengaruhi pemilihan kata pada saat penulisan file laporan atau file
dokumen lainnya yang notabene harus bersifat formal (sesuai dengan kaidah
penulisan bahasa Indonesia yang baik dan benar). Secara tidak sadar terkadang
mereka menggunakan kata-kata alay
atau cenderung menyingkat kata yang tidak biasa dalam laporan yang dibuatnya,
yang tentunya tidak sesuai dengan kaidah penulisan bahasa Indonesia yang baik
dan benar. Atau dengan kata lain bahasa alay
dapat mempengaruhi penggunaan bahasa sehari-hari sehingga mempengaruhi bahasa
tulis anak-anak muda.
Langkah
awal yang bisa dilakukan untuk mengetahui apakah dalam suatu file dokumen mangandung bahasa alay atau tidak adalah dengan cara
mengecek isi file dokumen dari awal
sampai akhir dan kemudian mengganti kata alay
tersebut dengan kata baku yang sesuai dengan bahasa Indonesia yang baik dan
benar. Jika hal tersebut dilakukan secara manual bukanlah merupakan suatu
pekerjaan yang rumit, asalkan kita sudah mengetahui karakteristik atau
bentuk-bentuk dari bahasa alay. Namun
yang menjadi permasalahan adalah apabila isi dan jumlah dari file dokumen dalam satuan besar, maka
kita akan menghabiskan banyak waktu hanya untuk mengecek apakah di dalam
dokumen masih terdapat bahasa alay
atau tidak.
Berdasarkan uraian tersebut, penulis bermaksud untuk
mengembangkan aplikasi yang mampu mengubah bahasa alay ke dalam bahasa Indonesia yang sesuai dengan EYD (Ejaan Yang
Disempurnakan) dengan menggunakan algoritma text
mining dalam sebuah file teks. Sistem ini nantinya
diharapkan mampu membantu seorang penulis untuk mengecek apakah dalam file dokumen yang dibuatnya masih
mengandung bahasa alay atau tidak. Sistem
akan mengembalikan hasil pencarian kepada user
yang berupa list dari kata-kata
bahasa alay yang ditemukan dari
dokumen tersebut dan kemudian sistem mengganti kata-kata tersebut secara
otomatis.
1.2 RUMUSAN MASALAH
Berdasarkan uraian latar belakang tersebut, maka dapat dirumuskan
permasalahan untuk dicari solusinya adalah sebagai berikut.
1. Bagaimana rancang bangun
pengembangan aplikasi text mining
untuk mengubah file teks yang
menggunakan bahasa alay ke dalam
bahasa Indonesia yang sesuai EYD?
2. Bagaimana implementasi
rancangan pengembangan aplikasi text mining
untuk mengubah file teks yang
menggunakan bahasa alay ke dalam
bahasa Indonesia yang sesuai EYD?
1.3 BATASAN MASALAH
Adapun batasan masalah dari pembuatan tugas akhir ini adalah:
1. Preprocessing hanya
dilakukan pada file dokumen teks yang
menggunakan bahasa Indonesia.
2. File dokumen yang bisa di input-kan
ke dalam sistem adalah file dengan
ekstensi *.txt.
3. Format EYD yang dimaksud
dalam sistem ini yaitu kebanyakan hanya mengubah teks yang diprediksi alay oleh sistem ke dalam bahasa
Indonesia yang lebih familiar (mudah dipahami).
1.4 TUJUAN PENELITIAN
Adapun tujuan dari pengembangan
aplikasi text mining untuk mengubah file teks yang menggunakan bahasa alay ke dalam bahasa indonesia yang
sesuai EYD adalah sebagai berikut.
1.
Membuat rancang bangun
pengembangan aplikasi text mining
untuk mengubah file teks yang
menggunakan bahasa alay ke dalam
bahasa Indonesia yang sesuai EYD.
2.
Mengimplementasikan aplikasi text mining untuk mengubah file teks yang menggunakan bahasa alay ke dalam bahasa Indonesia yang
sesuai EYD.
1.5 MANFAAT PENELITIAN
Secara
umum manfaat yang dapat diperoleh dari penelitian ini adalah tersedianya
aplikasi yang mampu mencari atau menemukan keberadaan kata-kata yang tergolong
bahasa alay dalam sebuah file dokumen, yang dapat membantu
korektor untuk mengecek apakah dalam sebuah file
dokumen masih mengandung bahasa alay
atau tidak. Adapun beberapa manfaat aplikasi ini
adalah sebagai berikut.
1. Manfaat Teoritis
Bagi
peneliti, penelitian ini diharapkan akan mampu menambah wawasan serta lebih
mengerti, memahami dan menerapkan teori-teori yang didapat selama proses
perkuliahan.
2. Manfaat Praktis
a. Pembuat Dokumen
Aplikasi ini dapat membantu
si pembuat dokumen untuk mengecek apakah dokumen yang dibuatnya sudah sesuai
dengan bahasa Indonesia yang baik dan benar.
b. Pemerhati Bahasa Indonesia
Mengetahui seberapa jauh perkembangan bahasa alay di tengah-tengah masyarakat dalam
pembuatan dokumennya yang tentunya dapat merusak ejaan bahasa Indonesia yang
baik dan benar.
BAB II
LANDASAN TEORI
2.1 DATA MINING
Data mining, merupakan topik yang akhir-akhir
ini sering dibicarakan oleh kebanyakan orang, terutama di kaum intelektual dan
akademisi. Data mining merupakan
proses analisa dari sekumpulan (terkadang sangat besar) data pengamatan untuk
menemukan adanya hubungan-hubungan yang tidak terduga sebelumnya dan untuk
merangkum data yang menjadi bentuk yang mudah dimengerti dan berguna bagi
pemilik data. Dari pengertian tersebut dapat ditarik kesimpulan bahwa konsep
data mining berhubungan dengan data
dalam jumlah yang sangat besar. Tujuan
dari data mining adalah
berusaha mencari manfaat dari sekumpulan data tersebut.
Dilihat
dari disiplin ilmu yang digunakan, data mining
merupakan ilmu multi disiplin. Data mining
menyangkut berbagai disiplin ilmu seperti database,
kecerdasan buatan (artificial
intelligence), information science
(ilmu informasi), high performance
computing, visualisasi, machine
learning, statistik, neural networks
(jaringan syaraf tiruan), pemodelan matematika, information retrieval dan information
extraction serta pengenalan pola. Saat ini data mining juga berkembang menjadi berbagai konsep ilmu lain, seperti
misalnya text mining.
2.1.1 Model Data Mining
Dalam
perkembangan teknologi data mining,
terdapat model atau mode yang digunakan untuk melakukan proses penggalian informasi
terhadap data-data yang ada. Model data mining
dapat dibagi menjadi dua bagian yaitu verification model dan discovery model.
a.
Verification Model
Model
ini menggunakan perkiraan (hypothesis)
dari pengguna, dan melakukan test terhadap perkiraan yang diambil sebelumnya
dengan menggunakan data-data yang ada. Penekanan terhadap model ini adalah
terletak pada user yang bertanggung
jawab terhadap penyusunan perkiraan (hypothesis)
dan permasalahan pada data untuk meniadakan atau menegaskan hasil perkiraan (hypothesis) yang diambil.
Sebagai
contoh misalnya dalam bidang pemasaran, sebelum sebuah perusahaan mengeluarkan
suatu produk baru kepasaran, perusahaan tersebut harus memiliki informasi
tentang kecenderungan pelanggan untuk membeli produk yang akan dikeluarkan.
Perkiraan (hypothesis) dapat disusun
untuk mengidentifikasikan pelanggan yang potensial dan karakteristik dari pelanggan
yang ada. Data-data tentang pembelian pelanggah sebelumnya dan data tentang
keadaan pelanggan, dapat digunakan untuk melakukan perbandingan antara
pembelian dan karakteristik pelanggan untuk menetapkan dan menguji target yang
telah diperkirakan sebelumnya. Dari
keseluruhan operasi yang ada selanjutnya dapat dilakukan penyaringan dengan
cermat sehingga jumlah perkiraan (hypothesis)
yang sebelumnya banyak akan menjadi
semakin berkurang sesuai dengan keadaan yang sebenarnya. Permasalahan utama
dengan model ini adalah tidak ada informasi baru yang dapat dibuat, melainkan
hanya pembuktian atau melemahkan perkiraan (hypothesis)
dengan data-data yang ada sebelumnya. Datadata yang ada pada model ini hanya
digunakan untuk membuktikan mendukung perkiraan (hypothesis) yang telah diambil sebelumnya. Jadi model ini
sepenuhnya tergantung pada kemampuan user
untuk melakukan analisa terhadap permasalahan yang ingin digali dan diperoleh informasinya.
b.
Discovery Model
Model
ini berbeda dengan verification
model, dimana pada model ini sistem secara langsung menemukan informasi-informasi
penting yang tersembunyi dalam suatu data yang besar. Data-data yang ada
kemudian dipilah-pilah untuk menemukan suatu pola, trend yang ada, dan keadaaan umum pada saat
itu tanpa adanya campur tangan
dan tuntunan dari pengguna. Hasil temuan ini menyatakan fakta-fakta yang ada
dalam data-data yang ditemukan dalam waktu yang sesingkat rnungkin. Sebagai
contoh, misalkan sebuah bank ingin menemuan kelompok-kelompok pelanggan yang
dapat dijadikan target suatu produk yang akan dikeluaran.
Pada
data-data yang ada selanjutnya diadakan proses pencarian tanpa adanya proses
perkiraan (hypothesis) sebelumnya.
Sampai akhirnya semua pelanggan dikelompokan berdasarkan karakteristik yang
sama.
2.1.2 Tahapan Data Mining
Data-data
yang ada, tidak dapat langsung diolah dengan menggunakan sistem data mining. Data-data tersebut harus
dipersiapkan terlebih dahulu agar hasil yang diperoleh dapat lebih maksimal,
dan waktu komputasinya lebih minimal. Adapun tahapan-tahapan yang harus dilalui
dalam proses data mining antara lain:
a. Basis Data Relasional
Dewasa
ini, hamper semua data bisnis disimpan dalam basis data relasional. Sebuah
model basis data relasional dibangun dari serangkaian tabel, setiap tabel
disimpan sebagai sebuah file. Sebuah
tabel relasional terdiri dari baris dan kolom. Kebanyakan model basis data
relasional saat ini dibangun diatas lingkungan OLTP. OLTP (Online Transaction Processing) adalah tipe akses yang digunakan
oleh bisnis yang membutuhkan transaksi konkuren dalam jumlah besar. Bentuk data
yang tersimpan dalam basis data relasional inilah yang dapat diolah oleh sistem
data mining.
b. Ekstraksi Data
Data-data
yang dikumpulkan dalam proses transaksi seringkali ditempatkan pada lokasi yang
berbeda-beda. Maka dari itu dibutuhkan kemampuan dari sistem untuk dapat
mengumpulkan data dengan cepat. Jika data tersebut disimpan dalam kantor
regional, seringkali data tersebut di-upload
ke sebuah server yang lebih terpusat. Ini bisa dilakukan secara harian,
mingguan, atau bulanan tergantung jumlah data, keamanan dan biaya. Data dapat
diringkas dulu sebelum dikirimkan ke tempat penyimpanan pusat.
c. Transformasi Data
Transformasi
data melakukan peringkasan data dengan mengasumsikan bahwa data telah tersimpan
dalam tempat penyimpanan tunggal. Pada langkah terakhir, data telah diekstrak
dari banyak basis data ke dalam basis data tunggal. Tipe peringkasan yang
dikerjakan dalam langkah ini mirip dengan ringkasan yang dikerjakan selama
tahap ekstraksi. Beberapa perusahaan memilih untuk menngkas data dalam sebuah
tempat penyimpanan tunggal. Fungsi-fungsi aggregate yang sering digunakan
antara lain: summarizations, averages,
minimum, maximum, dan count.
d. Pembersihan Data
Data-data
yang telah terkumpul selanjutnya akan mengalami proses pembersihan. Proses
pembersihan data dilakukan untuk membuang record yang keliru, menstandarkan
atribut-atribut, merasionalisasi struktur data, dan mengendalikan data yang
hilang. Data yang tidak konsisten dan banyak kekeliruan membuat hasil data mining tidak akurat. Adalah sangat
penting untuk membuat data konsisten dan seragam. Pembersihan data juga dapat membantu
perusahaan untuk mengkonsolidasikan record. Ini sangat berguna ketika sebuah
perusahaan mempunyai banyak record untuk seorang pelanggan. Setiap record atau file pelanggan mempunyai nomor pelanggan
yang sama, tetapi informasi dalam tiap file-nya berbeda.
e. Bentuk Standar
Selanjutnya
setelah data mengalami proses pembersihan maka data ditranfer kedalam bentuk
standar. Bentuk standar adalah adalah bentuk data yang akan diakses oleh
algoritma data mining. Bentuk standar
ini biasanya dalam bentuk spreadsheet
like. Bentuk spreadsheet bekerja dengan baik karena baris merepresentasikan
kasus dan kolom merepresentasikan feature.
f. Reduksi Data dan Feature
Setelah
data berada dalam bentuk standar spreadsheet perlu dipertimbangkan untuk
mereduksi jumlah feature. Ada
beberapa alasan untuk mengurangi jumlah feature
dalam spreadsheet kita. Sebuah bank mungkin mempunyai ratusan feature ketika hendak memprediksi resiko
kredit. Hal ini berarti perusahaan mempunyai data dalam jumlah yang sangat
besar. Bekerja dengan data sebanyak ini membuat algoritma prediksi menurun
kinerjanya.
g. Menjalankan Algoritma
Setelah
semua proses diatas dikerjakan, maka algoritma data mining sudah siap untuk dijalankan.
2.2 TEXT MINING
Salah
satu penerapan dari data mining (Knowledge
Discovery) adalah Text Mining. Text Mining sering juga
disebut dengan Text Data Mining (TDM) atau Knowledge Discovery in Textual
Database (KDT). Metode ini digunakan
untuk menggali informasi dari data-data dalam bentuk teks seperti buku,
makalah, paper, dan lain sebagainya. Secara umum text mining
memiliki definisi menambang data yang berupa teks dimana sumber data biasanya
didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat
mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar
dokumen.
Andre
Kurniawan dan Hapnes Toba (2009) dalam jurnalnya menyatakan bahwa, yang
membedakan data mining dengan text mining adalah proses analisis
terhadap suatu datanya. Data Mining atau KDD adalah proses untuk
menemukan pengetahuan dari sejumlah besar data yang disimpan baik di dalam databases,
data warehouses atau tempat penyimpanan informasi lainnya. Text
mining sering disebut dengan Keyword-Based Association Analysis.
Keyword-Based Association Analysis merupakan sebuah analisa yang
mengumpulkan keywords atau terms (istilah) yang sering muncul
secara bersamaan dan kemudian menemukan hubungan asosiasi dan korelasi diantara
keywords atau terms itu.
2.2.1 Tahapan Text Mining
Secara garis besar dalam melakukan implementasi text mining terdiri
dari dua tahap besar yaitu pre-processing dan processing.
a. Pre-processing
Tahap
preprocessing adalah tahap dimana aplikasi melakukan seleksi data yang
akan diproses pada setiap dokumen. Setiap kata akan dipecah-pecah menjadi
struktur bagian kecil yang nantinya akan mempunyai makna sempit. Ada beberapa hal yang perlu dilakukan pada tahap pre-processing ini,
yaitu:
1)
Tokenizing
2)
Filtering
3)
Stemming
4)
Tagging
Tujuan dilakukan preprocessing
adalah memilih setiap kata dari dokumen dan merubahnya menjadi kata dasar
yang memiliki arti sempit.
1)
Tokenizing
Tokenizing atau parsing adalah sebuah proses yang dilakukan sesorang untuk
menjadikan sebuah kalimat menjadi lebih bermakna atau berarti dengan cara
memecah kalimat tersebut menjadi kata-kata atau frase-frase.
Tokenizing dalam pembuatan aplikasi text mining ini merupakan proses penguraian
file teks yang semula berupa
kalimat-kalimat berisi kata-kata dan tanda pemisah antar kata seperti titik
(.), koma (,), spasi dan tanda pemisah lain menjadi kata-kata saja baik itu
berupa kata penting maupun kata tidak penting. Proses tokenizing pada suatu
kalimat dapat dilihat pada Gambar 2.1
Gambar 2.1 Ilustrasi Proses Tokenizing
2)
Filtering
Tahap filtering adalah tahap mengambil kata-kata
penting dari hasil token. Dimana dalam tahap ini bisa digunakakan
algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan
kata penting). Dalam tahap ini penulis menggunakan algoritma stoplist. Stoplist / stopword adalah
kata-kata yang tidak deskriptif yang dapat dibuang. Contoh stopwords
adalah “yang”, “dan”, “di”, “dari” dan seterusnya. Proses ini akan menghasilkan
daftar istilah beserta informasi tambahan seperti frekuensi dan posisi yang
akan digunakan dalam proses selanjutnya. Proses filtering dapat dilihat
pada Gambar 2.2.
Gambar 2.2 Ilustrasi Proses Filtering
3)
Stemming
Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian
berbagai bentukan kata ke dalam suatu representasi yang sama. Atau dengan kata
lain pada tahap ini dilakukan proses penghilangan prefiks dan sufiks
dari kueri dan istilah-istilah yang dihasilkan dari proses filtering. Stemming
dilakukan atas dasar asumsi bahwa kata-kata yang memiliki stem yang sama
dianggap memiliki makna yang serupa sehingga pengguna tidak keberatan untuk
memperoleh dokumen-dokumen yang di dalamnya terdapat kata-kata dengan stem
yang sama dengan kuerinya.
Pada intinya proses ini mempunyai
dua tujuan, yaitu (1) dalam hal efisiensi, stemming mengurangi jumlah
kata-kata unik dalam indeks sehingga mengurangi kebutuhan ruang penyimpanan dan
mempercepat proses pencarian. (2) dalam hal keefektifan, stemming mengurangi recall dengan
mengurangi bentuk-bentuk kata ke bentuk dasarnya atau stem-nya. Sehingga
dokumen-dokumen yang menyertakan suatu kata dalam berbagai bentuknya memiliki
kecenderungan yang sama untuk ditemukembalikan. Hal tersebut tidak akan
diperoleh jika tiap bentuk suatu kata disimpan secara terpisah dalam indeks.
Pada tahap ini penulis akan menggunakan metode porter stemmer untuk bahasa Indonesia. Proses stemming
dapat dilihat pada Gambar 2.3.
Gambar 2.4
Ilustrasi Proses Stemming
4)
Tagging
Tahap tagging adalah tahap mencari bentuk awal/root dari tiap kata lampau
atau kata hasil stemming. Tahap ini
biasanya dilakukan untuk proses text mining berbahasa Inggris. Jadi dalam
penelitian ini, tahap tagging akan di
abaikan, karena text mining penelitian ini hanya untuk teks
yang menggunakan bahasa Indonesia. Proses tagging dapat dilihat pada Gambar 2.4.
Gambar 2.4 Ilustrasi Proses Tagging
a. Processing
Tahap ini merupakan tahap penentuan
seberapa jauh keterhubungan antar kata-kata antar dokumen yang ada. Peneliti
biasanya menggunakan metode-metode tertentu untuk menentukan keterhubungan
antar dokumen. Secara umum terdapat dua jenis metode
pada tahap ini yaitu metode yang tidak melakukan perhitungan bobot kalimat dan
yang melakukan perhitungan bobot kalimat. Metode yang tidak menghitung bobot
kalimat hanya mengambil beberapa kata penting untuk kemudian diproses sesuai
permasalahan yang diteliti. Metode-metode yang menghitung bobot kalimat
menggunakan bobot term (kata maupun pasangan kata) dari setiap term
yang terdapat dalam kalimat tersebut. Ada banyak algoritma yang bisa digunakan
untuk menghitung bobot kalimat.
2.2.2 Metode Porter Stemmer
Porter Stemmer for Bahasa
Indonesia dikembangkan oleh Fadillah Z. Tala pada tahun 2003. Implementasi
Porter Stemmer for Bahasa Indonesia
berdasarkan English Porter Stemmer
yang dikembangkan oleh W.B. Frakes pada tahun 1992. Karena bahasa Inggris
datang dari kelas yang berbeda, beberapa modifikasi telah dilakukan untuk
membuat Algoritma Porter dapat
digunakan sesuai dengan bahasa Indonesia. Metode ini akan
digunakan pada tahap stemming, yaitu
mengubah kata hasil filtering yang
semula masih berimbuhan (word)
menjadi kata dasar (stem). Desain dari Porter
Stemmer untuk
Bahasa Indonesia dapat
dilihat pada Gambar
2.5.
Gambar 2.5 Ilustrasi Proses Stemming Menggunakan Metode Porter
Berikut ini contoh ilustrasi dari
metode tersebut.
a. Remove Partikel
Pada
tahap ini sistem akan menghapus partikel yang terdapat pada sebuah kata. Contoh
ilustrasinya dapat dilihat pada Tabel 2.1.
Tabel 2.1 Daftar Partikel
Suffix
|
Replacement
|
Additional Condition
|
Examples
|
kah
|
NULL
|
NULL
|
bukukan → buku
|
lah
|
NULL
|
NULL
|
adalah → ada
|
pun
|
NULL
|
NULL
|
bukupun → buku
|
b. Remove Possesive Pronoun
Pada
tahap ini sistem akan menghapus kata ganti milik yang terdapat pada sebuah
kata. Contoh ilustrasinya dapat dilihat pada Tabel 2.2.
Tabel 2.2 Daftar Possesive Pronoun
Suffix
|
Replacement
|
Additional Condition
|
Examples
|
ku
|
NULL
|
NULL
|
bukuku → buku
|
mu
|
NULL
|
NULL
|
bukumu → buku
|
nya
|
NULL
|
NULL
|
bukunya → buku
|
c. Remove
first order of derivational prefixes
Pada
tahap ini sistem akan menghapus imbuhan pertama yang terdapat pada sebuah kata.
Contoh ilustrasinya dapat dilihat pada Tabel 2.3.
Tabel 2.3 Daftar first order of derivational prefixes
Preffix
|
Replacement
|
Additional Condition
|
Examples
|
meng
|
NULL
|
NULL
|
mengukur → ukur
|
meny
|
s
|
V…*
|
menyapu → sapu
|
men
|
NULL
|
NULL
|
menduga → duga
|
mem
|
p
|
V…*
|
memilah → pilah
|
mem
|
NULL
|
NULL
|
membaca → baca
|
me
|
NULL
|
NULL
|
merusak → rusak
|
peng
|
NULL
|
NULL
|
pengukur → ukur
|
peny
|
s
|
V…*
|
penyapu → sapu
|
pen
|
NULL
|
NULL
|
penduga → duga
|
pem
|
p
|
V…*
|
pemilah → pilah
|
pem
|
NULL
|
NULL
|
pembaca → baca
|
di
|
NULL
|
NULL
|
diukur → ukur
|
ter
|
NULL
|
NULL
|
terdalam → dalam
|
ke
|
NULL
|
NULL
|
kekasih → kasih
|
d. Remove
second order of derivational prefixes
Pada
tahap ini sistem akan menghapus imbuhan kedua yang terdapat pada sebuah kata.
Contoh ilustrasinya dapat dilihat pada Tabel 2.4.
Tabel 2.4 Daftar second order of derivational prefixes
Preffix
|
Replacement
|
Additional Condition
|
Examples
|
ber
|
NULL
|
NULL
|
berlari → lari
|
bel
|
NULL
|
NULL
|
belajar → ajar
|
be
|
NULL
|
NULL
|
bekerja → kerja
|
per
|
NULL
|
NULL
|
perjelas → jelas
|
pel
|
NULL
|
NULL
|
pelajar → ajar
|
pe
|
NULL
|
NULL
|
pekerja → kerja
|
e. Remove
derivational suffixes
Pada
tahap ini sistem akan menghapus akhiran yang terdapat pada sebuah kata. Contoh
ilustrasinya dapat dilihat pada Tabel 2.5.
Tabel 2.5 Daftar derivational suffixes
Suffix
|
Replacement
|
Additional Condition
|
Examples
|
kan
|
NULL
|
NULL
|
ambilkan → ambil
|
an
|
NULL
|
NULL
|
makanan → makan
|
i
|
NULL
|
NULL
|
tandai → tanda
|
Jadi
jika diberikan contoh kata “memperbaikinya”, maka yang pertama kali dikerjakan
oleh sistem adalah menghapus kata ganti milik “nya”, sehingga katanya menjadi
“memperbaiki”, kemudian menghapus imbuhan “mem”, kemudian menghapus suffix (akhiran) “i” dan yang terakhir
adalah menghapus imbuhan kedua “per” sehingga akhir katanya menjadi “baik” yang
merupakan rule dari kata
“memperbaikinya”.
2.3 SEJARAH PERKEMBANGAN BAHASA ALAY
Akhir-akhir
ini bahasa alay atau bahasa gaul
merebak di kalangan remaja. Bahasa gaul adalah dialek bahasa Indonesia nonformal yang digunakan oleh komunitas
tertentu atau di daerah tertentu untuk pergaulan. Bahasa gaul identik dengan
bahasa percakapan (lisan). Bahasa alay
sendiri adalah bahasa lisan yang dituliskan sehingga mengandung unsur bahasa
tulisan. Istilah ini hadir setelah di facebook semakin marak penggunaan bahasa
tulis yang tak sesuai kaidah bahasa Indonesia oleh remaja. Dalam bahasa alay bukan bunyi yang dipentingkan tapi
variasi tulisan. Bahasa alay juga
mudah di temui dalam pesan pendek (SMS) yang dikirim dari kalangan muda. Tanpa
disadari bahasa yang muncul karena kreativitas bahasa yang dimiliki oleh
ana-anak muda ini dapat mempengaruhi kebiasaan berbahasa resmi. Jenis bahasa alay ini hanya ada di Indonesia, karena
di negara lain seperti Amerika tidak ada yang tahu bahasa seperti ini.
Bahasa
alay adalah bahasa remaja yang
mencampuradukkan huruf, angka, dan simbol-simbol. Kata-kata dalam bahasa alay tidak mempunyai standar yang pasti,
bergantung selera atau teknik si pembuat kata. Walaupun berbeda atau tidak ada
standar penulisan yang pasti, remaja yang sering menggunakan bahasa tersebut
dapat cepat mengerti apa yang ditulis lawan komunikasinya.
Fenomena
bahasa alay ini menjadi menarik,
karena tidak semua orang mau menerima bahasa alay ini. Bahasa alay
sering digunakan oleh komunitas tersebut dalam SMS (Short Message Service) atau status di Facebook dan Twitter. Entah
karena banyaknya orang yang memakai tulisan alay
sehingga berdampak banyak orang yang terganggu sampai-sampai muncul grup anti alay di Facebook. Bahasa anak remaja
yang merupakan bahasa gaul paling mutakhir ini memang bahasa paling kacau
sepanjang sejarah bahasa gaul di Indonesia. Kalau dulu bahasa gaul mempunyai
aturan-aturan baku tertentu yang mesti dipatuhi, seperti bahasa prokem misalnya
dengan menyisipkan kata ”ok” untuk setiap perubahan kata, atau bahasa
dibolak-balik yang mempunyai aturan sendiri, maka bahasa alay tidak mempunyai aturan sendiri, maka bahasa alay tidak mempunyai aturan sama sekali.
Semakin sulit dipahami, maka bahasa alay
dinilai semakin canggih.
Perkembangan
bahasa alay dapat dilihat dari dua
sisi. Satu sisi bahasa alay
menunjukkan kreativitas anak-anak muda. Namun, di sisi lain dapat mempengaruhi
penggunaan bahasa sehari-hari sehingga mempengaruhi bahasa tulis anak-anak
muda. Salah satu indikatornya, dalam ujian tertulis di sekolah atau kampus,
siswa dan mahasiswa cenderung menyingkat kata yang tidak biasa. Disinyalir gaya
bahasa yang sangat santai dan tidak memperhatikan kesopanan tersebut lambat
laun dapat mengubah gaya hidup generasi muda. Kebiasaan ini akan membuat kita
semakin sulit untuk mendefinisikan berbahasa satu, bahasa Indonesia seperti
yang diikrarkan pada sumpah pemuda. Selain itu bahasa Indonesia yang selama ini
menjadi bahasa “ibu” akan tergeser dengan gaya bahasa tersebut. Akan semakin
sulit bagi orang Indonesia untuk menggunakan bahasa nasional yang dimiliki oleh
seluruh bangsa Indonesia.
Beberapa
contoh yang penulis dapatkan dan sering digunakan oleh masyarakat pada umumnya
antara lain sebagai berikut:
a. Menggunakan angka untuk
menggantikan huruf. Contoh: “t3m4n, b350k k1t4 p3r91 yuuukk”.
b. Kapitalisasi yang sangat
berantakan. Contoh: “tEmAn, bEsOk kItA pErGi YuUuK”.
c. Menambahkan “x” atau “z”
pada akhiran atau mengganti beberapa huruf seperti “s” dengan dua huruf
tersebut dan menyelipkan huruf-huruf yang tidak perlu serta merusak EYD atau
setidaknya bahasa yang masih bisa dibaca. Mengganti huruf “s” dengan “c” sehingga
seperti balita berbicara. Contoh: “nanti Aq xmx kamyu deeeccchh”, “xory ya,
becok aQ gx bica ikut”.
Selain itu contoh kosakata bahasa alay adalah berikut ini:
a. Saya/gue: W, Wa, Q, Qu, Gw,
Akyu, Akku;
b. kamu:U, lo;
c. rumah: Humz, Hozz;
d. saja: Aja, Ajj;
e. yang: Iank/Iang, Eank/Eang,
iiank/iiang;
f. boleh: Leh; ya: Iya, Yupz,
Ia, Iupz;
g. kok: KoQ, Kog, Kug, Kq;
h. belum: Lom, Lum;
i.
manis: Maniezt, Manies;
j.
kurang: Krang, Krank, Crank;
k. tahu: Taw, Tawh, Tw;
l.
tempat: T4;
m. sempat: S4;
n. ini: Iniyh, Nc, Nie, Ney;
o. ketawa: wkwkwk, xixixi,
haghaghag, w.k.k.k.k.k., wkowkowkwo;
p. tidak/nggak: Gga, Gax, Gag,
Gz;
q. lagi: Ghiy, Ghiey, Gi;
r.
apa: Pa, Ppa, ap;
s. karena/soalnya: Coz, Cz;
t.
masuk: Suk, Mzuk, Mzug, Mzugg.
Contoh-contoh
yang disebutkan di atas baru sedikit, ini artinya masih banyak lagi kata-kata
yang termaksud di dalamnya. Penggunaan bahasa alay memiliki dampak positif dan negatif. Dampak positif dengan
digunakannya bahasa alay adalah
remaja menjadi lebih kreatif. Terlepas dari menganggu atau tidaknya bahasa alay ini, tidak ada salahnya kita
menikmati tiap perubahanatau inovasi bahasa yang muncul. Asalkan dipakai pada
situasi yang tepat, media yang tepat dan komunikan yang tepat juga.
Dampak
negatifnya adalah penggunaan bahasa alay
dapat mempersulit penggunanya untuk berbahasa Indonesia dengan baik dan benar.
Padahal di sekolah atau di tempat kerja, kita diharuskan untuk selalu
menggunakan bahasa yang baik dan benar. Tidak mungkin jika pekerjaan rumah,
ulangan atau tugas sekolah dikerjakan dengan menggunakan bahasa alay. Karena, bahasa alay tidak masuk dalam tatanan bahasa
akademis. Begitu juga di kantor, laporan yang kita buat tidak diperkenankan
menggunakan bahasa alay. Jadi, ketika
situasi kita dalam situasi yang formal jangan menggunakan bahasa alay sebagai komunikasi.
Dampak
negatif lainnya, bahasa alay dapat
mengganggu siapapun yang membaca dan mendengar kata-kata yang termaksud di
dalamnya. Karena, tidak semua orang mengerti akan maksud dari kata-kata alay tersebut. Terlebih lagi dalam
bentuk tulisan, sangat memusingkan dan memerlukan waktu lebih banyak untuk
memahaminya.
1.3
PEMAKAIAN HURUF DAN
PENULISAN KATA MENURUT EYD
2.3.1 Huruf Abjad
Abjad yang
digunakan dalam ejaan bahasa Indonesia terdiri atas huruf yang dapat pada Tabel
2.6. Nama tiap huruf disertakan di kolom ketiga.
Tabel 2.6 Daftar Huruf Abjad
Huruf
|
Nama
|
|
Kapital
|
Kecil
|
|
A
|
a
|
a
|
B
|
b
|
be
|
C
|
c
|
ce
|
D
|
d
|
de
|
E
|
e
|
e
|
F
|
f
|
ef
|
G
|
g
|
ge
|
H
|
h
|
ha
|
I
|
i
|
i
|
J
|
j
|
je
|
K
|
k
|
ka
|
L
|
l
|
el
|
M
|
m
|
em
|
N
|
n
|
en
|
O
|
o
|
o
|
P
|
p
|
pe
|
Q
|
q
|
ki
|
R
|
r
|
er
|
S
|
s
|
es
|
T
|
t
|
te
|
U
|
u
|
u
|
V
|
v
|
ve
|
W
|
w
|
we
|
X
|
x
|
eks
|
Y
|
y
|
ye
|
Z
|
z
|
zet
|
2.3.2 Huruf Vokal
Huruf yang melambangkan vokal dalam
bahasa Indonesia terdiri atas huruf a, e, i, o, dan
u. Daftar huruf vokal yang digunakan dalam ejaan bahasa Indonesia dapat
dilihat pada Tabel 2.7.
Tabel 2.7 Daftar Huruf Vokal
Huruf Vokal
|
Contoh Pemakaian Dalam Kata
|
||
Posisi Awal
|
Posisi Tengah
|
Posisi Akhir
|
|
a
|
api
|
padi
|
lusa
|
e*
|
enak
|
petak
|
sore
|
emas
|
kena
|
tipe
|
|
i
|
itu
|
simpan
|
murni
|
o
|
oleh
|
kota
|
radio
|
u
|
ulang
|
bumi
|
ibu
|
Keterangan:
*
|
Untuk
keperluan pelafalan kata yang benar, tanda aksen dapat digunakan jika ejaan
kata menimbulkan keraguan.
|
Misalnya:
|
|
Anak-anak
bermain di teras (téras).
|
|
Upacara itu
dihadiri pejabat teras Bank Indonesia.
|
|
Kami menonton
film seri (séri).
|
|
Pertandingan
itu berakhir seri.
|
|
Di mana kécap
itu dibuat?
|
|
Coba kecap
dulu makanan itu.
|
2.3.3 Huruf Konsonan
Huruf yang
melambangkan konsonan dalam bahasa Indonesia terdiri atas huruf huruf b,
c, d, f, g, h, j, k, l,
m, n, p, q, r, s, t, v,
w, x, y, dan z. Daftar huruf konsonan yang
digunakan dalam ejaan bahasa Indonesia dapat dilihat pada Tabel 2.8.
Tabel 2.8 Daftar Huruf Konsonan
Huruf Konsosnan
|
Contoh Pemakaian dalam Kata
|
||
Posisi Awal
|
Posisi Tengah
|
Posisi Akhir
|
|
b
|
bahasa
|
sebut
|
adab
|
c
|
cakap
|
kaca
|
-
|
d
|
dua
|
ada
|
abad
|
f
|
fakir
|
kafan
|
maaf
|
g
|
guna
|
tiga
|
gudeg
|
h
|
hari
|
saham
|
tuah
|
j
|
jalan
|
manja
|
mikraj
|
k
|
kami
|
paksa
|
politik
|
-
|
rakyat*
|
bapak*
|
|
l
|
lekas
|
alas
|
akal
|
m
|
maka
|
kami
|
diam
|
n
|
nama
|
tanah
|
daun
|
p
|
pasang
|
apa
|
siap
|
q**
|
Quran
|
status quo
|
Taufiq
|
r
|
raih
|
bara
|
putar
|
s
|
sampai
|
asli
|
tangkas
|
t
|
tali
|
mata
|
rapat
|
v
|
varia
|
lava
|
-
|
w
|
wanita
|
hawa
|
-
|
x**
|
xerox
|
-
|
sinar-X
|
y
|
yakin
|
payung
|
-
|
z
|
zeni
|
lazim
|
juz
|
Keterangan:
*
|
Huruf k melambangkan bunyi hamzah.
|
**
|
Huruf q dan x khusus dipakai untuk nama diri
(seperti Taufiq dan Xerox) dan keperluan ilmu (seperti status
quo dan sinar x).
|
2.2.4 Huruf Diftong
Di dalam
bahasa Indonesia terdapat diftong yang dilambangkan dengan ai, au,
dan oi. Daftar huruf diftong yang digunakan dalam ejaan bahasa Indonesia
dapat dilihat pada Tabel 2.9.
Tabel 2.9 Daftar Huruf Diftong
Huruf Diftong
|
Contoh Pemakaian dalam Kata
|
||
Posisi Awal
|
Posisi Tengah
|
Posisi Akhir
|
|
ai
|
ain
|
malaikat
|
pandai
|
au
|
aula
|
saudara
|
harimau
|
oi
|
-
|
boikot
|
amboi
|
2.3.5 Huruf Kapital
a. Dipakai sebagai huruf
pertama kata pada awal kalimat.
b. Dipakai sebagai huruf
pertama petikan langsung.
c. Dipakai sebagai huruf
pertama dalam ungkapan yang berhubungan dengan nama Tuhan dan kitab suci.
d. Dipakai sebagai huruf
pertama nama gelar kehormatan.
e. Dipakai sebagai huruf
pertama unsur nama jabatan dan pangkat.
f. Dipakai sebagai huruf
pertama unsur nama orang.
g. Dipakai sebagai huruf
pertama nama bangsa, suku dan bahasa.
h. Dipakai sebagai huruf
pertama nama geografi.
i.
Dipakai sebagai huruf pertama unsur nama negara, lembaga
pemerintahan dan ketatanegaraan.
j.
Dipakai sebagai huruf pertama setiap unsur bentuk ulang
sempurna pada unsur nama negara, lembaga pemerintahan dan ketatanegaraan.
k. Dipakai sebagai huruf
pertama kata penunjuk hubungan kekerabatan.
l.
Dipakai sebagai huruf pertama kata ganti Anda.
2.3.6 Singkatan Dan Akronim
a. Singkatan ialah bentuk
singkat yang terdiri atas satu huruf atau lebih.
1) Singkatan nama orang, nama
gelar, sapaan, jabatan, atau pangkat diikuti dengan tanda titik di belakang
tiap-tiap singkatan itu. Misalnya: A.H. Nasution, Suman Hs.,
S.Kom., Sdr., dan
lain-lain.
2) Singkatan nama resmi lembaga
pemerintah dan ketatanegaraan, badan atau organisasi, serta nama dokumen resmi
yang terdiri atas gabungan huruf awal kata ditulis dengan huruf kapital dan
tidak diikuti dengan tanda titik. Misalnya: DPR, MPR, SD, SMA, dan lain-lain.
3) Singkatan kata yang berupa
gabungan huruf diikuti dengan tanda titik. Misalnya: jml., kpd., tgl., dan
lain-lain.
4) Singkatan gabungan kata yang
terdiri atas tiga huruf diakhiri dengan tanda titik. Misalnya: dst., dsb.,
dll., dan lain-lain.
5) Singkatan gabungan kata yang
terdiri atas dua huruf (lazim digunakan dalam surat-menyurat) masing-masing
diikuti oleh tanda titik. Misalnya: a.n., d.a., u.p., dan lain-lain.
6) Lambang kimia, singkatan
satuan ukuran, takaran, timbangan, dan mata uang tidak diikuti tanda dengan
titik. Misalnya: Cu, TNT, kg, Rp, dan lain-lain.
b. Akronim ialah singkatan dari
dua kata atau lebih yang diperlakukan sebagai sebuah kata.
1)
Akronim nama diri yang
berupa gabungan huruf awal unsur-unsur nama diri ditulis seluruhnya dengan
huruf kapital tanpa tanda titik. Misalnya: LIPI, LAN, SIM, dan lain-lain.
2)
Akronim nama diri yang
berupa singkatan dari beberapa unsur ditulis dengan huruf awal kapital.
Misalnya: Bulog, Bappenas, Iwapi, dan lain-lain.
3)
Akronim bukan nama diri
yang berupa singkatan dari dua kata atau lebih ditulis dengan huruf kecil.
Misalnya: pemilu, iptek, rudal, dan lain-lain.
2.3.7 Penulisan Angka dan Bilangan
Bilangan dapat dinyatakan dengan
angka atau kata. Angka dipakai sebagai lambang bilangan atau nomor. Di dalam
tulisan lazim digunakan angka Arab atau angka Romawi.
Angka
Arab : 0,1,2,3,4,5,6,7,8,9
Angka
Romawi : I, II, III, IV, V, VI,
VII, VIII, IX, X, L (50), C (100), D (500), M (1.000), V (5.000), M (1.000.000)
a.
Bilangan dalam teks
yang dapat dinyatakan dengan satu atau dua kata ditulis dengan huruf, kecuali
jika bilangan itu dipakai secara berurutan seperti dalam perincian atau
paparan.
Misalnya:
a)
Mereka menonton drama
itu sampai tiga kali.
b)
Koleksi perpustakaan
itu mencapai dua juta buku.
c)
Di antara 72
anggota yang hadir 52 orang setuju, 15 orang tidak setuju, dan 5
orang tidak memberikan suara.
b.
Bilangan pada awal
kalimat ditulis dengan huruf, jika lebih dari dua kata, susunan kalimat diubah
agar bilangan yang tidak dapat ditulis dengan huruf itu tidak ada pada awal
kalimat.
Misalnya:
a)
Lima puluh
siswa kelas 6 lulus ujian.
b)
Panitia mengundang 250
orang peserta.
c.
Angka yang menunjukkan
bilangan utuh besar dapat dieja sebagian supaya lebih mudah dibaca.
Misalnya:
a)
Perusahaan itu baru
saja mendapat pinjaman 550 miliar rupiah.
b)
Dia mendapatkan bantuan
Rp250 juta rupiah untuk mengembangkan usahanya.
c)
Proyek pemberdayaan
ekonomi rakyat itu memerlukan biaya Rp10 triliun.
d.
Angka digunakan untuk
menyatakan (a) ukuran panjang, berat, luas, dan isi; (b) satuan waktu; (c)
nilai uang; dan (d) jumlah. Misalnya: 0,5 cm; Rp5.000,00; 17 Agustus 1945; 27
orang; dan lain-lain.
e.
Angka digunakan untuk
melambangkan nomor jalan, rumah, apartemen, atau kamar.
Misalnya:
a)
Jalan Tanah Abang I No.
15
b)
Jalan Wijaya No. 14
c)
Apartemen No. 5
f.
Angka digunakan untuk
menomori bagian karangan atau ayat kitab suci.
Misalnya:
a)
Bab X, Pasal 5, halaman
252
b)
Surah Yasin: 9
2.3.8 Pengertian dan Penulisan Kata
Kata
adalah kesatuan-kesatuan terkecil yang diperoleh sesudah sebuah kalimat dibagi
atas bagian-bagianya, dan mengandung suatu ide. Suatu bentuk yang memiliki arti
atau yang sering disebut morfem sudah merupakan suatu kata, tetapi
sebaiknya konsep tentang kata tidak hanya meliputi morfem bebas
melainkan juga semua bentuk gabungan antara morfem bebas dan morfem
terikat, atau morfem dasar dengan morfem dasar.
a. Kata Turunan
1)
Imbuhan
(awalan, sisipan dan akhiran) ditulis serangkaian dengan kata dasarnya.
Misalnya: memukul, berbudi, mempermainkan,
dikelola, dan lain-lain.
2)
Awalan (prefiks)
adalah suatu unsur srtuktural yang dikaitkan didepan sebuah kata dasar atau
bentuk kata. Bahasa Indonesia mempunyai banyak awalan, diantaranya adalah ber,
me-, pe-, di-, ke-, ter-, dan se-. Dalam menambahkan awalan pada suatu bentuk
dasar ada suatu proses yang terkadang ikut andil yaitu proses nasalisasi.
Proses nasalisasi adalah proses merubah atau memberi karakter pada kata. Hal
inilah yang menyebabkan bervariasinya bentuk awalan. Kemudian bentuk variasi
itu disebut dengan alomorf. Bentuk-bentuk alomorf dari imbuhan tersebut dapat
dilihat pada Tabel 2.10.
Tabel 2.10 Bentuk-Bentuk Alomorf Imbuhan
No
|
Imbuhan
|
Alomorf
|
1
|
be-
|
be-
|
bel-
|
||
ber-
|
||
2
|
men-
|
me-
|
mem-
|
||
men-
|
||
meng-
|
||
menge-
|
||
meny-
|
||
3
|
pen-
|
pe-
|
pem-
|
||
pen-
|
||
peng-
|
||
penge-
|
||
peny-
|
||
per-
|
||
4
|
ter-
|
Te-
|
tel-
|
||
ter-
|
3)
Sisipan
(infiks) adalah semacam morfem terikat yang disipkan pada sebuah
kata antara konsonan pertama dengan vocal pertama. Jenis morfem ini
pemakaianya terbatas pada beberapa kata saja. Sisipan yang terdapat dalam
bahasa Indoonesia meliputi –el, -er, -em. Akhiran (sufiks) adalah
semacam morfem terikat yang dilekatkan dibelakang suatu morfem
dasar. Macam-macam akhiran yang terdapat dalam bahasa Indonesia meliputi –kan,
-kan, -nya, -an, -i, dan lain-lain.
4)
Bentuk
dasar gabungan kata yang sekaligus mendapat awalan dan akhiran (konfiks)
ditulis serangkai. Misalnya: mempertanggungjawabkan,
ketidakadilan, melipatgandakan, dan lain-lain.
5)
Imbuhan (awalan dan
akhiran) ditulis serangkai dengan kata yang langsung mengikuti atau
mendahuluinya. Misalnya: bertanggung jawab, garis bawahi, sebar luaskan, dan
lain-lain.
6)
Jika
salah satu unsur gabungan kata hanya digunkan dalam kombinasi, gabungan kata
tersebut ditulis serangkai. Misalnya: amoral, mahakuasa, kontraevolusi,
ekstrakurikuler, dan lain-lain.
b. Kata
Depan
Kata depan dituliskan terpisah dengan kata yang mengikutinya, kecuali kata daripada
dan kepada (yang dianggap satu kata). Misalnya dalam kalimat: Lebih
baik tinggal di sini daripada pergi ke daerah itu.
c. Partikel
Partikel
lah, kah, dan tah ditulis serangkai dengan kata yang mendahului
atau mengikutinya. Misalnya: Apalah artinya hidup tanpa cinta. Akan
tetapi partikel per dan pun ditulis terpisah dengan kata yang mendahului atau
mengikutinya. Misalnya: Satu per satu mereka memasuki ruang
pemeriksaan.
d. Ungkapan
Penghubung
Dalam
bahasa Indonesia, ungkapan penghubung dibedakan atas dua jenis, yaitu ungkapan
penghubung intrakalimat dan antarkalimat. Kata penghubung intrakalimat
berfungsi menghubungkan unsur-unsur di dalam suatu kalimat, sedangkan kata
penghubung antarkalimat berfungsi menghubungkan kalimat yang satu dengan
kalimat yang lain. Yang termasuk unkapan penghubung intrkalimat, antara lain baik…maupun…,
bukan…melainkan…, antara…dan... Pasangan tersebut sifatnya tetap.
e. Bentuk
Ulang
Bentuk
kata ulang ditulis secara lengkap dengan menggunakan tanda hubung. Misalnya: anak-anak, mata-mata, hati-hati, makan-makan, dan lain-lain.
f. Gabungan
Kata
Gabungan kata, termasuk istilah khusus, yang mungkin menimbulkan kesalahan
pengertian dapat ditulis dengan tanda hubung (-) untuk menegaskan pertalian
unsur yang bersangkutan. Misalnya: anak-istri saya, mesin-hitung tangan, dan
lain-lain.
Gabungan
kata berikut ditulis serangkai. Misalnya: acapkali, adakalanya, bagaimana,
barangkali, bilamana, beasiswa, daripada dukacita, kepada, kilometer, dan
lain-lain.
2.3.9 Pengertian Kalimat
Unsur-unsur
yang membangun sebuah kalimat dapat dibedakan menjdi dua, yaitu unsur wajib dan
unsur tak wajib atau unsur manasuka. Unsur wajib adalah unsur yang harus ada
dalam sebuah kalimat (yaitu unsur S/subjek dan P/predikat), sedangkan unsur
takwajib atau unsur manasuka adalahusur yang boleh ada dan boleh tidak ada
(yaitu kata kerja bantu: harus, boleh; keterangan aspek: sudah, akan;
keterangan tempat, waktu, cara, dan sebagainya). Kalimat yang tidak memiliki
unsur subjek dan unsur predikat, maka itu buakan merupakan sebuah kalimat.
Deretan kata yang seperti itu biasa disebut dengan frasa. Frasa adalah suatu
kontruksi yang terdiri atas dua kata atau lebih yang membentuk suatu kesatuan,
dimana kesatuan itu dapat menimbulakan makna baru yang sebelumnya tidak ada.
Hal inilah yang membedakan kalimat dengan frasa.
Secara umum kalimat dapat diartikan sebagai satuan bahasa
terkecil, dalam wujud lisan atau tulisan, yang mengungkapkan pikiran yang utuh.
Dalam wujud lisan kalimat diutarakan dengan media mulut dengan intonasi yang
berbeda-beda. Sedangkan dalam wujud tulisan berhuruf latin kalimat dimulai
dengan huruf kapital dan diakhiri dengan tanda titik (.), tanda tanya (?), dan
tanda seru (!).
Menurut
fungsinya kalimat dapat dirinci menjadi kalimat pernyataan, kalimat pertanyaan,
kalimat perintah, dan kalimat seruan.
a.
Kalimat Pernyataan (Deklaratif)
Kalimat pernyataan digunakan jika penutur ingin
menyatakan suatu informasi kepada lawan berbahasanya. (Biasanya, intonasinya
menurun;diakhiri dengan tanda baca titik).
Contoh:
Positif:
1. Presiden Indonesia mengadakan kunjungan ke luar negeri.
2. Indonesia menggunkan sistem anggaran berimbang.
Negatif:
1. Tidak semua nasabah bank memperoleh kredit lemah.
2. Dalam pameran tersebut para pengunjung tidak mendapat informasi yang
memuaskan tentang bisnis kondominium di kota-kota besar.
b.
Kalimat Pertanyaan (Interogatif)
Kalimat pertanyaan dipakai jika penutur ingin memproleh informasi
atau reaksi (jawaban) yang diharapkan. (Biasanya, intonasi menurun; diakhiri
dengan tanda baca tanda tanya). Sedangkan kata tanya yang biasa digunakan
adalah apa, bagaimana, dimana, mana, berapa, dan lain-lain.
Contoh:
1.
Diamana rumahmu?
2.
Apa maksudmu?
3.
Kapan ujian semester?
4.
Berapa
harga mangga ini satu kilogram?
c.
Kalimat Perintah dan Permintaan (Imperatife)
Kalimat perintah dipakai jika penutur ingin “menyuruh”
atau “melarang” seseorang untuk berbuat sesuatu. (Biasanya, intonasi menurun;
tanda baca titik dan tanda seru).
Contoh:
1.
Tolong buatkan saya
kopi.
2.
Tutup pintunya!
3.
Coba
sebutkan nama-nama bulan!
d.
Kalimat Seruan
Kalimat seruan diapaki jika penutur ingin mengungkapkan
perasaan “yang kuat” atau mendadak.
Contoh:
1.
Waduh…cantiknya.
2.
Aduh…aku
belum mandi tahu.
3.
Wah..kok
bisa seperti ini jadinya.
2.3.10 Rangka atau Struktur Sebuah Paragraf
Rangka
atau struktursebuah paragraf terdiri atas sebuah kalimat topik dan beberapa
kalimat penjelas. Dengan kata lain apabila dalam sebuah paragraf terdapat lebih
dari sebuah kalimat topik, maka paragraf tersebut tidak termasuk kalimat yang
baik. Kalimat-kalimat tersebut harus saling mendukung, saling menunjang,
kait-berkaitdengan yang lainnya.
Kalimat
topik adalh kalimat yang berisi topik yang dibicarakan pengarang. Pengarang
meletakkan inti maksud pembicaraannya pada kalimat topik. Karena topik paragram
adalah pikiran utama dalam sebuah paragraf, maka kalimat topik juga merupakan
kalimat utama dalam paragraf tersebut.
Penempatan
kalimat utama dalampengembangan sebuah paragraf bermacam-macam. Ada paragraf
yang dimulai dari peristiwa-peristiwa atau perincian-perincian, kemudian
ditutup dengan kesimpulan yang berfungsi untuk menjelaskan pikiran utama. Ada
empat cara meletakkan kalimat utama dalam sebuah paragraf, yaitu:
a. Pada awal paragraf
Paragraf dimulai dengan mengemukakan pikiran pokok atau
kalimat utama. Kemudian diikuti dengan kalimat-kalimat penjelas yang berfungsi
untuk menjelaskan pikiran utama. Paragraf yang seperti ini biasanya disebut
dengan paragraf deduktif dari penjelasan dari umum ke khusus.
b. Pada akhir paragraph
Bebeda dengan paragraf deduktif,
paragraf ini dimulai dengan mengemukanakan penjelasan-penjelasan kemudian
ditutup dengan kalimat utama. Paragraf jeins ini sering disebut dengan paragrag
induktif yaitu penjelasan dari khusus ke umum.
c. Pada awal dan akhir
paragraph
Penempatan kalimat utama dapat juga diletakkan pada awal dan
akhir paragraf. Dimana fungsi kalimat utama yang diletakkan pada akhir paragraf
yaitu untuk menekankan kembali pikiran utama yang telah diutarakan diawal
paragraf.
d. Tanpa kalimat utama
Sesuai dengan namanya, kalimat
ini tidak mempunyai kalimat utama. Pikiran utama dari paragraf ini tersebar di
seluruh kalimat yang ada pada paragraf tersebut. Bentuk ini biasanya digunakan
dalam pembuatan karangan narasi atau deskripsi.
Komentar
Posting Komentar