Jurnal 1 | Jurnal 2 | |
Judul Jurnal | Peringkasan Teks Otomatis Berita Berbahasa Indonesia Menggunakan Metode Maximum Marginal Relevance | Implementasi Sistem Temu Kembali Informasi Pada Dokumen Mutu |
Penulis | 1.Muchammad Mustaqfiri 2.Zainal Abidin 3.Ririen Kusnawan | Abdul Rahman Kadafi |
Metode Penelitian | -automatic text summarization -teknik pendekatan statika : teknik word and heading word and heading setence position -teknik dengan pendekatan dengan natural languange analysis : invers term frequency and NLP technique -lexiacal chain -maximal marginal relevance dan Goldstein | -Kata Buangan Pembangunan Upload Engine digunakan untuk parsing dokumen melalui proses upload -Koleksi Dokumen . File yang dikumpulkan akan diindeks berdasarkan judul -Parsing Dokumen ruang lingkup dokumen dapat disimpan di dalam database menjadi indeks -Data / Indeks mesin pencari dokumen -Matriks Dokumen Indeks n cara mengukur frekuensi kemunculan kata -Query Dokumen kata kunci pencarian tunggal dan ganda |
Tahun | 2012 | 2018 |
Hasil | Hasil perhitungan evaluasi diurutkan berdasarkan nilai recall, precision dan fmeasure dari persentase yang tertinggi ke urutan terendah | Kata-kata buangan yang sudah dipilah diupload dan disimpan ke dalam tabel ‘Common’ pada sistem database yang sudah dibuat, menggunakan modul “upload kata buangan”. Tabel ‘common’ mempunyai spesifikasi |
Kesimpulan | -metode maximum margianal relevance -query -recal 60% precison 77% dan f-measure 66% | -pencarian dokumen -jumlah kunci -kata kunci -menggantungkan lebih dari satu kata kunci |
Jurnal 1
Peringkasan Teks Otomatis Berita Berbahasa Indonesia Menggunakan
Metode Maximum Marginal Relevance
Latar Belakang
Perkembangan teknologi internet berdampak bertambahnya jumlah situs berita
berbahasa Indonesia dan menciptakan ledakan informasi. Hal tersebut menuntut semua
informasi bisa diakses dengan cepat dan tidak harus membutuhkan banyak waktu dalam
membaca sebuah headline berita.Teknologi peringkas teks otomatis menawarkan solusi
untuk membantu pencarian isi berita berupa deskripsi singkat (summary). Penelitian diawali dengan lima tahap text preprocessing: pemecahan kalimat,case folding, tokenizing,
filtering, dan stemming. Proses selanjutnya menghitung bobot tf-idf, bobot query relevance
dan bobot similarity. Ringkasan dihasilkan dari ekstraksi kalimat dengan menggunakan
metode maximum marginal relevance. Metode ekstraksi maximum marginal relevance merupakan metode yang digunakan untuk mengurangi redudansi dalam perangkingan kalimat pada multi dokumen. Data uji coba diambil dari surat kabar berbahasa Indonesia online sejumlah 30 berita. Hasil pengujian dibandingkan dengan ringkasan manual yang
menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%
Tujuan Penelitian
Berikut ini alur proses peringkasan sistem:
1) User memasukkan teks dokumen yang
akan diringkas dan memasukkan
kalimat query. Proses awal
peringkasan user memasukkan teks
dokumen dan query sesuai Tabel 6.
2) Sistem melakukan penyiapan teks (text
preprosessing) dokumen yang terdiri
dari tahap pemecahan kalimat, case
folding, tokenizing kata, filtering dan
stemming
Metode penelitian
Data yang digunakan sebagai uji coba sejumlah 30 berita. Data uji coba diambil secara acak dari koran berita online
Tempo Interaktif yang diunduh dari bulan
Januari 2009 sampai Juni 2009. Uji coba
dilakukan dengan menguji tiap teks
berita. Pengujian dilakukan dengan
memasukkan isi dari teks berita dan
query. Query merupakan judul dari berita. Kalimat-kalimat yang terambil sebagai
ringkasan merupakan kalimat yang merepresentasikan query, karena memiliki kesamaan kata-kata pada kalimat query, dan
Hasil perhitungan evaluasi diurutkan
berdasarkan nilai recall, precision dan fmeasure dari persentase yang tertinggi ke
urutan terendah. Dari tabel tersebut
menunjukkan bahwa berita ketiga belas
memiliki nilai recall, precision dan fmeasure persentase paling tinggi yaitu
dengan nilai recall 100%, precision
100% dan f-measure 100%, sedangkan
persentase terendah pada berita
kedelapan dengan nilai recall 10%,
precision 50% dan f-measure 17%.
Berdasarkan hasil pengujian dan evaluasi
ringkasan dapat diketahui bahwa hasil
evaluasi antara ringkasan sistem dengan
ringkasan manual menghasilkan nilai
rata-rata recall sebesar 60%, precision
77%, dan f-measure sebesar 66%. Pada
hasil evaluasi antara ringkasan sistem dengan ringkasan manual, terdapat lima berita dengan nilai persentase f-measure
rendah dibawah 50% yaitu berita nomor
9 dengan 46%, berita nomor 5 dengan
46%, berita nomor 6 dengan 31%, berita
nomor 15 dengan 25% dan nomor 8 dengan 17%. Hal ini disebabkan oleh jumlah kalimat yang sama (overlap) adalah
kecil atau sedikit sehingga menyebabkan
hasil f-measurenya rendah. Jika semakin
overlap kalimatnya yang terpilih bany
Kesimpulan
Metode maximum marginal
relevance dapat digunakan untuk meringkas single dokumen secara otomatis dengan menggunakan judul artikel berita
sebagai query, hasil dari uji coba yang
dilakukan menghasilkan rata-rata recall
60%, precision 77%, dan f-measure 66%
berdasarkan perbandingan sistem dengan
ringkasan manual
Jurnal 2
Implementasi Sistem Temu Kembali Informasi Pada Dokumen Mutu
Latar Belakang
Dalam sistem manajemen mutu pendokumentasian dokumen mutu menjadi salah satu hal utama dalam
persyaratan manajemen mutu. Dokumen pada manajemen sistem kendali mutu dapat disimpan dalam bentuk
dokumen digital yang dapat diakses oleh pihak yang berkepentingan. Implementasi temu kembali informasi dalam
pencarian dokumen mutu pada sistem manajemen mutu diharapkan dapat membantu pengguna dalam menemukan
informasi yang relevan dengan kebutuhan dalam waktu singkat untuk jumlah data yang besar. Tujuan dari tulisan
ini adalah untuk menyusun koleksi dokumen sebagai bagian perangkat pengujian sistem temu kembali informasi
untuk dokumen teks berbahasa Indonesia dalam dokumen mutu dan membangun mesin pencari untuk membantu
melakukan pencarian dokumen menggunakan metode Sistem Temu Kembali Informasi. Implementasi sistem temu
kembali informasi dengan merancang mesin pencari berbasis web, yang diharapkan dapat membantu melakukan
pencarian dokumen dalam koleksi dokumen mutu. Pencarian dapat dilakukan dengan memberikan kata kunci
dengan jumlah kunci satu atau lebih atau dapat juga menggabungkan lebih dari satu kata kunci. Penggunaan
mesin pencari dapat dimanfaatkan oleh manajemen, tim mutu, dan pegawai untuk mencari dokumen yang sesuai
dengan proses yang akan dilaksanakan.
Tujuan Penelitian
Pencarian yang digunakan pada dokumen mutu biasanya bersifat word maching berdasarkan kata
kunci pada judul atau penyusun. Hal ini menyebabkan munculnya dokumen yang hanya relevan
berdasarkan judulnya atau penyusunnya saja, tetapi tidak berdasarkan isi dari dokumen tersebut.
Sehingga banyak dokumen relevan yang tidak terpanggil. Penerapan sistem temu kembali informasi
terhadap koleksi dokumen, diharapkan mampu menjawab kebutuhan tersebut
Sistem temu kembali informasi atau Information Retrieval Sistem (IRS) bertujuan untuk
memberitahukan keberadaan (atau ketidakberadaan) dan keterangan dokumen-dokumen yang
berhubungan dengan permintaan dari pengguna, bukan memberitahukan mengenai masalah yang
ditanyakan. Alasan utamanya adalah karena IRS menangani teks bahasa alami yang tidak selalu
terstruktur dengan baik dan bersifat ambigu
metode Penelitian
Dalam implementasi sistem temu kembali informasi untuk koleksi dokumen mutu berbahasa
Indonesia dengan menggunakan dua bagian utama yaitu Indexing subsistem, dan Searching subsistem
(matching sistem), menggunakan beberapa tahapan sebagai berikut:
- Kata buangan
Pada tahap kata buangan, dilakukan penentuan daftar kata-kata buangan yang tidak digunakan dalam
penyaringan indeks. Pendefinisian kata buangan memilah kata sambung atau kata penghubung yang
bukan sebagai kata kunci pencarian. Pembangunan Upload Engine digunakan untuk parsing dokumen
melalui proses upload. - Koleksi Dokumen
Koleksi dokumen yang diperlukan dalam implementasi sistem temu kembali adalah dokumen yang
memiliki tema yang sama. Pada tahap koleksi dokumen, dokumen yang dikumpulkan sebanyak 20
dokumen untuk jenis dokumen panduan, prosedur dan instruksi kerja dengan format .doc (Microsoft
Word). File yang dikumpulkan akan diindeks berdasarkan judul dan ruang lingkup dokumen dengan
cara meng-upload dokumen ke sistem database yang sudah disiapkan.Parsing Dokumen - Proses parsing untuk dokumen dilakukan pada Judul dan ruang lingkup dokumen dengan cara
- membuang kata buangan yang tidak perlu dijadikan sebagai indeks. Setiap kata yang berada pada judul
- dan ruang lingkup dokumen dapat disimpan di dalam database menjadi indeks.
- Data / Indeks
- Daftar indeks dari setiap dokumen yang terdapat pada koleksi dokumen mutu dihasilkan dari tahap
- parsing dokumen. Dalam daftar indeks sudah tidak mengandung kata-kata buangan. Daftar indeks akan
- digunakan sebagai kata kunci pencarian informasi dengan menggunakan kata yang sesuai dengan yang
- diinputkan pada mesin pencari dokumen.
- Matriks Dokumen Indeks
- Matriks dokumen indeks merupakan hasil dari indeks dan dokumen dengan cara mengukur frekuensi
- kemunculan kata dalam indeks pada setiap dokumen.
- Query Dokumen
- Pengujian terhadap koleksi indeks yang dirancang dalam proses parsing dokumen dilakukan dengan
- menggunakan kata kunci pencarian. Untuk melakukan query dibangun sebuah mesin pencari yang dapat
- digunakan untuk memasukkan kata kunci pencarian tunggal dan ganda.
Kesimpulan
Dari pengujian yang dilakukan, dapat disimpulakn bahwa menerapkan konsep-konsep dalam sistem
temu kembali informasi dan membangun suatu mesin pencari dapat membantu dalam melakukan
pencarian dokumen dalam suatu koleksi dokumen. Pencarian dapat dilakukan dengan memberikan kata
kunci dengan jumlah kunci satu atau lebih atau dapat juga menggabungkan lebih dari satu kata kunci