Review Jurnal Peringkasan Dokumen Text

Jurnal 1Jurnal 2
Judul JurnalPeringkasan Teks Otomatis Berita
Berbahasa Indonesia Menggunakan
Metode Maximum Marginal Relevance
Implementasi Sistem Temu Kembali Informasi Pada Dokumen Mutu
Penulis1.Muchammad Mustaqfiri
2.Zainal Abidin
3.Ririen Kusnawan
Abdul Rahman Kadafi
Metode Penelitian-automatic text summarization
-teknik pendekatan statika : teknik word and heading word and heading setence position
-teknik dengan pendekatan dengan natural languange analysis : invers term frequency and NLP technique
-lexiacal chain
-maximal marginal relevance dan Goldstein
-Kata Buangan Pembangunan Upload Engine digunakan untuk parsing dokumen
melalui proses upload
-Koleksi Dokumen . File yang dikumpulkan akan diindeks berdasarkan judul
-Parsing Dokumen ruang lingkup dokumen dapat disimpan di dalam database menjadi indeks
-Data / Indeks mesin pencari dokumen
-Matriks Dokumen Indeks n cara mengukur frekuensi
kemunculan kata
-Query Dokumen kata kunci pencarian tunggal dan ganda
Tahun20122018
Hasil Hasil perhitungan evaluasi diurutkan
berdasarkan nilai recall, precision dan fmeasure dari persentase yang tertinggi ke
urutan terendah
Kata-kata buangan yang sudah dipilah diupload dan disimpan ke dalam tabel ‘Common’ pada sistem
database yang sudah dibuat, menggunakan modul “upload kata buangan”. Tabel ‘common’ mempunyai
spesifikasi
Kesimpulan -metode maximum margianal relevance
-query
-recal 60% precison 77% dan f-measure 66%
-pencarian dokumen
-jumlah kunci
-kata kunci
-menggantungkan lebih dari satu kata kunci

Jurnal 1

Peringkasan Teks Otomatis Berita Berbahasa Indonesia Menggunakan
Metode Maximum Marginal Relevance

Latar Belakang

Perkembangan teknologi internet berdampak bertambahnya jumlah situs berita
berbahasa Indonesia dan menciptakan ledakan informasi. Hal tersebut menuntut semua
informasi bisa diakses dengan cepat dan tidak harus membutuhkan banyak waktu dalam
membaca sebuah headline berita.Teknologi peringkas teks otomatis menawarkan solusi
untuk membantu pencarian isi berita berupa deskripsi singkat (summary). Penelitian diawali dengan lima tahap text preprocessing: pemecahan kalimat,case folding, tokenizing,
filtering, dan stemming. Proses selanjutnya menghitung bobot tf-idf, bobot query relevance
dan bobot similarity. Ringkasan dihasilkan dari ekstraksi kalimat dengan menggunakan
metode maximum marginal relevance. Metode ekstraksi maximum marginal relevance merupakan metode yang digunakan untuk mengurangi redudansi dalam perangkingan kalimat pada multi dokumen. Data uji coba diambil dari surat kabar berbahasa Indonesia online sejumlah 30 berita. Hasil pengujian dibandingkan dengan ringkasan manual yang
menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%

Tujuan Penelitian

Berikut ini alur proses peringkasan sistem:
1) User memasukkan teks dokumen yang
akan diringkas dan memasukkan
kalimat query. Proses awal
peringkasan user memasukkan teks
dokumen dan query sesuai Tabel 6.
2) Sistem melakukan penyiapan teks (text
preprosessing) dokumen yang terdiri
dari tahap pemecahan kalimat, case
folding, tokenizing kata, filtering dan
stemming

Metode penelitian

Data yang digunakan sebagai uji coba sejumlah 30 berita. Data uji coba diambil secara acak dari koran berita online
Tempo Interaktif yang diunduh dari bulan
Januari 2009 sampai Juni 2009. Uji coba
dilakukan dengan menguji tiap teks
berita. Pengujian dilakukan dengan
memasukkan isi dari teks berita dan
query. Query merupakan judul dari berita. Kalimat-kalimat yang terambil sebagai
ringkasan merupakan kalimat yang merepresentasikan query, karena memiliki kesamaan kata-kata pada kalimat query, dan

Hasil perhitungan evaluasi diurutkan
berdasarkan nilai recall, precision dan fmeasure dari persentase yang tertinggi ke
urutan terendah. Dari tabel tersebut
menunjukkan bahwa berita ketiga belas
memiliki nilai recall, precision dan fmeasure persentase paling tinggi yaitu
dengan nilai recall 100%, precision
100% dan f-measure 100%, sedangkan
persentase terendah pada berita
kedelapan dengan nilai recall 10%,
precision 50% dan f-measure 17%.
Berdasarkan hasil pengujian dan evaluasi
ringkasan dapat diketahui bahwa hasil
evaluasi antara ringkasan sistem dengan
ringkasan manual menghasilkan nilai
rata-rata recall sebesar 60%, precision
77%, dan f-measure sebesar 66%. Pada
hasil evaluasi antara ringkasan sistem dengan ringkasan manual, terdapat lima berita dengan nilai persentase f-measure
rendah dibawah 50% yaitu berita nomor
9 dengan 46%, berita nomor 5 dengan
46%, berita nomor 6 dengan 31%, berita
nomor 15 dengan 25% dan nomor 8 dengan 17%. Hal ini disebabkan oleh jumlah kalimat yang sama (overlap) adalah
kecil atau sedikit sehingga menyebabkan
hasil f-measurenya rendah. Jika semakin
overlap kalimatnya yang terpilih bany

Kesimpulan

Metode maximum marginal
relevance dapat digunakan untuk meringkas single dokumen secara otomatis dengan menggunakan judul artikel berita
sebagai query, hasil dari uji coba yang
dilakukan menghasilkan rata-rata recall
60%, precision 77%, dan f-measure 66%
berdasarkan perbandingan sistem dengan
ringkasan manual

Jurnal 2

Implementasi Sistem Temu Kembali Informasi Pada Dokumen Mutu

Latar Belakang

Dalam sistem manajemen mutu pendokumentasian dokumen mutu menjadi salah satu hal utama dalam
persyaratan manajemen mutu. Dokumen pada manajemen sistem kendali mutu dapat disimpan dalam bentuk
dokumen digital yang dapat diakses oleh pihak yang berkepentingan. Implementasi temu kembali informasi dalam
pencarian dokumen mutu pada sistem manajemen mutu diharapkan dapat membantu pengguna dalam menemukan
informasi yang relevan dengan kebutuhan dalam waktu singkat untuk jumlah data yang besar. Tujuan dari tulisan
ini adalah untuk menyusun koleksi dokumen sebagai bagian perangkat pengujian sistem temu kembali informasi
untuk dokumen teks berbahasa Indonesia dalam dokumen mutu dan membangun mesin pencari untuk membantu
melakukan pencarian dokumen menggunakan metode Sistem Temu Kembali Informasi. Implementasi sistem temu
kembali informasi dengan merancang mesin pencari berbasis web, yang diharapkan dapat membantu melakukan
pencarian dokumen dalam koleksi dokumen mutu. Pencarian dapat dilakukan dengan memberikan kata kunci
dengan jumlah kunci satu atau lebih atau dapat juga menggabungkan lebih dari satu kata kunci. Penggunaan
mesin pencari dapat dimanfaatkan oleh manajemen, tim mutu, dan pegawai untuk mencari dokumen yang sesuai
dengan proses yang akan dilaksanakan.

Tujuan Penelitian

Pencarian yang digunakan pada dokumen mutu biasanya bersifat word maching berdasarkan kata
kunci pada judul atau penyusun. Hal ini menyebabkan munculnya dokumen yang hanya relevan
berdasarkan judulnya atau penyusunnya saja, tetapi tidak berdasarkan isi dari dokumen tersebut.
Sehingga banyak dokumen relevan yang tidak terpanggil. Penerapan sistem temu kembali informasi
terhadap koleksi dokumen, diharapkan mampu menjawab kebutuhan tersebut

Sistem temu kembali informasi atau Information Retrieval Sistem (IRS) bertujuan untuk
memberitahukan keberadaan (atau ketidakberadaan) dan keterangan dokumen-dokumen yang
berhubungan dengan permintaan dari pengguna, bukan memberitahukan mengenai masalah yang
ditanyakan. Alasan utamanya adalah karena IRS menangani teks bahasa alami yang tidak selalu
terstruktur dengan baik dan bersifat ambigu

metode Penelitian

Dalam implementasi sistem temu kembali informasi untuk koleksi dokumen mutu berbahasa
Indonesia dengan menggunakan dua bagian utama yaitu Indexing subsistem, dan Searching subsistem
(matching sistem), menggunakan beberapa tahapan sebagai berikut:

  1. Kata buangan
    Pada tahap kata buangan, dilakukan penentuan daftar kata-kata buangan yang tidak digunakan dalam
    penyaringan indeks. Pendefinisian kata buangan memilah kata sambung atau kata penghubung yang
    bukan sebagai kata kunci pencarian. Pembangunan Upload Engine digunakan untuk parsing dokumen
    melalui proses upload.
  2. Koleksi Dokumen
    Koleksi dokumen yang diperlukan dalam implementasi sistem temu kembali adalah dokumen yang
    memiliki tema yang sama. Pada tahap koleksi dokumen, dokumen yang dikumpulkan sebanyak 20
    dokumen untuk jenis dokumen panduan, prosedur dan instruksi kerja dengan format .doc (Microsoft
    Word). File yang dikumpulkan akan diindeks berdasarkan judul dan ruang lingkup dokumen dengan
    cara meng-upload dokumen ke sistem database yang sudah disiapkan.Parsing Dokumen
  3. Proses parsing untuk dokumen dilakukan pada Judul dan ruang lingkup dokumen dengan cara
  4. membuang kata buangan yang tidak perlu dijadikan sebagai indeks. Setiap kata yang berada pada judul
  5. dan ruang lingkup dokumen dapat disimpan di dalam database menjadi indeks.
  6. Data / Indeks
  7. Daftar indeks dari setiap dokumen yang terdapat pada koleksi dokumen mutu dihasilkan dari tahap
  8. parsing dokumen. Dalam daftar indeks sudah tidak mengandung kata-kata buangan. Daftar indeks akan
  9. digunakan sebagai kata kunci pencarian informasi dengan menggunakan kata yang sesuai dengan yang
  10. diinputkan pada mesin pencari dokumen.
  11. Matriks Dokumen Indeks
  12. Matriks dokumen indeks merupakan hasil dari indeks dan dokumen dengan cara mengukur frekuensi
  13. kemunculan kata dalam indeks pada setiap dokumen.
  14. Query Dokumen
  15. Pengujian terhadap koleksi indeks yang dirancang dalam proses parsing dokumen dilakukan dengan
  16. menggunakan kata kunci pencarian. Untuk melakukan query dibangun sebuah mesin pencari yang dapat
  17. digunakan untuk memasukkan kata kunci pencarian tunggal dan ganda.

Kesimpulan

Dari pengujian yang dilakukan, dapat disimpulakn bahwa menerapkan konsep-konsep dalam sistem
temu kembali informasi dan membangun suatu mesin pencari dapat membantu dalam melakukan
pencarian dokumen dalam suatu koleksi dokumen. Pencarian dapat dilakukan dengan memberikan kata
kunci dengan jumlah kunci satu atau lebih atau dapat juga menggabungkan lebih dari satu kata kunci