Skip to main content

Vektor Space Model, Model Probabilistik

Probabilistic

Proses temu balik dikatakan berhasil jika informasi tersebut dapat ditemukan dalam waktu yang singkat dan cepat dengan melalui tahapan atau proses yang singkat dan cepat pula. Dalam menelusur suatu informasi atau dokumen, seseorang akan merasa senang dan puas jika dalam waktu 15 menit ia berhasil menemukannya. Dan akan bertambah senang dan puas lagi jika ia berhasil menemukan informasi atau dokumen tersebut dalam 10 menit, 5 menit atau bahkan 2 menit. Kecepatan dan ketepatan itu akan semakin nyata saat teknologi informasi turut aktif menyertainya. Kehadiran komputer dalam sistem temu balik informasi atau dokumen, semakin menambah keragaman dan kemudahan dalam proses penelusuran.

Dalam Information Retrieval, mendapatkan dokumen yang relevan tidaklah cukup. Tujuan yang harus dipenuhi adalah bagaimana mendapatkan doukmen relevan dan tidak mendapatkan dokumen yang tidak relevan. Tujuan lainnya adalah bagaimana menyusun dokumen yang telah didapatkan tersebut ditampilkan terurut dari dokumen yang memiliki tingkat relevansi lebih tingi ke tingkat relevansi rendah. Penyusunan dokumen terurut tersebut disebut sebagai perangkingan dokumen. Model Ruang Vektor dan Model Probabilistik adalah 2 model pendekatan untuk melakukan hal tersebut.

Model ruang vektor dan model probabilistik adalah model yang menggunakan pembobotan kata dan perangkingan dokumen. Hasil retrieval yang didapat dari model-model ini adalah dokumen terangking yang dianggap paling relevan terhadap query.
Dalam model ruang vektor, dokumen dan query direpresentasikan sebagai vektor dalam dalam ruang vektor yang disusun dalam indeks term, kemudian dimodelkan dengan persamaan geometri. Sedangkan model probabilistik membuat asumsi-asumsi distribusi term dalam dokumen relevan dan tidak relevan dalam orde estimasi kemungkinan relevansi suatu dokumen terhadap suatu query.

Popular posts from this blog

Pengertian Sistem Temu kembali Informasi (IRS)

Sistem temu kembali informasi berasal dari kata Information Retrieval System (IRS). Temu kembali informasi adalah sebuah media layanan bagi pengguna untuk memperoleh informasi atau sumber informasi yang dibutuhkan oleh pengguna. Sistem temu kembali informasi merupakan sistem informasi yang berfungsi untuk menemukan informasi yang relevan dengan kebutuhan pemakai. Sistem temu kembali informasi berfungsi sebagai perantara kebutuhan informasi pengguna dengan sumber informasi yang tersedia. Pengertian yang sama mengenai sistem temu kembali informasi menurut Sulistyo-Basuki sistem temu kembali informasi adalah kegiatan yang bertujuan untuk menyediakan dan memasok informasi bagi pemakai sebagai jawaban atas permintaan atau berdasarkan kebutuhan pemakai. Dapat dinyatakan bahwa sistem temu kembali informasi memiliki fungsi dalam menyediakan kebutuhan informasi sesuai dengan kebutuhan dan permintaan penggunanya.

Sistem Temu Kembali Informasi

Information Retrieval System atau Sistem temu kebali adalah suatu sistem yang digunakan untuk menemukan kembali dokumen-dokumen atau informasi yang relevan yang dibutuhkan oleh pengguna yang dilakukan pada situs web. Dimana sistem ini mencari apa yang di cari oleh user, searching yang dilakukan oleh user dengan memasukan query yang ingin dicari.

Konsep dasar dari IR adalah :
    Indexing
    Searching
    Perengkingan relevansi  keyword query

Indexing
    Berfungsi menghasilkan database index
    Merupakan proses persiapan sehingga dokumen siap untuk di retrive

Konsep dasar dalam Information Retrieval System terdiri dari Indexing, Searching dan perengkingan relevansi keyword query. Dimana proses indexing dilakukan untuk membentuk database index terhadap koleksi dokumen yang dimasukkan, atau dengan kata lain, indexing merupakan proses persiapan yang dilakukan terhadap dokumen sehingga dokumen siap untuk retrive. Proses indexing sendiri meliputi 2 proses, yaitu dokukmen  indexing dan term inde…

Proses Sistem Temu Kembali Informasi

Proses Sistem Temu Kembali Informasi.  Tahapan proses STKI adalah sebagai berikut:
1. Text Operations (operasi terhadap teks) yang meliputi pemilihan kata-kata dalam query maupun dokumen (term selection) dalam pentransformasian dokumen atau query menjadi terms index (indeks dari kata-kata).
2. Query formulation (formulasi terhadap query) yaitu memberi bobot pada indeks kata-kata query.
3. Ranking (perangkingan), mencari dokumen-dokumen yang relevan terhadap query dan mengurutkan dokumen tersebut berdasarkan kesesuaiannya dengan query.
4. Indexing (pengindeksan), membangun basis data indeks dari koleksi dokumen. Dilakukan terlebih dahulu sebelum pencarian dokumen dilakukan.