Skip to main content

Posts

Showing posts from August, 2012

Proses Sistem Temu Kembali Informasi

Proses Sistem Temu Kembali Informasi.  Tahapan proses STKI adalah sebagai berikut: 1. Text Operations (operasi terhadap teks) yang meliputi pemilihan kata-kata dalam query maupun dokumen (term selection) dalam pentransformasian dokumen atau query menjadi terms index (indeks dari kata-kata). 2. Query formulation (formulasi terhadap query) yaitu memberi bobot pada indeks kata-kata query. 3. Ranking (perangkingan), mencari dokumen-dokumen yang relevan terhadap query dan mengurutkan dokumen tersebut berdasarkan kesesuaiannya dengan query. 4. Indexing (pengindeksan), membangun basis data indeks dari koleksi dokumen. Dilakukan terlebih dahulu sebelum pencarian dokumen dilakukan.

Manfaat Retrieval System

Sistem Temu Kembali Informasi sebagai sistem yang berfungsi untuk menemukan informasi yang relevan dengan kebutuhan pemakai, merupakan salah satu tipe sistem informasi. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual.Dalam sistem temu kembali informasi, document clustering memberikan beberapa manfaat, antara lain: - mempercepat pemrosesan query dengan menelusur hanya pada sejumlah kecil anggota atau wakil gugus, sehingga dapat mempercepat proses temu kembali informasi. - membantu melokalisir dokumen yang relevan. - membentuk kelas-kelas dokumen sehingga mempermudah penjelajahan dan   pemberian interpretasi terhadap hasil penelusuran. - meningkatkan efektivitas dan efisiensi temu kembali informasi dan  memberikan alternatif metode penelusuran .

Tujuan Indexing

Salah satu faktor yang berpengaruh terhadap sistem temu kembali ialahpengindeksan dokumen. Pengindeksan (indexing) mencakup proses pencatatan ciri- ciri dokumen, analisis isi, klasifikasi maupun pembuatan entri ke dalam bahasa indeks. Tujuan pengindeksan ialah untuk memungkinkan ditemukannya dokumen yang relevan dengan pertanyaan (query) dengan tepat. Informasi dalam indeks adalah cantuman dari berbagai atribut yang diharapkan dapat digunakan sebagai dasar pencarian dokumen. Jika atribut tersebut berupa subjek, maka indeks yang mewakilinya disebut sebagai indeks subjek. Sedangkan bila atribut tersebut berupa pengarang, maka indeks yang mewakilinya disebut sebagai indeks pengarang. Umumnya kegiatan pengindeksan adalah berupa pengindeksan subjek, namun dalam kenyataannya di perpustakaan indeks subjek dan pengarang digunakan secara bersamaan dalam sistem temu kembali. Indeks di perpustakaan berfungsi sebagai sarana atau kunci yang menunjukkankepada penelusur dokumen- dokumen yang po

Vektor Space Model, Model Probabilistik

Proses temu balik dikatakan berhasil jika informasi tersebut dapat ditemukan dalam waktu yang singkat dan cepat dengan melalui tahapan atau proses yang singkat dan cepat pula. Dalam menelusur suatu informasi atau dokumen, seseorang akan merasa senang dan puas jika dalam waktu 15 menit ia berhasil menemukannya. Dan akan bertambah senang dan puas lagi jika ia berhasil menemukan informasi atau dokumen tersebut dalam 10 menit, 5 menit atau bahkan 2 menit. Kecepatan dan ketepatan itu akan semakin nyata saat teknologi informasi turut aktif menyertainya. Kehadiran komputer dalam sistem temu balik informasi atau dokumen, semakin menambah keragaman dan kemudahan dalam proses penelusuran. Dalam Information Retrieval, mendapatkan dokumen yang relevan tidaklah cukup. Tujuan yang harus dipenuhi adalah bagaimana mendapatkan doukmen relevan dan tidak mendapatkan dokumen yang tidak relevan. Tujuan lainnya adalah bagaimana menyusun dokumen yang telah didapatkan tersebut ditampilkan terurut dari

Sistem Temu Balik Informasi

Sistem Temu Kembali  digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu aplikasi umum dari sistem temu kembali informasi adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet. Pengguna dapat mencari halaman-halaman Web yang dibutuhkannya melalui mesin tersebut. Temu balik informasi atau dokumen adalah inti atau sari dari seluruh kegiatan yang ada di perpustakaan. Keberhasilan proses temu balik suatu informasi sangat tergantung pada proses penentuan subyek yang pilih oleh seorang pengolah informasi (pengindeks) untuk pemakai informasi. Ketepatan pemilihan subyek melalui kata atau istilah yang tepat yang disesuaikan dengan kemampuan menerjemahkan, menganalisa dan merangkum isi suatu dokumen dengan kemungkinan pemilihan kata atau istilah oleh pemakai informasi harus tepat. Atau paling tidak mendekati tepat, sehingga kecil kemungkinannya suatu informasi atau

Komponen Sistem Temu Kembali Informasi, komponen STKI

Menurut Lancaster (1979) Sistem Temu Kembali Informasi terdiri dari 6 (enam) subsistem, yaitu: 1.    Subsistem dokumen 2.    Subsistem pengindeksan 3.    Subsistem kosa kata 4.    Subsistem pencarian 5.    Subsistem antarmuka pengguna-sistem 6.    Subsistem penyesuaian. Dokumen sebagai objek data dalam Sistem Temu Kembali Informasi merupakan sumber informasi. Dokumen biasanya dinyatakan dalam bentuk indeks atau kata kunci. Kata kunci dapat diekstrak secara langsung dari teks dokumen atau ditentukan secara khusus oleh spesialis subjek dalam proses pengindeksan yang pada dasarnya terdiri dari proses analisis dan representasi dokumen. Pengindeksan dilakukan dengan menggunakan sistem pengindeksan tertentu, yaitu himpunan kosa kata yang dapat dijadikan sebagai bahasa indeks sehingga diperoleh informasi yang terorganisasi. Sementara itu, pencarian diawali dengan adanya kebutuhan informasi pengguna. 

Fungsi IR, Fungsi Sistem Temu Kembali Informasi

Adapun fungsi utama Sistem Temu Kembali Informasi seperti dikemukakan oleh Lancaster (1979) dan Kent (1971) adalah sebagai berikut: 1.    Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan. 2.    Menganalisis isi sumber informasi  (dokumen) 3.    Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna. 4.    Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam basis data. 5.    Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data. 6.    Menemu-kembalikan informasi yang relevan. 7.    Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.

Tujuan IR, Tujuan Sistem Temu Kembali

Sistem Temu Kembali Informasi didisain untuk menemukan dokumen atau informasi yang diperlukan oleh masyarakat pengguna. Sistem Temu Kembali Informasi bertujuan untuk menjembatani kebutuhan informasi pengguna dengan sumber informasi yang tersedia dalam situasi seperti dikemukakan oleh Belkin (1980) sebagai berikut: 1.    Penulis mempresentasikan sekumpulan ide dalam sebuah dokumen menggunakan sekumpulan konsep. 2.    Terdapat beberapa pengguna yang memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya dengan baik. 3.    Sistem temu kembali informasi bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi pengguna yang dinyatakan dalam bentuk pertanyaan (query). by. beny Hidayat UniversitasStikubank

Definisi Information Retrieval

Sistem temu kembali informasi (information retrieval) adalah ilmu pencarian informasi pada dokumen, pencarian untuk dokumen itu sendiri, pencarian untuk metadata yang menjelaskan dokumen, atau mencari di dalam database, baik relasi database yang stand-alone atau hipertext database yang terdapat pada network seperti internet atau world wide web atau intranet, untuk teks, suara, gambar, atau data. Secara prinsip, penyimpanan informasi dan penemuan kembali informasi adalah hal yang sederhana. Misalkan terdapat tempat penyimpanan dokumen-dokumen dan seseorang (user) merumuskan suatu pertanyaan (request atau query) yang jawabannya adalah himpunan dokumen yang mengandung informasi yang diperlukan yang diekspresikan melalui pertanyaan user. User bisa saja memperoleh dokumen-dokumen yang diperlukannya dengan membaca semua dokumen dalam tempat penyimpanan, menyimpan dokumen-dokumen yang relevan dan membuang dokumen lainnya.

Definisi Stemming

Stemmming merupakan salah satu proses dari pembuatan sistem temu kembali, dimana proses stemming akan dilakukan setelah proses filtering. Proses stemming ini membuat term yang ada pada tabel filtering menjadi kata dasar, dengan menghilankan semua imbuhan yang ada pada kata tersebut ( imbuhan meng-, me-, kan-, di- , i, pe, peng-, a-, dll.). Pentingnya stemming dalam proses pembuatan sistem temu kembali yakni dimana saat menghilangkan imbuhan pada sebuah kata menjadi hal yang perlu diperhatikan. Karena dalam proses stemming yang penting yakni terlebih untuk menghilangkan imbuhan pada awalan setelah itu akhiran. Apabila yang dilakukan adalah sebaliknya maka tidak akan ditemukan kata dasar yang tepat dan sesuai dengan kamus bahasa. Dimana dari hasil proses tersebut akan didapatkan sebuah informasi mengenai banyaknya term yang muncul dalam sebuah dokumen setelah dilakukan perhitungan term frequency.

Algoritma Stemmer

Brute force stemming. Algoritma ini adalah algoritma yang paling sederhana. Bermodalkan database kata dengan kata dasarnya, komputer dengan mudah mencari kata dasar. Namun metode ini mempunyai kelemahan yaitu jumlah database kata dan kata dasarnya harus besar. Kesalahan terjadi bila kata tidak ditemukan di database dan kemudian dianggap kata dasar, padahal bukan.

Stemming Indonesia

Pencarian informasi berupa dokumen teks atau yang dikenal dengan istilah Information Retrieval (IR) merupakan proses pemisahan dokumen-dokumen yang dianggap relevan dari sekumpulan dokumen yang tersedia. Bertambahnya jumlah dokumen teks yang dapat diakses di internet diikuti dengan meningkatnya kebutuhan pengguna akan perangkat pencarianinformasi yang efektif dan efisien. Efektif berarti user mendapatkan dokumen yang relevan dengan query yangdiinputkan. Efisien berarti waktu pencarian yang sesingkat-singkatnya.Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa IR dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke kata dasarnya. Algoritma Stemming untuk bahasa yang satu berbeda denganalgoritma stemming untuk bahasa lainnya. Sebagai contoh Bahasa Inggris memiliki morfologi yang berbeda denganBahasa Indonesia sehingga algoritma stemming untuk kedua bahasa tersebut juga berbeda. Proses stemming pada teks berbahasa Indonesia lebih rumit/kompleks

Fungsi Boolean

Dalam Aljabar Boolean, variable x disebut peubah Boolean. Fungsi Boolean adalah ekspresi yang dibentuk dari peubah Boolean melalui operasi penjumlahan, perkalian, atau komplemen. Contoh: 1. f(x) = x 2. f(x,y) = x’y + x 3. g(x,y,z) = (x + y)’ + xyz’ Selain dengan cara aljabar, fungsi Boolean dapat dinyatakan dalam bentuk tabel kebenaran. Tabel kebenaran adalah suatu tabel yang menyatakan seluruh kemungkinan nilai peubah dari fungsinya.

Aljaba Boolean, Aljabar Biasa

Terdapat perbedaan antara aljabar Boolean dengan aljabar biasa untuk aritmetika bilangan riil : 1.    Hukum distributif yang pertama, a . (b + c) = (a . b) + (a . c) sudah dikenal di dalam aljabar biasa, tetapi hukum distributif yang kedua, a + (b . c) = (a + b) . (a + c), benar untuk aljabar Boolean, tetapi tidak benar untuk aljabar biasa. 2.    Aljabar Boolean tidak memiliki kebalikan perkalian (multiplicative inverse) dan kebalikan penjumlahan; karena itu, tidak ada operasi pembagian dan pengurangan di dalam aljabar Boolean. 3.    Aksioma nomor 4 pada definisi 2.1 mendefinisikan operator yang dinamakan komplemen yang tidak tersedia pada aljabar biasa. 4.     Aljabar biasa memperlakukan himpunan bilangan riil dengan elemen yang tidak berhingga banyaknya. Sedangkan aljabar Boolean memperlakukan himpunan elemen B yang sampai sekarang belum didefinisikan, tetapi pada aljabar Boolean dua-nilai, B didefinisikan sebagai himpunan dengan hanya dua nilai, 0 dan 1.

Definisi Operator Boolean

Aljabar Boolean dapat didefinisikan secara abstrak dalam beberapa cara. Cara yang paling umum adalah dengan menspesifikasikan unsur – unsur pembentuknya dan operasi – operasi yang menyertainya. (Definisi 2.1 – Menurut Lipschutz, Seymour & Marc Lars Lipson dalam bukunya ‘2000 Solved Problems in Discrete Mathematics’, McGraw-Hill, 1992) Misalkan B adalah himpunan yang didefinisikan pada dua operator biner, + dan ., dan sebuah operator uner,’. Misalkan 0 dan 1 adalah dua elemen yang berbeda dari B. Maka, tupel <B, +, ., ‘, 0, 1> disebut aljabar Boolean jika untuk setiap a, b, c 0 B berlaku aksioma (sering dinamakan juga Postulat Huntington) berikut :

Boolean

Fungsi Boolean seringkali mengandung operasi–operasi yang tidak perlu, literal atau suku–suku yang berlebihan. Oleh karena itu fungsi Boolean dapat disederhanakan lebih lanjut. Menyederhanakan fungsi Boolean artinya mencari bentuk fungsi lain yang ekivalen tetapi dengan jumlah literal atau operasi yang lebih sedikit. Penyederhanaan fungsi Boolean disebut juga minimisasi fungsi.