IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
Abstract
Sistem pemerolehan informasi menawarkan kemampuan menyediakan informasi yang dibutuhkan pemakai. Kebanyakan sistem pemerolehan informasi dan mesin pencari web menggunakan inverted index yang terbukti sangat efisien untuk menjawab query. Implementasi sistem pemerolehan menggunakan sistem manajemen basisdata akan memperoleh kelebihan yang ditawarkan oleh RDBMS. Dalam paper ini peneliti
mencoba melakukan penerapan inverted index ke dalam RDBMS untuk mendukung model pemerolehan boolean untuk operasi dasar AND, OR dan NOT. Operasi SQL didukung dengan operasi relational algebra dicoba diterapkan pada RDBMS untuk mendukung query seperti yang diharapkan saat menggunakan
inverted index. Ujicoba dengan menggunakan corpus 5336 dokumen berita teknologi menghasilkan hampir 2 juta baris untuk penerapan inverted index ke dalam RDBMS. Implementasi operasi boolean dasar AND, OR atau NOT menunjukkan bahwa peningkatan jumlah operator boolean yang digunakan dari nol sampai enam membutuhkan waktu yang meningkat secara linier dengan tingkat korelasi di atas 0,99. Dengan spesifikasi sistem yang digunakan, untuk query dengan kata yang dimiliki sekitar 1 sampai 2 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,042 detik sampai sekitar 0,145 detik untuk enam operator. Sedangkan untuk query dengan kata yang dimiliki sekitar 5000 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,458 detik sampai sekitar 1,989 detik untuk enam operator. Salah satu alternatif penerapan inverted index ini dapat digunakan pada sistem yang sesuai
dengan kebutuhan.
Kata Kunci : Inverted index, Sistem pemerolehan boolean, DBMS, RDBMS
mencoba melakukan penerapan inverted index ke dalam RDBMS untuk mendukung model pemerolehan boolean untuk operasi dasar AND, OR dan NOT. Operasi SQL didukung dengan operasi relational algebra dicoba diterapkan pada RDBMS untuk mendukung query seperti yang diharapkan saat menggunakan
inverted index. Ujicoba dengan menggunakan corpus 5336 dokumen berita teknologi menghasilkan hampir 2 juta baris untuk penerapan inverted index ke dalam RDBMS. Implementasi operasi boolean dasar AND, OR atau NOT menunjukkan bahwa peningkatan jumlah operator boolean yang digunakan dari nol sampai enam membutuhkan waktu yang meningkat secara linier dengan tingkat korelasi di atas 0,99. Dengan spesifikasi sistem yang digunakan, untuk query dengan kata yang dimiliki sekitar 1 sampai 2 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,042 detik sampai sekitar 0,145 detik untuk enam operator. Sedangkan untuk query dengan kata yang dimiliki sekitar 5000 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,458 detik sampai sekitar 1,989 detik untuk enam operator. Salah satu alternatif penerapan inverted index ini dapat digunakan pada sistem yang sesuai
dengan kebutuhan.
Kata Kunci : Inverted index, Sistem pemerolehan boolean, DBMS, RDBMS
Full Text:
PDFArticle Metrics
Abstract view : 287 timesPDF - 259 times
Refbacks
- There are currently no refbacks.