Tutorial Teknis: Membuat mesin pencari sederhana menggunakan Python
Mesin pencari adalah alat Internet penting yang membantu pengguna menemukan informasi berdasarkan kata kunci. Faktanya, kita juga bisa menggunakan Python untuk membuat mesin pencari lokal sederhana.
Langkah-langkah Membuat Mesin Pencari Sederhana:
Siapkan datanya
Pertama, siapkan beberapa file teks sebagai konten pencarian, misalnya:
article1.txt: Konten tentang teknologi
article2.txt: Konten tentang pendidikan
article3.txt: Konten berita terkini
Instal perpustakaan yang diperlukan
kami akan menggunakan scikit-belajar Perpustakaan untuk menangani vektorisasi teks:
pip instal scikit-belajar
Tulis kode mesin pencari
dari sklearn.feature_extraction.teks impor TfidfVectorizer
impor mereka
Baca Semua File Teks
dokumen = [open(f, ‘r’, coding=’utf-8′).read() untuk f dalam file]
Buat Model TF-IDF
vektorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(dokumen)
Fungsi Pencarian
def pencarian (kueri):
query_vec = vektorizer.transform([kueri])
skor = (tfidf_matrix * query_vec.T).toarray()
hasil = diurutkan(zip(file, skor), kunci=lambda x: -x[1][0])
untuk file, skor dalam hasil:
jika skor[0] > 0:
print(f”{file}: skor relevansi {skor[0]:.2f}”)
pencarian(“Teknologi Internet”)
Uji Mesin Pencari
Setelah menjalankan program, masukkan kata kunci untuk melihat file yang paling relevan.
Meskipun mesin pencari ini relatif mendasar, Anda dapat memperluasnya lebih jauh dengan menambahkan fitur seperti perayapan web, pengindeksan basis data, atau pencarian semantik.
Apakah saya perlu menambahkan versi antarmuka web atau antarmuka grafis dari mesin pencari ini?