Bagaimana Mesin Pencari Bekerja?
Mesin pencari tidak sederhana. Mereka termasuk memproses dengan
metodologi sangat rinci, dan diperbarui setiap saat. Ini adalah bagaimana mesin
pencari bekerja untuk mengambil hasil penelusuran. Semua mesin pencari pergi dengan
proses dasar ketika melakukan proses pencarian, namun karena ada perbedaan di
search engine, ada pasti menjadi hasil berbeda tergantung pada mesin yang kita
gunakan.
Jenis pencari permintaan ke mesin pencari.
Software mesin pencari cepat macam melalui jutaan halaman di
database-nya untuk menemukan yang cocok untuk pertanyaan pengguna.
Hasil pencarian mesin ditampilkan dalam peringkat urutan
relevansi.
Berikut beberapa search engine yang popular digunakan oleh
user.
1.
Google.
Bagaimana mungkin seorang pengguna internet
tidak mengetahui tentang google. Salah satu mesin pencari yang handal dan
digunakan oleh hampir 2/3 orang di muka bumi. Hal itu terbukti ketika beberapa
waktu lalu server google sempat down. Dan aktivitas internet di dunia ini
menurun hingga kurang lebih 2/3 dari total penggunaan biasanya.
Google berjalan pada jaringan terdistribusi
dari ribuan komputer murah dan karena itu dapat melaksanakan pemrosesan paralel
cepat. Pemrosesan paralel adalah metode perhitungan di mana banyak perhitungan
dapat dilakukan secara simultan, secara signifikan mempercepat pengolahan data.
Google memiliki tiga bagian yang berbeda:
Googlebot, web crawler yang menemukan dan
menjemput halaman web.
Pengindeks bahwa macam setiap kata pada
setiap halaman dan menyimpan indeks yang dihasilkan kata dalam database yang
besar.
Permintaan prosesor, yang membandingkan
permintaan pencarian Anda ke indeks dan merekomendasikan dokumen yang dianggap
paling relevan.
Mari kita melihat lebih dekat pada setiap
bagian.
1. Googlebot, Google Web Crawler
Googlebot adalah robot merangkak web
Google, yang menemukan dan mengambil halaman di web dan tangan mereka ke
pengindeks Google. Sangat mudah untuk membayangkan Googlebot sebagai spider
sedikit bergegas di helai dunia maya, tetapi dalam kenyataannya Googlebot tidak
melintasi web sama sekali. Ini berfungsi seperti web browser Anda, dengan
mengirimkan permintaan ke server web untuk halaman web, men-download seluruh
halaman, kemudian menyerahkannya ke pengindeks Google.
Googlebot terdiri dari banyak komputer
meminta dan mengambil halaman jauh lebih cepat dari yang Anda bisa dengan
browser web Anda. Bahkan, Googlebot dapat meminta ribuan halaman yang berbeda
secara bersamaan. Untuk menghindari web server yang luar biasa, atau permintaan
crowding out dari pengguna manusia, Googlebot sengaja membuat permintaan dari
masing-masing individu web server lebih lambat dari itu mampu melakukan.
2 . Indexer Google
Googlebot memberikan pengindeks teks
lengkap dari halaman yang ditemukan. Halaman ini disimpan dalam database indeks
Google . Indeks ini diurutkan abjad dengan istilah pencarian , dengan
masing-masing entri indeks menyimpan daftar dokumen di mana istilah itu muncul
dan lokasi dalam teks di mana itu terjadi . Struktur data memungkinkan akses
cepat ke dokumen yang berisi istilah kueri pengguna .
Untuk meningkatkan kinerja pencarian ,
Google mengabaikan ( tidak indeks ) kata umum yang disebut kata berhenti (
seperti , yang , pada , atau , dari , bagaimana, mengapa , serta digit tunggal
tertentu dan huruf tunggal ) . Hentikan kata-kata begitu umum bahwa mereka
berbuat banyak untuk mempersempit pencarian , dan karena itu mereka dengan aman
bisa dibuang . Pengindeks juga mengabaikan beberapa tanda baca dan beberapa
ruang , serta mengkonversi semua huruf menjadi huruf kecil , untuk meningkatkan
kinerja Google .
3 . Query Processor Google
Prosesor query memiliki beberapa bagian ,
termasuk user interface ( kotak pencarian ) , "mesin " yang
mengevaluasi permintaan dan pertandingan mereka untuk dokumen yang relevan ,
dan hasil pemasangan.
PageRank adalah Sistem Google untuk halaman
web peringkat . Sebuah halaman dengan PageRank lebih tinggi dianggap lebih
penting dan lebih mungkin untuk dicatatkan di atas halaman dengan PageRank
rendah .
Google menganggap lebih dari seratus faktor
dalam komputasi PageRank dan menentukan dokumen yang paling relevan dengan
query , termasuk popularitas halaman , posisi dan ukuran istilah pencarian di
dalam halaman , dan kedekatan istilah pencarian satu dengan yang lain pada
halaman . Sebuah aplikasi paten membahas faktor-faktor lain yang
dipertimbangkan ketika Google peringkat halaman . Kunjungi laporan SEOmoz.org
itu untuk menafsirkan konsep dan aplikasi praktis yang terkandung dalam
aplikasi paten Google .
Google juga berlaku mesin-belajar teknik
untuk meningkatkan kinerja secara otomatis oleh hubungan dan asosiasi belajar
dalam data yang tersimpan . Sebagai contoh, sistem ejaan - mengoreksi
menggunakan teknik tersebut untuk mengetahui ejaan alternatif kemungkinan . Google
erat penjaga menggunakan rumus untuk menghitung relevansi , mereka tweak untuk
meningkatkan kualitas dan kinerja, dan untuk mengecoh teknik licik terbaru yang
digunakan oleh spammer .
Pengindeksan teks lengkap dari web
memungkinkan Google melampaui hanya pencocokan istilah pencarian tunggal.
Google memberikan prioritas untuk halaman yang memiliki istilah pencarian dekat
satu sama lain dan dalam urutan yang sama seperti query . Google juga bisa
mencocokkan multi- frasa kata dan kalimat . Sejak Google indeks kode HTML di
samping teks pada halaman , pengguna dapat membatasi pencarian berdasarkan kata
mana permintaan muncul, misalnya , dalam judul , dalam URL , di dalam tubuh ,
dan di link ke halaman , pilihan yang ditawarkan dengan Advanced Search Form Google
dan Menggunakan Operator Pencarian ( Operator Lanjutan ) .
2.
Yahoo
Yahoo menyediakan pengguna dengan listing
yang datang dari berbagai sumber data. Halaman hasil pencarian Yahoo didominasi
listing editorial yang berasal dari google. Namun, penempatan iklan dibayar
dari Overture yang ditawarkan dan pilihan untuk melihat sendiri hasil bertenaga
manusia Yahoo juga hadir. Selain itu, Yahoo bisa mengarahkan pengguna untuk
konten portal sendiri, seperti Yahoo Cakupan Penuh atau daerah perbelanjaan
Yahoo.
Halaman-halaman yang tercantum di bawah ini
akan menjelaskan bagaimana muncul dalam sumber data utama yang Yahoo gunakan
untuk hasil pencarian. Jika Anda baru untuk Yahoo, itu sangat dianjurkan untuk
membaca semua halaman di bagian Reading penting. Halaman-halaman yang terdaftar
di bawah Informasi lain menyediakan bantuan tambahan
Kecuali disebutkan dalam halaman tersebut
mencakup situs utama Yahoo.com, yang terutama ditujukan untuk mereka yang
mencari situs di Amerika Serikat atau untuk situs berbahasa Inggris yang
menarik bagi pemirsa di seluruh dunia. Beberapa informasi terbatas tentang
edisi non-AS dari Yahoo tidak muncul pada halaman Situs Negara Yahoo.
Akhirnya, jika Anda membaca halaman ini
sebelum 14 Oktober 2002, Anda mungkin melihat beberapa kesalahan ketik kecil
pada mereka. Mengingat perubahan Yahoo baru-baru ini, saya ingin
mengintegrasikan semua informasi baru dan posting mereka secepat mungkin. Saya
berharap untuk menyelesaikan sepenuhnya pemeriksaan halaman oleh 14 Oktober.
Essential Reading
Menjelaskan bagaimana Yahoo mendapatkan utama
" Web Matches
" hasilnya ditampilkan pada halaman
hasil pencariannya.
Menjelaskan bagaimana memiliki peringkat teratas
di dalam " Sponsor Matches
" area halaman hasil pencarian Yahoo.
Menjelaskan bagaimana Yahoo memiliki
sendiri " Directory " nya situs web dan bagaimana berada di direktori
Yahoo dapat membantu Anda ditemukan melalui daerah Pertandingan Kategori
halaman hasil pencarian Yahoo.
3.
Bing
Bing : Mesin pengambil keputusan
Microsoft menyebut Bing sebagai "
mesin pengambil keputusan. " Dengan hampir 240 juta situs Web di Internet
pada Juli 2009, Anda bisa membayangkan betapa pentingnya metode pencarian yang
efektif dapat untuk keberhasilan setiap mesin pencari [sumber : Netcraft ] .
Jadi ada perbedaan antara mesin pencari dan
mesin keputusan. Mungkin itu filosofis .
Menurut Microsoft , Bing dirancang untuk meminimalkan jumlah sampah yang Anda
dapatkan ketika Anda melakukan pencarian dan untuk membantu menyederhanakan
tugas-tugas sehingga Anda dapat membuat keputusan paling informatif .
Bing berfokus pada empat bidang target:
belanja, wisata , dan kesehatan setempat . Tujuan yang mendasarinya dinyatakan
adalah untuk menyederhanakan pencarian . Dimulai dengan homepage Bing , yang
menampilkan kotak pencarian di tengah gambar berwarna-warni dan baris link yang
jelas di sebelah kiri halaman yang membawa hasil untuk video , berita , belanja
, gambar , atau peta perjalanan . Setelah Anda memulai pencarian Anda , Bing
memiliki fitur Autosuggest yang merekomendasikan kata berdasarkan beberapa
huruf pertama anda ketik , kemudian daftar mereka untuk Anda untuk memilih jika
harus memenuhi pencocokan Anda. Sesuai mirip dengan autosuggest - ia menawarkan
Anda apa Bing percaya adalah pertandingan yang paling cocok .
Bing bertujuan untuk mengatur pencarian
dalam cara yang mudah bagi pengguna untuk menavigasi .
Jadi bagaimana sebuah program komputer
melakukan semua ini ? Jawabannya adalah dalam kode pemrograman . Sama seperti
pesaing Google lakukan , Bing mempekerjakan maju set aturan atau petunjuk bahwa
setiap pencari pergi melalui dalam rangka untuk mempersempit dan menyaring
hasil terbaik . Ini set aturan yang dikenal sebagai algoritma , dan sama
seperti ayam restoran cepat saji tertentu itu resep rahasia , Microsoft tidak
bersedia untuk berbagi nuansa bagaimana otak Bing bekerja di sebuah forum
publik. Beberapa rahasia bing masih dirahasiakan .
Sekarang bahwa Anda telah belajar apa Bing
tawarkan.