Selasa, 17 September 2013

Search Enggine

Bagaimana Mesin Pencari Bekerja?

Mesin pencari tidak sederhana. Mereka termasuk memproses dengan metodologi sangat rinci, dan diperbarui setiap saat. Ini adalah bagaimana mesin pencari bekerja untuk mengambil hasil penelusuran. Semua mesin pencari pergi dengan proses dasar ketika melakukan proses pencarian, namun karena ada perbedaan di search engine, ada pasti menjadi hasil berbeda tergantung pada mesin yang kita gunakan.
Jenis pencari permintaan ke mesin pencari.
Software mesin pencari cepat macam melalui jutaan halaman di database-nya untuk menemukan yang cocok untuk pertanyaan pengguna.
Hasil pencarian mesin ditampilkan dalam peringkat urutan relevansi.

Berikut beberapa search engine yang popular digunakan oleh user.

1.      Google.


Bagaimana mungkin seorang pengguna internet tidak mengetahui tentang google. Salah satu mesin pencari yang handal dan digunakan oleh hampir 2/3 orang di muka bumi. Hal itu terbukti ketika beberapa waktu lalu server google sempat down. Dan aktivitas internet di dunia ini menurun hingga kurang lebih 2/3 dari total penggunaan biasanya.


Google berjalan pada jaringan terdistribusi dari ribuan komputer murah dan karena itu dapat melaksanakan pemrosesan paralel cepat. Pemrosesan paralel adalah metode perhitungan di mana banyak perhitungan dapat dilakukan secara simultan, secara signifikan mempercepat pengolahan data. Google memiliki tiga bagian yang berbeda:

Googlebot, web crawler yang menemukan dan menjemput halaman web.
Pengindeks bahwa macam setiap kata pada setiap halaman dan menyimpan indeks yang dihasilkan kata dalam database yang besar.
Permintaan prosesor, yang membandingkan permintaan pencarian Anda ke indeks dan merekomendasikan dokumen yang dianggap paling relevan.
Mari kita melihat lebih dekat pada setiap bagian.

1. Googlebot, Google Web Crawler
Googlebot adalah robot merangkak web Google, yang menemukan dan mengambil halaman di web dan tangan mereka ke pengindeks Google. Sangat mudah untuk membayangkan Googlebot sebagai spider sedikit bergegas di helai dunia maya, tetapi dalam kenyataannya Googlebot tidak melintasi web sama sekali. Ini berfungsi seperti web browser Anda, dengan mengirimkan permintaan ke server web untuk halaman web, men-download seluruh halaman, kemudian menyerahkannya ke pengindeks Google.

Googlebot terdiri dari banyak komputer meminta dan mengambil halaman jauh lebih cepat dari yang Anda bisa dengan browser web Anda. Bahkan, Googlebot dapat meminta ribuan halaman yang berbeda secara bersamaan. Untuk menghindari web server yang luar biasa, atau permintaan crowding out dari pengguna manusia, Googlebot sengaja membuat permintaan dari masing-masing individu web server lebih lambat dari itu mampu melakukan.

2 . Indexer Google
Googlebot memberikan pengindeks teks lengkap dari halaman yang ditemukan. Halaman ini disimpan dalam database indeks Google . Indeks ini diurutkan abjad dengan istilah pencarian , dengan masing-masing entri indeks menyimpan daftar dokumen di mana istilah itu muncul dan lokasi dalam teks di mana itu terjadi . Struktur data memungkinkan akses cepat ke dokumen yang berisi istilah kueri pengguna .

Untuk meningkatkan kinerja pencarian , Google mengabaikan ( tidak indeks ) kata umum yang disebut kata berhenti ( seperti , yang , pada , atau , dari , bagaimana, mengapa , serta digit tunggal tertentu dan huruf tunggal ) . Hentikan kata-kata begitu umum bahwa mereka berbuat banyak untuk mempersempit pencarian , dan karena itu mereka dengan aman bisa dibuang . Pengindeks juga mengabaikan beberapa tanda baca dan beberapa ruang , serta mengkonversi semua huruf menjadi huruf kecil , untuk meningkatkan kinerja Google .

3 . Query Processor Google
Prosesor query memiliki beberapa bagian , termasuk user interface ( kotak pencarian ) , "mesin " yang mengevaluasi permintaan dan pertandingan mereka untuk dokumen yang relevan , dan hasil pemasangan.

PageRank adalah Sistem Google untuk halaman web peringkat . Sebuah halaman dengan PageRank lebih tinggi dianggap lebih penting dan lebih mungkin untuk dicatatkan di atas halaman dengan PageRank rendah .

Google menganggap lebih dari seratus faktor dalam komputasi PageRank dan menentukan dokumen yang paling relevan dengan query , termasuk popularitas halaman , posisi dan ukuran istilah pencarian di dalam halaman , dan kedekatan istilah pencarian satu dengan yang lain pada halaman . Sebuah aplikasi paten membahas faktor-faktor lain yang dipertimbangkan ketika Google peringkat halaman . Kunjungi laporan SEOmoz.org itu untuk menafsirkan konsep dan aplikasi praktis yang terkandung dalam aplikasi paten Google .

Google juga berlaku mesin-belajar teknik untuk meningkatkan kinerja secara otomatis oleh hubungan dan asosiasi belajar dalam data yang tersimpan . Sebagai contoh, sistem ejaan - mengoreksi menggunakan teknik tersebut untuk mengetahui ejaan alternatif kemungkinan . Google erat penjaga menggunakan rumus untuk menghitung relevansi , mereka tweak untuk meningkatkan kualitas dan kinerja, dan untuk mengecoh teknik licik terbaru yang digunakan oleh spammer .

Pengindeksan teks lengkap dari web memungkinkan Google melampaui hanya pencocokan istilah pencarian tunggal. Google memberikan prioritas untuk halaman yang memiliki istilah pencarian dekat satu sama lain dan dalam urutan yang sama seperti query . Google juga bisa mencocokkan multi- frasa kata dan kalimat . Sejak Google indeks kode HTML di samping teks pada halaman , pengguna dapat membatasi pencarian berdasarkan kata mana permintaan muncul, misalnya , dalam judul , dalam URL , di dalam tubuh , dan di link ke halaman , pilihan yang ditawarkan dengan Advanced Search Form Google dan Menggunakan Operator Pencarian ( Operator Lanjutan ) .


2.      Yahoo


Yahoo menyediakan pengguna dengan listing yang datang dari berbagai sumber data. Halaman hasil pencarian Yahoo didominasi listing editorial yang berasal dari google. Namun, penempatan iklan dibayar dari Overture yang ditawarkan dan pilihan untuk melihat sendiri hasil bertenaga manusia Yahoo juga hadir. Selain itu, Yahoo bisa mengarahkan pengguna untuk konten portal sendiri, seperti Yahoo Cakupan Penuh atau daerah perbelanjaan Yahoo.

Halaman-halaman yang tercantum di bawah ini akan menjelaskan bagaimana muncul dalam sumber data utama yang Yahoo gunakan untuk hasil pencarian. Jika Anda baru untuk Yahoo, itu sangat dianjurkan untuk membaca semua halaman di bagian Reading penting. Halaman-halaman yang terdaftar di bawah Informasi lain menyediakan bantuan tambahan

Kecuali disebutkan dalam halaman tersebut mencakup situs utama Yahoo.com, yang terutama ditujukan untuk mereka yang mencari situs di Amerika Serikat atau untuk situs berbahasa Inggris yang menarik bagi pemirsa di seluruh dunia. Beberapa informasi terbatas tentang edisi non-AS dari Yahoo tidak muncul pada halaman Situs Negara Yahoo.

Akhirnya, jika Anda membaca halaman ini sebelum 14 Oktober 2002, Anda mungkin melihat beberapa kesalahan ketik kecil pada mereka. Mengingat perubahan Yahoo baru-baru ini, saya ingin mengintegrasikan semua informasi baru dan posting mereka secepat mungkin. Saya berharap untuk menyelesaikan sepenuhnya pemeriksaan halaman oleh 14 Oktober.

Essential Reading

 -          Web Matches
Menjelaskan bagaimana Yahoo mendapatkan utama " Web Matches
" hasilnya ditampilkan pada halaman hasil pencariannya.

 -          Sponsor Matches
 Menjelaskan bagaimana memiliki peringkat teratas di dalam " Sponsor Matches
" area halaman hasil pencarian Yahoo.

 -          The Yahoo Directory
Menjelaskan bagaimana Yahoo memiliki sendiri " Directory " nya situs web dan bagaimana berada di direktori Yahoo dapat membantu Anda ditemukan melalui daerah Pertandingan Kategori halaman hasil pencarian Yahoo.


3.      Bing


Bing : Mesin pengambil keputusan

Microsoft menyebut Bing sebagai " mesin pengambil keputusan. " Dengan hampir 240 juta situs Web di Internet pada Juli 2009, Anda bisa membayangkan betapa pentingnya metode pencarian yang efektif dapat untuk keberhasilan setiap mesin pencari [sumber : Netcraft ] .
Jadi ada perbedaan antara mesin pencari dan mesin keputusan.  Mungkin itu filosofis . Menurut Microsoft , Bing dirancang untuk meminimalkan jumlah sampah yang Anda dapatkan ketika Anda melakukan pencarian dan untuk membantu menyederhanakan tugas-tugas sehingga Anda dapat membuat keputusan paling informatif .
Bing berfokus pada empat bidang target: belanja, wisata , dan kesehatan setempat . Tujuan yang mendasarinya dinyatakan adalah untuk menyederhanakan pencarian . Dimulai dengan homepage Bing , yang menampilkan kotak pencarian di tengah gambar berwarna-warni dan baris link yang jelas di sebelah kiri halaman yang membawa hasil untuk video , berita , belanja , gambar , atau peta perjalanan . Setelah Anda memulai pencarian Anda , Bing memiliki fitur Autosuggest yang merekomendasikan kata berdasarkan beberapa huruf pertama anda ketik , kemudian daftar mereka untuk Anda untuk memilih jika harus memenuhi pencocokan Anda. Sesuai mirip dengan autosuggest - ia menawarkan Anda apa Bing percaya adalah pertandingan yang paling cocok .
Bing bertujuan untuk mengatur pencarian dalam cara yang mudah bagi pengguna untuk menavigasi .
Jadi bagaimana sebuah program komputer melakukan semua ini ? Jawabannya adalah dalam kode pemrograman . Sama seperti pesaing Google lakukan , Bing mempekerjakan maju set aturan atau petunjuk bahwa setiap pencari pergi melalui dalam rangka untuk mempersempit dan menyaring hasil terbaik . Ini set aturan yang dikenal sebagai algoritma , dan sama seperti ayam restoran cepat saji tertentu itu resep rahasia , Microsoft tidak bersedia untuk berbagi nuansa bagaimana otak Bing bekerja di sebuah forum publik. Beberapa rahasia bing masih dirahasiakan .
Sekarang bahwa Anda telah belajar apa Bing tawarkan.

http://computer.howstuffworks.com/internet/basics/microsoft-bing1.htm

Tidak ada komentar:

Posting Komentar

Pesan