5 Des 2011

Your here: Home » , , , , , » CARA KERJA GOOGLE SEARCH ENGINE

CARA KERJA GOOGLE SEARCH ENGINE

Tahukah anda bagaimana CARA KERJA GOOGLE SEARCH ENGINE ? Berikut ulasannya :
Search Engine seperti Google, Yahoo!, Bing, Cuil, dll, merupakan tempat dimana kita melakukan pencarian data atau informasi berupa kata kunci tertentu. Tahukah Anda bagaimana cara kerja search engine, sampai dapat menemukan hasil pencarian dalam waktu singkat dan dengan hasil pencarian yang sangat banyak? Dalam artikel ini saya mengutip cara kerja search engine Google dari buku Google Hacking – Cara Baru Melakukan Hacking Tanpa Tools karya Efvy Zam Kerinci.

Sebuah search engine memiliki komponen yang disebut sebagai spider (laba-laba) atau sering disebut juga dengan crawler. Elemen spider tersebut melakukan kunjungan atau mengakses ke situs-situs internet untuk membaca isinya dan mengikuti berbagai link yang ada dalam situs tersebut. Biasanya search engine melakukan kunjungan tersebut secara periodik untuk melihat jika ada perubahan-perubahan yang terjadi.

Program yang dikenal sebagai crawler, spider atau robot yang digunakan Google sebagai petugas penjelajah dunia internet tersebut dinamakan Cusco, Scooter dan Deephot. Ketiga program Google tersebut menilai sebuah situs dengan berbagai cara. Pertama-tama mencari info utama dari sebuah tittle-tag, HTML tag, serta meta tag. Selain itu, juga menelusuri teks yang ada pada situs beserta link-nya. Tidak ketinggalan pula untuk memeriksa file robot.txt yang memuat informasi mana saja yang boleh diteruskan dan yang tidak. Dari hal ini maka aka ada direktori tertentu yang diabaikan pendataannya. Terutama pada file-file yang berisi informasi sensitif.

Tiap-tiap elemen yang ditemui oleh sang laba-laba (spider) akan direkam (record) dalam sebuah index. Mirip sebuah buku raksasa yang berisikan copy dari situs yang telah ditemukan. Apabila ditemukan perubahan pada situs, secara otomatis pula spider melakukan update.

Google melakukan proses pengindeksan tersebut secara otomatis dan teratur. Pada saat itu pula Google mendata halaman baru, membuang link yang mati, dan memperbarui link tersebut.

Terkadang diperlukan proses penulisan halaman baru dari yang ditemukan spider. Jadi, akan ada kemungkinan bahwa informasi terbaru dalam situs internet tersebut tidak masuk dalam katalog index.

Selanjutnya, aplikasi search engine yang bertugas memilah ribuan data yang terdapat dalam katalog. Serta mencocokkannya sesuai dengan permintaan si pencari. Barulah kemudian menampilkannya berupa daftar sesuai dengan urutan (ranking). aplikasi yang digunkan Google untuk membuat ranking tersebut dikenal dengan sebutan PageRank.

Sebelum sebuah search engine menampilkan hasil pencariannya, search engine tersebut haruslah terlebih dahulu menemukan dokumen yang dicari. Andaikata search engine tidak memberikan informasi yang kita cari, itu bukan berarti informasi tersebut tidak tersedia di internet. Bisa jadi informasi yang kita cari tersebut belum ditemukan oleh search engine.

Sewaktu mencari informasi menggunakan Google, Google akan mengabaikan beberapa kata berikut: a, about, an, and, are, as, at, be, by, from, how, i, in, is, it, of, on, or, that, the, this, to, we, what, when, where, which, dan with.

Untuk mengetahui bagaimana sebuah search engine bekerja, Anda dapat membuka situs www.spider-simulator.com. Dalam situs tersebut ditunjukkan bagaimana sebuah search engine memperoleh informasi dalam situs Anda. Program ini disebut spider simulator. untuk mencobanya, Anda hanya perlu memasukkan alamat situs.

Semoga ulasan tentang bagaimana CARA KERJA GOOGLE SEARCH ENGINE ini bermanfaat untuk anda.

0 komentar: