New Google Web Indexing System: Caffeine

Rabu, 09/06/2010 Internet 1302 hits


Google kembali berinovasi, dan kali ini lebih memantapkan produk unggulannya yakni Search Engine. Kini yang dirilis adalah web Indexing Sistem baru yang diberi nama Caffeine. Caffeine menyediakan 50% hasil percarian yang fresh dengan koleksi yang lebih banyak lagi. Penasaran dengan informasi lebih lengkapnya ? berikut hasil google translatenya ya :)

Hari ini, kami mengumumkan selesainya sistem mengindeks web baru yang disebut Kafein. Kafein memberikan hasil 50 persen lebih segar untuk pencarian web dari indeks terakhir kami, dan merupakan koleksi terbesar dari konten web kita sudah menawarkan. Apakah itu berita, blog atau posting forum, sekarang Anda dapat menemukan link ke konten yang relevan lebih cepat setelah diterbitkan daripada yang mungkin pernah ada sebelumnya.

Beberapa latar belakang bagi anda yang tidak membangun mesin pencari untuk hidup seperti kami: bila Anda pencarian Google, Anda tidak mencari web hidup. Sebaliknya Anda cari indeks Google dari web yang, seperti daftar di belakang buku, membantu Anda menentukan persis informasi yang Anda butuhkan. (Berikut adalah penjelasan yang baik tentang bagaimana semuanya bekerja.)

Jadi, mengapa kita membangun sebuah sistem pencari mengindeks baru? Konten di web ini berbunga. Ini berkembang tidak hanya dalam ukuran dan jumlah tetapi dengan munculnya dari video, gambar, berita dan real-time update, halaman Web rata lebih kaya dan lebih kompleks. Selain itu, harapan masyarakat untuk pencarian lebih tinggi daripada dulu. Ingin pencari untuk menemukan konten yang relevan terbaru dan penerbit berharap akan menemukan instan mereka terbitkan.

Untuk mengikuti evolusi web dan untuk memenuhi meningkatnya harapan pengguna, kami telah membangun Kafein. Gambar di bawah ini menggambarkan bagaimana sistem pengindeksan lama kita bekerja dibandingkan dengan Kafein:

indeks tua kami telah beberapa lapisan, beberapa yang segar di tingkat yang lebih cepat daripada yang lain; lapisan utama akan memperbarui setiap dua minggu. Untuk me-refresh lapisan indeks tua, kami akan menganalisis seluruh web, yang berarti ada penundaan yang signifikan antara saat kami menemukan halaman dan membuatnya tersedia untuk Anda.

Dengan Kafein, kami menganalisis web dalam porsi kecil dan memutakhirkan indeks pencarian kami secara terus menerus, secara global. Saat kami menemukan halaman baru, atau informasi baru pada halaman yang ada, kita bisa menambahkan langsung ke indeks. Itu berarti Anda dapat menemukan informasi lebih segar daripada sebelumnya-tidak peduli kapan atau di mana ia dipublikasikan.

Kafein memungkinkan kami indeks halaman web dalam skala besar. Bahkan, setiap Kafein kedua proses ratusan ribu halaman dalam paralel. Jika ini adalah tumpukan kertas itu akan tumbuh tiga mil lebih tinggi setiap detik. Kafein membutuhkan hampir 100 juta gigabyte penyimpanan dalam satu database dan menambahkan informasi baru pada tingkat ratusan ribu gigabyte per hari. Anda akan membutuhkan 625.000 dari iPod terbesar untuk menyimpan informasi yang banyak, jika ini ditumpuk end-to-end mereka akan pergi untuk lebih dari 40 mil.

Kami telah membangun Kafein dengan masa depan dalam pikiran. Tidak hanya itu segar, itu dasar kuat yang memungkinkan kita untuk membangun sebuah mesin pencari lebih cepat dan komprehensif bahwa skala dengan pertumbuhan informasi online, dan bahkan memberikan hasil pencarian yang lebih relevan bagi Anda. Sehingga menantikan, dan mencari perbaikan lebih dalam bulan-bulan mendatang.

Berikut adalah informasi resminya:

Today, we're announcing the completion of a new web indexing system called Caffeine. Caffeine provides 50 percent fresher results for web searches than our last index, and it's the largest collection of web content we've offered. Whether it's a news story, a blog or a forum post, you can now find links to relevant content much sooner after it is published than was possible ever before.

Some background for those of you who don't build search engines for a living like us: when you search Google, you're not searching the live web. Instead you're searching Google's index of the web which, like the list in the back of a book, helps you pinpoint exactly the information you need. (Here's a good explanation of how it all works.)

So why did we build a new search indexing system? Content on the web is blossoming. It's growing not just in size and numbers but with the advent of video, images, news and real-time updates, the average webpage is richer and more complex. In addition, people's expectations for search are higher than they used to be. Searchers want to find the latest relevant content and publishers expect to be found the instant they publish.

To keep up with the evolution of the web and to meet rising user expectations, we've built Caffeine. The image below illustrates how our old indexing system worked compared to Caffeine:
Our old index had several layers, some of which were refreshed at a faster rate than others; the main layer would update every couple of weeks. To refresh a layer of the old index, we would analyze the entire web, which meant there was a significant delay between when we found a page and made it available to you.

With Caffeine, we analyze the web in small portions and update our search index on a continuous basis, globally. As we find new pages, or new information on existing pages, we can add these straight to the index. That means you can find fresher information than ever before—no matter when or where it was published.

Caffeine lets us index web pages on an enormous scale. In fact, every second Caffeine processes hundreds of thousands of pages in parallel. If this were a pile of paper it would grow three miles taller every second. Caffeine takes up nearly 100 million gigabytes of storage in one database and adds new information at a rate of hundreds of thousands of gigabytes per day. You would need 625,000 of the largest iPods to store that much information; if these were stacked end-to-end they would go for more than 40 miles.

We've built Caffeine with the future in mind. Not only is it fresher, it's a robust foundation that makes it possible for us to build an even faster and comprehensive search engine that scales with the growth of information online, and delivers even more relevant search results to you. So stay tuned, and look for more improvements in the months to come.

Posted by Carrie Grimes, Software Engineer

Ref: http://googleblog.blogspot.com/2010/06/our-new-search-index-caffeine.html

: tanpa label



Silakan beri komentar :)

Tahukah ANDA ?
Untuk mencetak satu edisi Sunday Edition koran "The New York Times", diperlukan kertas yang berasal dari kira-kira 63.000 batang pohon. Harap dimaklumi, satu edisi "The New York Times" terdiri dari puluhan halaman dengan rata-rata satu edisi lengkap mencapai berat satu kilogram. Selain itu, harian "The New York Times" juga termasuk…


MUTIARA HADIST

Abu Dzar R.a., Dia Berkata, Rasulullah SAW., Bersabda, "Setiap Tulang Dan Persendian Badan Dari Kamu Ada Sedekahnya; Setiap Tasbih Adalah Sedekah, Setiap Tahmid Adalah Sedekah, Setiap Tahlil Adalah Sedekah, Setiap Takbir Adalah Sedekah, Setiap Amar Ma'ruf Adalah Sedekah Dan Setiap Nahi Munkar Adalah Sedekah. Maka, Yang Dapat Mencukupi Hal Itu Hanyalah Dua Raka'at Yang Dilakukannya Dari Shalat Dua."

Kekuatan Sholat Dhuha

Hosting, VPS & Server

Kini saatnya memiliki website/blog professional dan memiliki prestise baik untuk pribadi maupun instansi/perusahaan. Layanan VPS maupun Dedicated Server dengan harga yang terjangkau

Learn More

Web Desain

Memerlukan layanan Jasa pembuatan website ? Jangan ragu untuk menggunakan layanan GaluhWeb yang telah digunakan oleh puluhan Pelanggan. Ayo tunggu apalagi ?

Learn More

Domain

Gunakan identitas bisnis atau blog dengan domain yang keren. Harga murah dengan fitur melimpah. Buruan daftarkan domain anda sebelum keduluan yang lain :)

Learn More