تكنولوژی گوگل
«جدا از مشكلات مقیاس گذاری تكنیك های جستجوی قدیمی، برای داده های به این اندازه، تكنیك های جدید رقابتی كه استفاده از نمایش اطلاعات اضافی در فرا متن ها را برای نتیجة جستجوی بهتر شامل میشود وجود دارد… خیزش سریع تكنولوژی برای جمع آوری مستندات وب و نگهداری آن ها بصورت بروز لازم و ضروری است فضای ذخیره سازی باید به نحو موثری جهت ذخیرة ایندكس ها و مستند |
دسته بندی | کامپیوتر |
فرمت فایل | doc |
حجم فایل | 797 کیلو بایت |
تعداد صفحات فایل | 77 |
در ابتدا BackRub وجود داشت، سرویسی كه به گوگل تبدیل شد. امروزه گوگل با دقت بیشتری به الگوریتم pageRankخود وابسته است. PageRank الگوریتمی انتخابی است كه ارزش را به چیز مهمتر می دهد. نشانگر اهمیت یك صفحة وب تعداد صفحاتی است كه به آن صفحة خاص لینك می شوند.
آقایان بِریِن و پِیچ خیلی زود فاكتور جدیدی را به این الگوریتم اضافه كردند كه رأی را به صفحة مهمتر می داد. ایدة آنها این بود كه صفحه ای مهمتر است كه تعداد افراد بیشتری بر روی آن كلیك می كنند.كلیك های بیشتر روی یك صفحة وب باعث می شد كه آن صفحه وب دارای ارزش و اهمیت بیشتری شود. در انتها، آرام آرام فاكتورهای دیگری نیز به این الگوریتم اضافه شد. برای مثال ، تعداد دفعاتی كه محتوای یك صفحه تغییر
می كند نیز یكی از فاكتور های مهم شد.
تكنولوژی pogeRank گوگل دقیقاً به جستجوی اینترنتی وابسته شده است. برای نمونه، الگوریتم رأی گیری(Voting Algorithm) كارایی كمتری در عمل جستجو دارد. توجهی كه گوگل نسبت به تكنولوژی جستجویش كرد، باعث تحت الشعاع قرار گرفتن افكار عمومی راجع به این شركت شد. جستجوی گوگل همانند یك ستارة نوظهوراستكهدرخشندگیاش باعث شده تا ناظران نتوانند جهات دیگر این پدیده را به وضوح و دقیق مشاهده كنند.
صرف نظر از این ، گوگل یك شركت تكنولوژی است[1]بعضی از این تكنولوژی ها هنگامی كه دریك مقاله توضیح داده می شوند مانند مقالة “The Anatomy of a Large –Scale Hypertextual” كه در همان اوایل مطرح شد، خواستار پیدا می كنند. مقاله های اخیر مانند
“MapReduce: Simplified Data search Engine" می توانند به آرامی خوانده شوند[2] با توجه به اینكه گوگل یك تكنولوژی است، توضیح دادن اینكه گوگل چكار می كند، درجملات ساده وقابل هضم قدری مشكل است. شكل زیر یك دید كلی از چهار چوب گوگل را ارائه می كند.
شكل 3-1: نمایی كلی از چهار چوب گوگل
مهمترین قسمت های تكنولوژی گوگل كه پایه و اساس دیاگرام Googleplex است شامل موارد زیر میشوند:
[a]: اصلاح لینوكس به منظور اجازه دادن به فایل های بزرگ و دیگر توابع درجهت دادن شتاب بیشتر به همة سیستم
[b]: یك معماری توزیع شده كه به برنامه های كار بردی و مقیاس بندی ها اجازه می دهد كه بدون توجه به نوع آنها و بدون نیاز به نصب سیستم عاملی دیگر به سیستم متصل شوند.
[c]: یك معماری فنی كه در هر سطح مقیاس بندی مشابه بهم هستند.
[d]: یك معماری مركزی وب، كه به انواع جدید برنامه های كاربردی، بدون محدودیت یك زبان برنامهنویسی اجازه می دهد تا ساخته شوند.
تكنولوژی گوگل از یك پیشرفت پیوسته و یا آنچه كه مدیران مشاور فنی ژاپنی به آن Kaizan می گویند بوجود آمده است. هر تغییر تكنیكی گوگل ممكن است برای كاربران متوسط آن بی اهمیت باشد اما زمانیكه بصورت كامل آن را تفسیر می كنند مزایای فن شناسانة گوگل از ابداعات افزایشی و تصاعدی آن، سازگاری هوشمندانه و ماهرانة برداشت های پژوهشی – تحقیقی و تنظیم عالی بیزانس برای لینو كس حاصل میشود. زمانی، یك تاریخ نویس تكنولوژی ، از بین صدها پیشرفتی كه گوگل در این نُه سال اخیر آنها را رهبری كرده، قادر به تشخیص یك یا دو اختراع مهم كه برمبنایpageRank است خواهد بود. منتقدین گوگل در آینده خواهند دید كه گوگل هستة پردازش تكنولوژی خود را با منابع مختلف پیوند زده است. جهت توضیح ، ساختار مراكز دادة گوگل و ارسال پیام به این مراكز و از این مراكز به جاهای دیگر راههای زیادی وجود دارد كه از طریق محاسبات شبكه ای صورت می گیرد.[3] توانایی گوگل در خواندن داده بصورت همزمان از كامپیوتر های مختلف ، یادآور تكنولوژی BiTorrent است.[4] گوگل از سخت افزار مناسب یا “White box" در مراكز داده اش استفاده می كند كه نشان دهندة خصلت كامپیوتر دوست بودن گوگل است. استفاده از حافظه و دیسك ها برای ذخیرة چنیدن كپی از داده ها ناشی از محدودیت های محاسباتی است