نابترین فایلها

فایلهای کمک آموزشی

نابترین فایلها

فایلهای کمک آموزشی

دانلود بررسی تکنولوژی و چهارچوب گوگل

بررسی تکنولوژی و چهارچوب گوگل

پژوهش بررسی تکنولوژی و چهارچوب گوگل در 54 صفحه ورد قابل ویرایش

دانلود بررسی تکنولوژی و چهارچوب گوگل

پژوهش بررسی تکنولوژی و چهارچوب گوگل
مقاله بررسی تکنولوژی و چهارچوب گوگل
پروژه بررسی تکنولوژی و چهارچوب گوگل
تحقیق بررسی تکنولوژی و چهارچوب گوگل
دانلود پایان نامه بررسی تکنولوژی و چهارچوب گوگل
پروژه
پژهش
مقاله 
جزوه
تحقیق
دانلود پروژه
دانلود پژهش
دانلود مقاله 
دانلود جزوه
دانلود تحقیق
دسته بندی علوم انسانی
فرمت فایل doc
حجم فایل 740 کیلو بایت
تعداد صفحات فایل 54

بررسی تکنولوژی و چهارچوب گوگل

تکنولوژی گوگل

«جدا از مشکلات مقیاس گذاری تکنیک های جستجوی قدیمی، برای داده های به این اندازه، تکنیک های جدید رقابتی که استفاده از نمایش اطلاعات اضافی در فرا متن ها را برای نتیجة‌ جستجوی بهتر شامل می‌شود وجود دارد… خیزش سریع تکنولوژی برای جمع آوری مستندات وب و نگهداری آن ها بصورت بروز لازم و ضروری است. فضای ذخیره سازی باید به نحو موثری جهت ذخیرة ایندکس ها و مستندا تشان استفاده شود. سیستم indexing باید صدها گیگابایت از داده ها را به شکل موثری پردازش کند. پرس وجوها باید با سرعت صدتا هزار بار در هر ثانیه انجام شوند» سرجی برین ولاورنس پیج، 1997 [1]

در ابتدا BackRub وجود داشت، سرویسی که به گوگل تبدیل شد. امروزه گوگل با دقت بیشتری به الگوریتم pageRank خود وابسته است. PageRank الگوریتمی انتخابی است که ارزش را به چیز مهمتر می دهد. نشانگر اهمیت یک صفحة وب تعداد صفحاتی است که به آن صفحة خاص لینک می شوند.

آقایان بِریِن و پِیچ خیلی زود فاکتور جدیدی را به این الگوریتم اضافه کردند که رأی را به صفحة مهمتر می داد. ایدة آنها این بود که صفحه ای مهمتر است که تعداد افراد بیشتری بر روی آن کلیک می کنند.کلیک های بیشتر روی یک صفحة وب باعث می شد که آن صفحه وب دارای ارزش و اهمیت بیشتری شود. در انتها، آرام آرام فاکتورهای دیگری نیز به این الگوریتم اضافه شد. برای مثال ، تعداد دفعاتی که محتوای یک صفحه تغییر

می کند نیز یکی از فاکتور های مهم شد.

تکنولوژی pogeRank گوگل دقیقاً به جستجوی اینترنتی وابسته شده است. برای نمونه، الگوریتم رأی گیری(Voting Algorithm) کارایی کمتری در عمل جستجو دارد. توجهی که گوگل نسبت به تکنولوژی جستجویش کرد، باعث تحت الشعاع قرار گرفتن افکار عمومی راجع به این شرکت شد. جستجوی گوگل همانند یک ستارة نوظهوراست‌که‌درخشندگی‌اش‌  باعث شده تا ناظران نتوانند جهات دیگر این پدیده را به وضوح و دقیق مشاهده کنند.

صرف نظر از این ، گوگل یک شرکت تکنولوژی است[2]بعضی از این تکنولوژی ها هنگامی که دریک مقاله توضیح داده می شوند مانند مقالة “The Anatomy of a Large –Scale Hypertextual”  که در همان اوایل مطرح شد، خواستار پیدا می کنند. مقاله های اخیر مانند

“MapReduce: Simplified Data search Engine" می توانند به آرامی خوانده شوند[3] با توجه به اینکه گوگل یک تکنولوژی است، توضیح دادن اینکه گوگل چکار می کند، درجملات ساده وقابل هضم قدری مشکل است. شکل زیر یک دید کلی از چهار چوب گوگل را ارائه می کند.




 

 

شکل 3-1: نمایی کلی از چهار چوب گوگل

مهمترین قسمت های تکنولوژی گوگل که پایه و اساس دیاگرام Googleplex است شامل موارد زیر می‌شوند:

[a]: اصلاح لینوکس به منظور اجازه دادن به فایل های بزرگ و دیگر توابع درجهت دادن شتاب بیشتر به همة سیستم

[b]: یک معماری توزیع شده که به برنامه های کار بردی و مقیاس بندی ها اجازه  می دهد که بدون توجه به نوع آنها و بدون نیاز به نصب سیستم عاملی دیگر به سیستم متصل شوند.

[c]: یک معماری فنی که در هر سطح مقیاس بندی مشابه بهم هستند.

[d]: یک معماری مرکزی وب، که به انواع جدید برنامه های کاربردی، بدون محدودیت یک زبان برنامه‌نویسی اجازه می دهد تا ساخته شوند.

تکنولوژی گوگل از یک پیشرفت پیوسته و یا آنچه که مدیران مشاور فنی ژاپنی به آن Kaizan می گویند بوجود آمده است. هر تغییر تکنیکی گوگل ممکن است برای کاربران متوسط آن  بی اهمیت باشد اما زمانیکه بصورت کامل آن را تفسیر می کنند مزایای فن شناسانة گوگل از ابداعات افزایشی و تصاعدی آن، سازگاری هوشمندانه و ماهرانة برداشت های پژوهشی – تحقیقی و تنظیم عالی بیزانس برای لینو کس حاصل می‌شود. زمانی، یک تاریخ نویس تکنولوژی ، از بین صدها پیشرفتی که گوگل در این نُه سال اخیر آنها را رهبری کرده، قادر به تشخیص یک یا دو اختراع مهم که برمبنای pageRank است خواهد بود. منتقدین گوگل در آینده خواهند دید که گوگل هستة پردازش تکنولوژی خود را با منابع مختلف پیوند زده است. جهت توضیح ، ساختار مراکز دادة گوگل و ارسال پیام به این مراکز و از این مراکز به جاهای دیگر راههای زیادی وجود دارد که از طریق محاسبات شبکه ای صورت می گیرد.[4] توانایی گوگل در خواندن داده بصورت همزمان از کامپیوتر های مختلف ، یادآور تکنولوژی BiTorrent است.[5] گوگل از سخت افزار مناسب یا “White box" در مراکز داده اش استفاده می کند که نشان دهندة خصلت کامپیوتر دوست بودن گوگل است. استفاده از حافظه و دیسک ها برای ذخیرة چنیدن کپی از داده ها ناشی از محدودیت های محاسباتی است.

-7 :سرعت و سپس سرعت بیشتر

جستجوی گوگل بطور سریع و با بیشترین نتایج بر گشتی به کاربر، در کمتر از یک ثانیه انجام می‌شود. در مراکز دادة تجاری ، سرعت با خرید گرانترین سخت افزار همراه با بالاترین عملکرد بدست می آمد ، از این قبیل محصولات را می توان سان میکروسیستم نام برد که در آن از وسایل ذخیره سازی پیشرفته ای که به سرورهایی با فیبرهای نوری عجیب و غریب متصل شده اند استفاده می‌شود.

گوگل از سرورهای pizza box مناسبی که درون یک کلاستر سازمان یافته اند استفاده می کند. یک کلاستر گروهی از کامپیوتر هایی است که بهم پیوسته اند تا سیستمی قوی هیکل را ایجاد کنند. بجای استفاده از سرورهای عجیب و غریب همراه با هشت پردازنده یا بیشتر، گوگل عموماً از سرورهایی استفاده می کند که دارای دو پردازنده اند، که نمونة آن ها را می توانید درکامپیوتر های خانگی پیدا کنید.

بواسطة تغییرات اختصاصی به لینوکس ودیگر ابداعات مهندسین، گوگل توانسته است از کامپوننت های ارزان که فراوان اند عملکرد یک سوپر کامپیوتر را بدست آورد. جدول زیر داده هایی را از سال 2002 در مورد سرعت گوگل در خواندن داده، از هارد درایوها تهیه کرده است.[6]

جدول 3-2: اطلاعاتی درمورد خواندن داده ها از هارد درایوها در گوگل

کلاستر

A

B

نرخ خواندن (آخرین دقیقه)

583   MB/S

380   MB/S

نرخ خواندن (آخرین ساعت)

562   MB/S

384   MB/S

نرخ خواندن (از زمان شروع بکار مجدد)

589  MB/S

49   MB/S

نرخ نوشتن (آخرین دقیقه)

1   MB/S

101   MB/S

نرخ نوشتن (آخرین ساعت)

2   MB/S

117   MB/S

نرخ نوشتن (از زمان شروع بکار مجدد)

25   MB/S

13   MB/S

این داده ها نتایج عملکرد و کلاستررا نشان می دهند. توان عملیاتی خواندن گوگل از سال 2002 آورده شده است. بر اساس افزایش توان عملیاتی درایو مناسب، ممکن است نرخ خواندن گوگل به 2000 مگابایت درثانیه نزدیک باشد.

برای قرار دادن این داده ها درمفاد تکنولوژی سال 2002 ، بایدوسیلة ذخیره سازی EXP3 شرکت IBM که درسال2002 موجود بوده ومی توانسته داده ها را در حالت انفجار و در نرخ حدود 58 مگابایت در ثانیه بخواند را نیز در نظر گرفت. نرخ خواندن گوگل درسال 2002،بطور میانگین ده برابر نرخ خواندن IBM EXP بوده است، اما نرخ نوشتن آن قابل مقایسه با IBM EXP می باشد. قیمت یک IBM EXP تکی در سال 2002، برای360 گیگابایت فضای ذخیره سازی بدون کنترلها و کابلها در حدود 18000 دلار بوده است. اما قیمت گوگل برای مقایسة فضای ذخیره سازی و عملکرد بالا، در حدود 1000 دلار است. برای سرعت بیشتر ، گوگل کمی بیشتر هزینه می کرد.

دردنیایی که همواره خواستار افزایش سرعت وافزایش فضای ذخیره سازی هستیم، دراین باره گوگل یکی از موارد موثر و قوی را داراست.[7] پیشرفت در وسایل ذخیره سازی مناسب برای عملکرد بالاتر ، برای گوگل است. گوگل نرخ خواندن داده اش رابروز آوری نکرده، اما مهندسینی که با گوگل آشنا هستند اعتقاد دارند که نرخ خواندن داده دربعضی کلاسترها به 2000 مگابایت در ثانیه می رسد. هنگامیکه سخت افزارها بهتر عمل کنند، گوگل بدون پرداخت هزینه ای می تواند سریع تر عمل کند. روش گوگل تمرکز روی ساختن نرم افزارهای مهندسی شده که عملکرد افزون تری  حاصل می شوند بوده است. سرعت برای pageRank و دیگر پردازش های تحلیلی گوگل بصورتی قاطع بوده است- اگر توان محاسباتی گوگل کند بود، نمی توانست کارهایی را که برای شناخت پرس و جوهای مخصوص و مجموعه های مخصوص لازم است را انجام دهد.

گوگل در مورد یکسان بودن وجور بودن کلمات کلیدی که کاربران در کادر پرس و جو وارد می کردند با اصطلاحات و کلماتی که در ایندکس گوگل قرار داشت بیفکرانه عمل نکرد.

دانلود بررسی تکنولوژی و چهارچوب گوگل

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.