پاورپوینت فصل دهم اصول و معماری موتورهای جستجوگر (pptx) 23 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 23 اسلاید
قسمتی از متن PowerPoint (.pptx) :
فصل دهم : اصول و معماری موتورهای جستجوگر
هدف های آموزشی
مفهوم موتورهای جستجو
انواع موتورهای جستجو
معماری کلی موتورهای جستجو
رتبه بندی موتورهای جستجوRANKING
الگوی رتبه بندی PAGE RANK در گوگل
مفهوم موتورهای جستجو
به برنامه ای گفته می شود که موضوعات مورد نظر کاربران را در قالب کلمات کلیدی، درون اسناد و اطلاعات موجود در اینترنت کاوش کرده و نتایج بدست آمده را در قالب آدرس محل ذخیره عرضه می نماید.
Search Engines
تقسیم بندی موتورهای جستجو بر اساس پشتیبانی مالی و نیروی انسانی
موتورهای جستجوی تجاری
موتورهای جستجوی آزمایشی
برنامه هایی که در قلب دانشگاه ها و موسسات برای ارزیابی و تحلیل عملکرد یک روش جدید بکار گرفته می شود.
در پهنه کل اینترنت به جستجو و راهنمایی کاربران می پردازند.
انواع موتورهای جستجو:
1-موتورهای جستجو مبتنی بر پیمایش وب و درون کاوی (crawler-based search engines)
2-موتورهای جستجوی مبتنی بر فهرست
(directory-Based Search Engines)
3-موتورهای جستجوی مختلط
(Hybrid Search Engines)
1-موتورهای جستجو مبتنی بر پیمایش وب و درون کاوی
بصورت خودکار و هوشمند کل پهنه وب را پیمایش می کنند و مجموعه اسناد و مدارک موجود را دریافت و رده بندی می کنند.فرآیند دریافت،ذخیره و رده بندی و شاخص دهی بر اساس الگوریتم های هوشمند و بصورت خودکار انجام می شود.
2-موتورهای جستجوی مبتنی بر فهرست
با دخالت مستقیم و نظارت صاحبین اسناد و مستندات وب ، ثبت ،سازماندهی و اداره می شود.(سطح بندی و ساختار درختی)
3-موتورهای جستجوی مختلط
تلفیقی از یک سیستم فهرست غنی و یک موتور جستجو هستند تا دقیق ترین و کامل ترین پاسخ را به جستجوگران بدهند.
client
Queries
Query Engine
Ranking
Results
www
Indexer Module
Collection
Analysis
Module
Utility
Index:
Text
Structure
Crawl Control
Usage feedback
Page Repository
Crawler(s)
معماری کلی موتورهای جستجو
اجزای اصلی این معماری
موتور پرس و جو(Query Engins)
ماجول شاخص دهی(indexer)
انباره صفحات(Page Repository)
کنترل درون کاو((Crawler Control
درون کاو(crawler،خزنده)
ماجول رتبه بندی(Ranking Module)
درون کاو(crawler،خزنده)
ماجول درون کاوی موظف است صفحات وب را برای تحلیل و ایجاد شاخص در یک روال منظم، سریع و جامع استخراج کرده و تحویل انباره صفحات بدهد.
پیچیدگی های فرآیند درون کاوی
انتخاب صفحات
محل قرار گرفتن صفحات
شهرت صفحات
گرایشات کاربران
الگوریتم های درون کاو
الگوی کاوش و توقف
Crawl&stop
الگوی کاوش و توقف مبتنی بر آستانه
با آدرس P0 شروع می شود و K صفحه را ملاقات می کندو K عدد ثابتی است.
با آدرس P0 شروع می شود و K صفحه را ملاقات می کند و فقط صفحاتی ذخیره می شود که از آستانه T اهمیت بیشتری داشته باشند.