maryam mojaverrezaei

29
Link Analysis د ون ی پ ل ی ل ح ت ی ئ ا اوررض ح م م ی ر م1391

Upload: mmaryamm-62

Post on 20-Jun-2015

350 views

Category:

Education


2 download

DESCRIPTION

GRAPH AND LINK ANALYSIS

TRANSCRIPT

Page 1: Maryam mojaverrezaei

Link Analysisپیوند تحلیل

مجاوررضائی مریم

1391

Page 2: Maryam mojaverrezaei

هوایی خطوط نقشهالمللی بین

Page 3: Maryam mojaverrezaei

است؟ متصل وبسایت کدام به سایت وب کدام

برای را داروهایی چه پزشکی چهکند؟ می تجویز بیمارانی چه

کسی چه به کسی چهزند؟ می تلفن

به که است کاوی داده تکنیک یک پیوند تحلیلو مهم های پیوند و اتصاالت ، روابط دانستن

پردازد می .حیاتی

Page 4: Maryam mojaverrezaei

نام به ریاضیات از ای شاخه پایه بر پیوند گراف تحلیل است نظریه شده بنا .

گراف ای پایه نظریه

روابط دادن نشان برای خاص بطور که هستند ای شده خالصه نمودار ها گرافروند می کار .به

باشند می ها یال و راس یا گره شامل .گرافدهند می تشکیل متصلند، بهم رابطه یک بوسیله که راس جفت دو را .یالها

Page 5: Maryam mojaverrezaei

شوند می خریداری ها مشتری توسط که هستند محصوالتی بیانگر ها .راسشامل که بازار سبد از درصدی و محصول دو وابستگی میزان بیانگر یالها روی وزن

باشد می است محصول دو .هر

Page 6: Maryam mojaverrezaei

گره :مشکل یا راس دو بین مسیر کوتاهترین .یافتن

به مربوط مسیر کوتاهترین آیا پرواز به مربوط گراف در مثالیا پرواز؟ بخشهای تعداد کمترین یا است؟ فاصله کوتاهترین

قیمت؟ ترین کم یا پرواز؟ زمان کوتاهترین

. شود می داده پاسخ گراف از استفاده با سواالت این همه به

Page 7: Maryam mojaverrezaei

کوئینسبرگ پل هفت مساله

قرن .18در شد مطرح اویلر لئونارد سوئیسی ریاضیدان توسط ،

یکدیگر به که داشت جزیره دو پریگل رودخانه در کوئینسبرگ شهر . هر در بودند متصل پل هفت مجموعا طریق از شهر ساحل به و

ها پل از یک هر به دسترسی امکان ها جزیره یا رودخانه طرف. داشت وجود

Page 8: Maryam mojaverrezaei

بار یک فقط برای ها پل همه روی از و کرد شروع شهر از جائی از است ممکن آیا؟ کنیم استفاده قایق از یا خیسشویم اینکه بدون کرد، عبور

Page 9: Maryam mojaverrezaei

گراف گذاری نماد ابداع

Page 10: Maryam mojaverrezaei

اویلری مسیر

درجه گره

از عبور برای راهی هیچ این بنابرروی

ندارد وجود بار یک از بیش پل یکچرا

. دارند فرد درجه گره چهار هر که

اویلری مسیر وجود امکان

Page 11: Maryam mojaverrezaei

باشد؟ زوج ها گره درجه باید چرا

ABCBD

. یک های گره تمام که وقتی است درست نیز قضیه این عکس. دارد وجود اویلری مسیر یک آنگاه باشند داشته زوج درجه گراف

Page 12: Maryam mojaverrezaei

: گرد دوره فروشنده مساله

Page 13: Maryam mojaverrezaei

است؟ کدام کند عبور یکبار دقیقا ها گره همه از که مسیری کوتاهترین

Page 14: Maryam mojaverrezaei

گراف این از 24در که دارد وجود مختلف مسیر. گذرد می بار یک فقط گره هر

Page 15: Maryam mojaverrezaei

هامیلتونی مسیر

Page 16: Maryam mojaverrezaei

گرد دوره فروشنده مشکل

Page 17: Maryam mojaverrezaei

:GREEDYالگوریتم

abcde=24 (greedy) cdbea=32

Page 18: Maryam mojaverrezaei

: جهتدار گراف

. هستند طرفه یک هایی راه مانند یالها جهتدار گراف در

از که از Bبه Aیالی که یالی با .Aبه Bمیرود است متفاوت میرود

کاربرکه √د: پرواز از هایی بخش

بهم را ازشهرها ای مجموعه. کنند می متصل √. وب صفحات بین های لینک

√ . تلفنی های تماس الگوهای

Page 19: Maryam mojaverrezaei

. است عظیم جهتدار گراف یک وب جهانی شبکه. آنها بین های لینک یالها و هستند وب صفحات همان ها گره

Page 20: Maryam mojaverrezaei

a :صفحه (: authorityیک به) دیگری زیاد صفحات که است ای صفحه دار صالحیت. اند کرده اشاره آن

b :صفحه .hubیک :) کند) می اشاره دیگری زیاد صفحات به که است ای صفحه قطب

c : . قبلی مدل دو از ترکیبی

ای -1 گره تک :مدل

: گراف بر مبتنی مدلهای

Page 21: Maryam mojaverrezaei

ای -2 گره چند :مدلهای

a : مستقیم: به ارجاع راجع صفحه دو که است این نشاندهنده که دیگر صفحه به صفحه یک اشارههستند موضوع یک

B : متقابل: .ارجاع هستند صفحه دو بین قوی ارتباطی نشاندهنده

C : مستقیم: غیر سوم ارجاع صفحه و اول صفحه میان

D: co-citation : هستند یکدیگر مشابه صفحه دو این احتماال و دیگر صفحه دو به صفحه یک اشاره

E: co-reference : یکدیگر با صفحه دو این گرفت نتیجه میتوان و کرده اشاره صفحه یک به صفحه دو. ارتباطند در

Page 22: Maryam mojaverrezaei

: یکسایت صالحیت

: کلینبرگ الگوریتم

Page 23: Maryam mojaverrezaei

. است قطب یک شود، می لینک دیگر دار صالحیت صفحه چند به که ای صفحه. است دار صالحیت صفحه یک اند، شده لینک آن به قطب چند که ای صفحه

Page 24: Maryam mojaverrezaei

پیوند اساستحلیل بر جو و جست

معمولی- متنی جوی و جست

فرآیند - آغاز برای صفحات از ای مجموعه آوری گرد

کلینبرگ : الگوریتم ویژگی

اولیه متنی جوی و جست صفحات از استفاده بااشاره اولیه مجموعه به که تر بزرگ مجموعه یک ایجاد

. گیرد می قرار اشاره مورد اولیه مجموعه توسط با کند، می

Page 25: Maryam mojaverrezaei

دار صالحیت منابع کلینبرگ) (:مشخصکردن الگوریتم در

مبنا- 1 مجموعه ایجاد

کاندیداها- 2 مشخصکردن

دار- 3 صالحیت منابع و ها قطب کردن مرتب و بندی درجه

Page 26: Maryam mojaverrezaei

مبنا -1 مجموعه :ایجاد

محتوایی جوی و جست یک از استفاده با مطالب مبنای مجموعه ایجاد

( اصلی- عبارت از ربط کلمات ...(a,an,theحذف

) محتوایی- ) جوی و جست استراتژی به بسته کلمات یابی ریشه

ها- وب فهرست در جو و جست

Page 27: Maryam mojaverrezaei

2: کاندیداها- مشخصکردن

کاندیداها از ای مجموعه ایجاد برای مبنا مجموعه توسعه

به دارد لینک آنها با مبنا مجموعه در صفحه هر که است صفحاتی تمام حاوی کاندیداها مجموعه. باشد می لینک دارای مبنا مجموعه صفحات از یکی به که صفحاتی از زیرمجموعه یک همراه

؟ چرا

زیادی تعداد که مبنا مجموعه در عمومی سایت گسترشیک امکان مقابل در حفاظت. کند می وارد نیستند مدیریت قایل که را صفحات از

Page 28: Maryam mojaverrezaei

3: دار- صالحیت منابع و ها قطب بندی درجه

آنها کردن مرتب و دار صالحیت منابع و ها قطب به کاندیدا صفحات تقسیم

Page 29: Maryam mojaverrezaei

1صفحه ( H,A)

: A دار صالحیت سایت عنوان به صفحه قدرت

H :قطب یک عنوان به صفحه قدرت

A(1)=1H(1)=1 A(1)= H( صفحه به که دارند 1صفحاتی لینک )

H(1)= A( صفحه که دارد 1صفحاتی لینک آنها به )

بین تعادل زمان تا H وAتکرار

مقدار بیشترین با قطب Hصفحات قویترین ،مقدار بیشترین با دار Aصفحات صالحیت سایت قویترین ،