2011-01-20 75 views
1

我會告訴你2種情況(注:d =阻尼因數= 0.5)的PageRank - 故障

第一種情形:假設有4個節點A, B, C, D:上A

  • B, C, D鏈接。

PageRank是: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

我可以把0.25PR(B)=PR(C)=PR(D)解決這個方程式,我會得到0.875as值。我不需要解決任何系統

第二種情況:假設有4個節點A, B, C, D

  • A鏈接BC
  • B鏈接C
  • C鏈接上A

這樣的PageRank將是:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

我必須解決這個系統得到的結果。我不把1/NPR(A), PR(B), PR(C) and PR(D)

事實上,我互聯網上搜索解決方案和值:

$ PR(A)= 14/13 = 1.07692308 $

$ PR( B)= 10/13 = 0.76923077 $

$ PR(C)= 15/13 = 1.15384615 $

因此,與兩個相似的場景,爲什麼我用2個不同的行爲呢?

希望有人能幫助我:)乾杯

+1

不錯的問題。但是,這與數學有關。 – shamittomar 2011-01-20 10:35:21

回答

1

的兩種情況,因爲在第一個問題的對稱性是不同的:B,C和d鏈接,並從同一頁面鏈接(即它們都指向A和沒有指向他們)。因此,他們的頁面排名將是相同的,這會給您額外的限制PR(B)= PR(C)= PR(D),使您能夠輕鬆解決問題。

第二個問題沒有對稱性,需要長時間解決。

1

假設包含四個網頁的小範圍:A,B,C和D.從頁面到其自身的鏈接或從單個頁面到另一個單獨頁面的多個出站鏈接將被忽略。 PageRank初始化爲所有頁面的相同值。在PageRank的原始形式中,所有頁面的PageRank總和是當時網頁的總頁數,因此本示例中的每個頁面的初始PageRank都是1.但PageRank的較新版本和本節的其餘部分假設0到 之間的概率分佈1.因此,每個頁面的初始值爲0.25。

在下一次迭代時,PageRank從給定頁面轉到其出站鏈接的目標,並在所有出站鏈接之間平均分配。

如果系統中唯一的鏈接是從頁面B,C和D到A,那麼每個鏈接將在下一次迭代時將PageRank傳遞給A,總計爲0.75。

PR(A)= PR(B)+ PR(C)+ PR(d)

假設代替該網頁B具有一個鏈接到網頁C和A,頁C具有一個鏈接到頁A,和頁面D有鏈接到所有三個頁面。因此,在下一次迭代時,頁面B將其現有值的一半(或0.125)轉移到頁面A,將另一半(或0.125)轉移到頁面C.頁面C將將其全部現有值0.25轉移到唯一它連接到的頁面A.由於D有三個出站鏈接,它會將其現有值的三分之一(約0.083)轉移到A.在此迭代完成後,頁面A的PageRank將爲0.458。

PR(A)= \壓裂{PR(B)} {2} + \壓裂{PR(C)} {1} + \壓裂{PR(d)} {3}。\,

換句話說,出站鏈接賦予的PageRank等於文檔自己的PageRank分數除以出站鏈接數L()。 PR(A)= \ frac {PR(B)} {L(B)} + \ frac {PR(C)} {L(C)} + \ frac {PR(D)} {L d)}。

在一般情況下,對於任何網頁的PageRank值u可以表示爲:

PR(U)= \ sum_ {在B_u v \} \壓裂{PR(V)} {L(V )},

即頁面u的PageRank值取決於包含在集合Bu(包含所有頁面鏈接到頁面u的集合)中的每個頁面v的PageRank值除以數量L(v)來自第v頁的鏈接

For further queries visit here