CASES 案例
我們的作品,他們的故事
Our work, their stories
Our work, their stories
百度重點(diǎn)頁(yè)面判斷
網(wǎng)頁(yè)權(quán)威性是搜索引擎對(duì)結(jié)果進(jìn)行排序的一個(gè)重要參考因素。
計(jì)算網(wǎng)頁(yè)權(quán)威性時(shí),將參與計(jì)算的所有網(wǎng)頁(yè)作為一個(gè)集合,并通過集合內(nèi)網(wǎng)頁(yè)之間的鏈接關(guān)系迭代計(jì)算網(wǎng)頁(yè)的權(quán)威性。
但是隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)上的網(wǎng)頁(yè)越來越多,如果將互聯(lián)網(wǎng)上所有網(wǎng)頁(yè)都作為參與權(quán)威性計(jì)算的網(wǎng)頁(yè),則對(duì)計(jì)算系統(tǒng)的架構(gòu)要求非常高,因此通常僅挑選各網(wǎng)站與外部網(wǎng)站存在鏈接關(guān)系的網(wǎng)頁(yè)作為參與權(quán)威性計(jì)算的網(wǎng)頁(yè),但是現(xiàn)有技術(shù)的這種方式,會(huì)導(dǎo)致各網(wǎng)站內(nèi)部的一些優(yōu)秀網(wǎng)頁(yè)無法得到權(quán)威性值,此外,也會(huì)影響參與計(jì)算的網(wǎng)頁(yè)得到的權(quán)威性值的準(zhǔn)確性。
為了改善上述問題,現(xiàn)有技術(shù)有一種做法,是將網(wǎng)站內(nèi)與外部網(wǎng)站存在鏈接關(guān)系的網(wǎng)頁(yè),以及網(wǎng)站內(nèi)的一些重要網(wǎng)頁(yè)一起提取出來,作為參與網(wǎng)頁(yè)權(quán)威性計(jì)算的網(wǎng)頁(yè)。
在現(xiàn)有技術(shù)中,是通過網(wǎng)站中網(wǎng)頁(yè)的站內(nèi)反鏈數(shù)量來確定網(wǎng)頁(yè)的重要性的,例如將網(wǎng)站中站內(nèi)反鏈數(shù)量大于設(shè)定閾值的網(wǎng)頁(yè)提取出來,如果這些網(wǎng)頁(yè)所指向網(wǎng)頁(yè)的站內(nèi)反鏈數(shù)量也大于設(shè)定閾值,則將這些網(wǎng)頁(yè)及所指網(wǎng)頁(yè)作為重點(diǎn)網(wǎng)頁(yè)。但是這種現(xiàn)有技術(shù)的方法,召回率較低,準(zhǔn)確性也較差。
(來源于百度算法專利內(nèi)容)
新算法權(quán)威度調(diào)整
1.網(wǎng)頁(yè)中的所有鏈接提取出來
2.對(duì)網(wǎng)站所有鏈接進(jìn)行拆分重組排列(源代碼里最近的鏈接組成)3.從各個(gè)鏈接(內(nèi)鏈)中進(jìn)行匹配出現(xiàn)值最高的鏈接 例:多次A鏈接B,或不同ABC鏈接D4.有一個(gè)預(yù)定的閥值,如果不超過閥值那么將歸類于普通頁(yè)面,如沒有任何重點(diǎn)頁(yè)面(入口頁(yè))則僅留下首頁(yè)為重點(diǎn)頁(yè)面.
5.重點(diǎn)鏈接是有數(shù)量上限,取決于鏈接對(duì)最多的頁(yè)面權(quán)威性,頁(yè)面權(quán)威性越高,重點(diǎn)頁(yè)面的數(shù)量就越高,比例通常在10-30%浮動(dòng),也就是一萬個(gè)頁(yè)面,可以出現(xiàn)1000-3000的參與排名的頁(yè)面。
6.百度訓(xùn)練模型將對(duì)鏈接對(duì)進(jìn)行一次匹配分類,區(qū)分重要程度。
7.百度訓(xùn)練模型的對(duì)鏈接進(jìn)行重要鏈接比對(duì)和非重要鏈接比對(duì)8.對(duì)重要鏈接進(jìn)行分類特征對(duì)比,以確定重要鏈接的參數(shù)范圍和特征范圍。
9.百度會(huì)對(duì)鏈接先進(jìn)行參數(shù)范圍和特征范圍匹配,然后在進(jìn)行重要程序分級(jí)。
10.內(nèi)鏈和反鏈的出面度是根據(jù)數(shù)量來決定,如果一個(gè)頁(yè)面有3個(gè)內(nèi)鏈,那么他的出面度就是311.對(duì)重要頁(yè)面的深度進(jìn)行說明,從首頁(yè)跳轉(zhuǎn)到對(duì)應(yīng)頁(yè)面的最短次數(shù),這個(gè)次數(shù)被定義為深度,重要頁(yè)面的深度會(huì)一定程度的影響頁(yè)面屬性。
12.內(nèi)鏈指向重要頁(yè)面的錨文本總數(shù),是根據(jù)切詞組成,也就是例如抽動(dòng)癥治療頁(yè)面指向給了抽動(dòng)癥,那么抽動(dòng)癥這個(gè)頁(yè)面的錨文本總數(shù)就是3個(gè),抽動(dòng)癥治療,抽動(dòng)癥,治療。3個(gè)錨文本。
13.根據(jù)重點(diǎn)頁(yè)面相互連接生成網(wǎng)站骨架,以定義網(wǎng)站的類型總結(jié):頁(yè)面的權(quán)威度由頁(yè)面的深度,被指向內(nèi)鏈的深度對(duì)比,錨文本詞頻、頁(yè)面出度、兩個(gè)頁(yè)面深度之間的差值來綜合評(píng)比頁(yè)面權(quán)威度。
總結(jié):頁(yè)面的權(quán)威度由頁(yè)面的深度,被指向內(nèi)鏈的深度對(duì)比,錨文本詞頻、頁(yè)面出度、兩個(gè)頁(yè)面深度之間的差值來綜合評(píng)比頁(yè)面權(quán)威度。
上一篇:上一篇:成都seo越來越做原因
下一篇:下一篇:邏輯思維下的SEO優(yōu)化公式
最新資訊