亚洲杯中国出线/足彩分析/勇士凯尔特人库里49分回放/中国足彩310

您的位置:首 頁 > 新聞中心 > 公司網(wǎng)站制作 > 公司網(wǎng)站制作基于網(wǎng)頁鏈接的通用識別方式

公司網(wǎng)站制作

公司網(wǎng)站制作基于網(wǎng)頁鏈接的通用識別方式

發(fā)布:2020-12-22 12:03:59 瀏覽:2323

        基于網(wǎng)頁鏈接的通用識別方式。前面介紹的垃圾網(wǎng)頁識別技術并不具有通用性,而且非常被動,總是等到出現(xiàn)一種作弊方式后才針對性的采用一種相應的補救措施,有些事后諸葛亮的做法。而下面要介紹的基于鏈接結構以及稍后介紹的機器學習分類法與作弊方式均無關,具有很強的通用性。

        Trust Rank算法是一種基于鏈接結構的用來識別垃圾網(wǎng)頁的經(jīng)典算法。這個算法的假設條件是頁面A鏈接到頁面B則意味著頁面A推薦頁面B的內容,因此頁面A的Trust Rank值可以傳遞分配一部分給頁面B。也就是說質量高的網(wǎng)頁通常只會被質量更高的網(wǎng)頁鏈接指向。

        于是可以先構建一定數(shù)量的具備較高權威內容或者較多出鏈接的知名網(wǎng)頁作為起點種子網(wǎng)頁,然后將它們的Trust Rank值按照出鏈接數(shù)量比例傳遞分配到第二層頁面,按照同樣的方法將Trust Rank值傳遞分配到第三、四層,以此類推。這樣,通常越遠離第一層種子網(wǎng)頁的Trust Rank值越小,越有可能是垃圾網(wǎng)頁。于是可以設定一個閾值,當?shù)陀谶@個值時將其判斷為垃圾頁面。

>>> 查看《公司網(wǎng)站制作基于網(wǎng)頁鏈接的通用識別方式》更多相關資訊 <<<

本文地址:http://www.ms699.com/news/html/22559.html

趕快點擊我,讓我來幫您!