渭南藕胰电子商务有限公司

當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

搜索引擎反作弊的三個(gè)模型

 2015-06-08 16:43  來(lái)源: A5專(zhuān)欄   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

諸如鏈接農(nóng)場(chǎng)、內(nèi)容農(nóng)場(chǎng)、關(guān)鍵詞堆砌等都是十分常見(jiàn)的作弊方式,為了維持良好的搜索展現(xiàn)結(jié)果,搜索引擎自然就會(huì)有反作弊進(jìn)行應(yīng)對(duì)。

那么,搜索引擎會(huì)通過(guò)怎樣的方式進(jìn)行反作弊處理呢?

總的來(lái)說(shuō),會(huì)有以下三種思路:

1、信任傳播模型

前段時(shí)間同事A跟我說(shuō)了一件事兒,他的姐姐B在國(guó)外留學(xué),然后一天B在qq上跟A說(shuō)洗衣服把手機(jī),銀行卡什么的全部洗了,讓A給B的老媽打電話寄點(diǎn)錢(qián)來(lái),A立刻執(zhí)行,B的老媽也深信不疑,在即將打出的那一刻,B的一個(gè)電話,挽救了即將發(fā)生的損失。

細(xì)思恐極。

其實(shí),這也是一個(gè)信任傳播模型,直接在QQ上跟B的媽媽說(shuō),B的媽媽必然不會(huì)完全相信,但是經(jīng)由A的口一傳,就立刻不一般。因?yàn)椋珹在B的媽媽的信任名單中。

OK,由此而來(lái),就是一種反作弊的思路。

在海量的網(wǎng)頁(yè)數(shù)據(jù)中,通過(guò)技術(shù)或人工的手段,獲取值得完全值得信任的網(wǎng)頁(yè)設(shè)置為白名單。白名單中網(wǎng)頁(yè)的信任值由鏈接順著向外擴(kuò)散而遞減或者衰減。然后,設(shè)定一個(gè)值,高于此值,是OK的網(wǎng)頁(yè),低于此值,不好意思,你作弊了。

2、不信任傳播模型

這個(gè),其實(shí)跟第一種思路是及其類(lèi)似的,找到一群作弊的網(wǎng)頁(yè),然后通過(guò)鏈接關(guān)系分析不信任分值。

唯一一點(diǎn)需要注意的是,信任分值,是通過(guò)鏈接正向傳遞的,不信任分值是通過(guò)鏈接反向傳遞的。舉個(gè)例子:

A為垃圾頁(yè)面,則指向A的鏈接B是垃圾頁(yè)面的概率比A指向的鏈接C的概率要大的多。

3、異常發(fā)現(xiàn)模型

所謂異常,可以是作弊頁(yè)面的特征,也可以是正常頁(yè)面的特征。

集合了這些特征,再由此來(lái)判定一個(gè)頁(yè)面是否作弊或者是否正常,也是蠻OK的一件事情。

來(lái)個(gè)簡(jiǎn)單的識(shí)別鏈接農(nóng)場(chǎng)的小例子:

鏈接農(nóng)場(chǎng)中的鏈接關(guān)系,是由設(shè)計(jì)者精心布置的,由此一來(lái),必然會(huì)有些違背自然的特征,諸如:

1)、出鏈與入鏈的統(tǒng)計(jì)分布規(guī)律:正常的頁(yè)面出鏈與入鏈滿足Power-law分布,作弊的鏈接違反該分布;

2)、作弊的鏈接的Url網(wǎng)址往往過(guò)長(zhǎng),包含較多的點(diǎn)畫(huà)線及數(shù)字等;

3)、諸如入鏈及出鏈的增長(zhǎng)率等,正常網(wǎng)頁(yè)和作弊網(wǎng)頁(yè)在這些變化模式上是不同的。

轉(zhuǎn)載請(qǐng)注明鏈接地址 。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門(mén)排行

信息推薦