摘要:由周四發(fā)布的“網(wǎng)絡垃圾”(Webspam)報告可知,谷歌搜索在 2021 年過濾的垃圾網(wǎng)站數(shù)量、竟是 2020 年的六倍。據(jù)悉,作為 Alphabet 旗下子公司,Google 有一套名為 SpamBrian 的人工智能垃圾過濾系統(tǒng),并且可...
由周四發(fā)布的“網(wǎng)絡垃圾”(Webspam)報告可知,谷歌搜索在 2021 年過濾的垃圾網(wǎng)站數(shù)量、竟是 2020 年的六倍。據(jù)悉,作為 Alphabet 旗下子公司,Google 有一套名為 SpamBrian 的人工智能垃圾過濾系統(tǒng),并且可在超過 99% 情況下實現(xiàn)“不受垃圾所困擾”(spam-free)的搜索體驗。
(來自:Google Search Central Blog)
此前,SpamBrain 已被這家搜索巨頭用于防止用戶點擊那些可能被注入了惡意軟件的有害網(wǎng)站、或旨在誘騙人們泄露個人信息 / 匯款的詐騙站點。
Google 表示,鑒于垃圾信息散播者在持續(xù)不斷地找到繞過過濾機制的方法,基于人工智能的篩查系統(tǒng)也是相當必要的。
需要指出的是,搜索是 Google 的重要收入來源之一。而高質(zhì)量和安全的網(wǎng)站搜索結果,也對該公司來說至關重要。
經(jīng)過多年摸索,垃圾網(wǎng)站制作方早已精通搜索引擎優(yōu)化(SEO)技術,來人為地提升其搜索排名。
作為應對,Google 也迫切需要排除掉那些利用欺詐算法的垃圾網(wǎng)站。
截至目前,Google 已借助 SpamBrain 將垃圾站點砍掉 70%,其中包括被黑客入侵并植入有害代碼的感染站點。若被其得逞,受害者將被竊取登錄憑據(jù)等機密信息。
其它類型的垃圾站點,還涉及將惡意軟件注入受害者的計算機、或誘導重定向至惡意站點。慶幸的是,Google 聲稱 SpamBrain 能夠將這類害群之馬排除在搜索結果之外。
Google 政策溝通經(jīng)理 Ned Adriance 在一封電子郵件中提到:
欺詐者經(jīng)常拙劣地模仿其它網(wǎng)站,常見套路是填充替換關鍵詞、假借品牌徽標、并附上想要引誘受害者撥打的電話號碼。
而 Google 的 SpamBrain 算法方案,能夠基本上確保此類欺詐型站點出現(xiàn)在相關搜索結果頁面中,且過濾了 75% 的亂碼垃圾站點。
這些垃圾站點往往在一堆無意義的文本中填充大量關鍵詞,以試圖提升其搜索排名。有時甚至會砸錢掛上垃圾鏈接,來誘騙搜索引擎的爬蟲和抬升 PageRank 品質(zhì)評分。
對于用戶來說,時間總是相當寶貴的。而 Google 的各種解決方案,就希望為用戶帶來更好的內(nèi)容檢索體驗。
【背景資料】
Google 于 2018 年推出的 SpamBrain 系統(tǒng),且與近 20 年前剛開始治理惡意網(wǎng)站時相比,去年搜索過濾的垃圾站點數(shù)量已暴增 200 倍。
即便如此,這場“道高一尺魔高一丈”的垃圾信息攻防戰(zhàn),顯然不會輕易完結。