SEO算法問題,如何借助分詞符號過濾重復內(nèi)容機制

閱讀 ?·? 發(fā)布日期 2020-04-13 10:23 ?·? admin
  這個知識點我SEO優(yōu)化課程里面講過分詞,但是沒有深度講,因為講了大多數(shù)人也聽不懂,畢竟實用性沒有做網(wǎng)站布局那么實在。分詞技術(shù)我們都知道是搜索引擎里面特有的一個算法歸類,但是對于百度這種搜索引擎來說,中文分詞占據(jù)了主要地位。我們繼續(xù)思維一個SEO邏輯,分詞符號在SEO優(yōu)化當中能夠起到什么樣的作用,尤其是對于SEO從業(yè)人員來說,如果這個問題解決的好,相當于可以直接解決一個知識點就是處理內(nèi)容重復。我們都知道百度在計算一個網(wǎng)頁內(nèi)容重復度的時候大多數(shù)是基于詞與詞之間的一種關(guān)系來進行內(nèi)容結(jié)果排名,但是真正能夠滿足一個點的不僅僅是詞,而是詞之間構(gòu)建的符號。
分詞技巧
    一個網(wǎng)頁可以分成以上的一個結(jié)構(gòu)板塊,從最開始的文章篇到分割,分割的話除了共同部分區(qū)域,其他都是正文的一種表現(xiàn)形式出來。那么這里就有一個知識點了,分詞符號出現(xiàn)在不同的位置,實際上可以過濾的點就不一樣,什么意思的呢,我們?nèi)缦聢D所示:
中文分詞
    這是騰訊的中文分詞工具,大家需要使用的可以去直接了解使用下。從上面這張圖可以發(fā)現(xiàn),快排科技(vx:seokuaipai)網(wǎng)站的標題分詞以后得到了這樣的一種詞庫組合,但是實際上我目前就用了一個橫線。我們在多加幾個分詞符號,就可以出現(xiàn)完全不一樣的效果,如下圖所示:
算法匯總
    在來看這個搜索結(jié)果,是不是很奇妙,技術(shù)培訓本身是一個詞,現(xiàn)在加了一個分詞符號,是不是做到了分詞的結(jié)果。這里就有人肯定會問了,這個作用是什么,回到我本文標題寫的東西,是處理內(nèi)容重復問題。實際上百度判斷一個網(wǎng)頁是否原創(chuàng),就在于內(nèi)容分詞后再次計算重復度,而分詞符號可以很好的借助這個特征點來處理一個內(nèi)容過濾采集問題,重點就是看大伙會不會深度研究和挖掘了。
    提示一個點,上面兩個網(wǎng)頁截圖,加了分詞符號和不加分詞符號得到的一個詞數(shù)量和詞的內(nèi)容是完全不一樣的,這也是為什么目前一些市面上搞黑帽SEO作弊的人可以把百度玩的團團轉(zhuǎn)的根本原因。