琼海扯僖物流有限公司

【全國】 集團簡介 關注我們
幫學院 商標分類表-2024尼斯分類 知識產權交易

快幫集團

集群網站建設—搜索引擎如何區(qū)分原創(chuàng)內容?

2019-07-25
網站原創(chuàng)內容在搜索引擎排名中占有重要地位,但做原創(chuàng)內容不容易,偽原創(chuàng)又怕不被當成原創(chuàng),白做。很多站長都想利用原創(chuàng)內容來提高自己網站的收錄與排名,但是做原創(chuàng)內容并不是一件容易的事,偶爾一兩篇應該還行,要是一天一兩篇,很多多人也是受不了,因為大多數(shù)站長都不是作家那樣行如流水。比如要寫一篇成都租車的原創(chuàng)文章,若是自己本身都還不太了解汽車,那肯定是半天都都憋不出一個字來。所以,如何利用別人的文章來改成偽原創(chuàng),讓搜索引擎以為是原創(chuàng)內容,這是很多站長都追求的效果。

1、對文章的內容進行分析比較

首先從搜索引擎角度去考慮:

用戶在做偽原創(chuàng)的時候,會經常用到的方法有:

(1)刪除部分內容

(2)添加部分內容。在復制過來的文章里添加上兩句,或是把多篇文章合在一起。

(3)調換內容順序。把原文1.A,2.B,3.C,4.D,5.E 改成 1.C,2.B,3.E,4.A,5. D

用分詞技術后對相關的內容進行比較,分析項目有:

(1)字數(shù)大小

(2)幾個關鍵字出現(xiàn)頻率

(3)文中任幾句話

(4)鏈接

程序分析過程:

如果 (字數(shù)大小一樣)并且(幾個關鍵字出現(xiàn)頻率一樣)并且(文中任幾句話一樣)并且(鏈接指向與本文有90%以上的相似度的文章)

或者 文中任5句(長短不一,可能是5-30個字)以上的話是一致的

那么 判定為抄襲或偽原創(chuàng)。

由上面的程序分析過程中,可以看出:簡單的刪除內容、添加合并部分內容、調換內容順序、段落順序并不能讓搜索引擎當做原創(chuàng)。為什么?因為用如上簡單的的方法就可以看出大概了。字數(shù)大小、幾個關鍵字出現(xiàn)頻率、鏈接這都好辦,文中任幾句話對比這就不好辦了。

2、標題

如果是一樣的,那很有可能是復制,但要是改了一下標題呢,如把《成都租車常識》改成《教您怎樣在成都租車》,意思沒變,文字變了。所以,不能僅靠標題來判斷是不是原創(chuàng)。但可以做以下分析:

因為搜索引擎的數(shù)據(jù)量實在太大,不可能對所有的內容進行遂一的結比,而是同樣是使用“分詞“技術:

(1)如果搜索引擎蛛蛛訪問的頁面是一個新的頁面,那么,它將先把這個頁面內容收集起來,放入一個數(shù)據(jù)庫(或是其它),等其它程序如專門對比內容是不是原創(chuàng)、是不是有價值的程序進行處理。這時候,這個內容將不會被搜索出來。

(2)分析內容。也是利用了分詞技術,對標題、內容等進行分析。得出了這個頁面的主要內容。如《周杰倫2010年專輯》這樣的篇文章時,它將與包括”周杰倫“、”2010“、”專輯“這樣的關鍵詞的文章進行比較,而不用與所有的網頁進行比較。如果結果是原創(chuàng)、比較有價值,則進行收錄,給比較高的權重。如果被認為是復制或抄襲,則不進行收錄,或是給的權重很低。順便要說的是,對于這個頁面的權重,不僅僅是跟其本身的內容、本身的內容有關,能不能有好的排名,還要跟整個站點的權重有關。打個比方,如果這個頁面的權重是3,網站的權重是3,那加起來是6。要是別的網站轉載了這個文章,文章的權重是1,但他的網站的權重是7,那加起來就是8。6<8所以轉載的文章還是會排在原創(chuàng)文章的前面。

信息來源快幫云:集群網站建設

文章內容來源于網絡,侵刪

常見問題

京公網安備 11010802036823號

   

京ICP備16051929號

   

增值電信業(yè)務許可證編號:京B2-20190686

   

專利代理機構代碼:16087

   

人力資源服務許可證編號:1101082019043

   

代理記賬許可證書編號:DLJZ11010820210015

0
芦溪县| 磐石市| 屏山县| 衢州市| 陇西县| 中江县| 凤台县| 托克逊县| 吴旗县| 内黄县| 吉安市| 芒康县| 东阿县| 宁德市| 老河口市| 当雄县| 五华县| 鹿邑县| 平度市| 洛南县| 竹山县| 右玉县| 富锦市| 巴彦县| 贵南县| 馆陶县| 黔南| 博野县| 涪陵区| 乐东| 武城县| 高邮市| 花莲市| 南丰县| 巩留县| 东莞市| 枣强县| 额敏县| 丘北县| 德保县| 淮南市|