在網路上遇到兩篇完全相同的文章,發布日期相同,且均聲明原創,作為讀者應如何判斷是誰抄襲的誰?


題主來分享一下自己的判斷過程。

事件背景:

今天(2013年10月24日)我先後在兩個站點讀到同樣內容的文章。文章頁面所示的發布日期都是10月24日,且文末均有原創聲明,無法直接判斷抄襲方。

我是怎樣讀到這兩篇文章的呢?這就是最有趣的一點了……

兩位作者同時將自己站中的文章轉貼到了知乎上,而且還是掛在同一個話題的下面。

就這樣,滑鼠點著點著,突然發現有兩篇回答,內容完全一樣,卻由兩位答主作答,答案中的鏈接指向不同的網站!

在如今網路環境的熏陶下,對抄襲的理解認識早已被刷新了無數次。但是像這種「真假美猴王」一般的好戲,倒還真是超乎我的想像。

而且,簡直不可思議,這齣戲居然在知乎上演。

我想無論抄襲方是誰,都會改變各位讀者對部分用戶素質下限的認知。

(為了便於描述,下文中將「先回答一方」命名為A, 「後回答一方」命名為B.)

- - - - - - - - - - - - - -

一開始自己並沒有想太多,既然先讀了A的文章,那麼直覺也就斷定為B抄襲A。於是就在B的回答下面隨手@了A,提醒他注意此事。

結果B率先回復我,表示A才是抄襲方,此文為B站原創。

這個問題變得有意思了!儘管B這麼說,但是並沒有給出證據,僅僅一句解釋並沒有什麼說服力。A雖然沒有表態,不過他才是先回答問題的人,而且話題經驗上還掛著自己博客的地址,總不能拿自己的聲譽開玩笑吧。那麼究竟是誰在抄襲誰呢?總之不能再這麼憑藉直覺妄加判斷了。

- - - - - - - - - - - - - -

這種抄襲事件應當很好判斷,畢竟文章總得寫完之後才能給人抄,這樣後發文章的那位肯定是抄襲者。但是在這個問題中,由於其中一站主題設置的關係,其頁面上只顯示了「發表於 2013年10月24日」,沒有提供具體時間,也就無法進行對照。另外,有些博客的發表時間是指文章最後一次修改後的保存時間,從這點可能也會影響到判斷。

所以說,如果能像知乎的問題日誌/回答日誌一樣,找到一篇帶有時間記錄的日誌就好了…

對了,網頁快照!

於是打開Google,然後……撞牆了。

無奈之下打開百度,嗯,看來開曼群島的企業就是適應國情。好了,打開百度快照……咦?怎麼不顯示頁面抓取的時間?那要你快照何用啊!難道只是用來看黃網么!

- - - - - - - - - - - - - -

既然如此,暫且先在兩站的內部尋找線索吧。A站好像要更用心一些,正文里有一個引向站內相關文章的鏈接,文中貼圖也打上了自己網站的水印。

也許這裡會有什麼線索,就隨手調查一下雙方貼圖的屬性吧:

在A站,右鍵圖片另存為,得到一個默認文件名 "2013102431611175.jpg",看來是今天上傳的。

然後再打開B站,下載他的圖片,他使用的文件名則是「屏幕快照-2013-10-23-下午4.51.01.jpg」。

咦,10月23日下午么?那就是昨天準備的啊。莫非他才是原創方?

- - - - - - - - - - - - - -

不行,這個判斷太草率了,圖片的文件名可以修改,這還不是決定性的證據。視線繼續向下掃,文章的末尾是評論框和分享按鈕。其中,A站用的是百度分享工具,B站選裝了多說評論框 ——

對了!安裝多說的插件之後,文章發表時可以同步分享到微博的!

這可是個意義重大的突破口,之前怎麼就沒想到呢。打開新浪微博,搜索文章摘要,OK.

決定性的證據:B站的官方微博,「【標題】+摘要+鏈接」,10月23日17:01,來自多說評論框。

除此以外,我也找到了其他幾點證據,包括:A站於10月24日8時54分發布的分享微博、B站對A站發表嚴正聲明的微博,以及眾網友聲討A站無恥行徑的微博。

真是「踏破鐵鞋無覓處,柳暗花明又一村」啊。看來,在新浪微博上,大家對抄襲方的認定已經非常明確,只是聲音尚未傳播出來,我的反射弧又比較遲鈍罷了。

- - - - - - - - - - - - - -

現已鐵證如山,A才是真正的抄襲方。我最初的猜測是錯誤的。

另外,這也證實了上文中提到過的另一個「另外」。從微博分享的數據來看,B站的文章發表於昨天「10月23日」,而非頁面所示的「10月24日」。這應該就是因為該站在今天對文章進行了編輯,導致日期顯示的改變。

從這起事件的角度考慮,我不認為這是一個好的設計 —— 假如說B站於明天再次修改文章,那麼文章日期將改為「10月25日」,反而比抄襲者A的發表時間還要更晚。這點也請各位站長留意一下。

- - - - - - - - - - - - - -

//補充一記,在寫答案的時候才突然想到,RSS是帶有精確的時間標記的。於是去點了下他們的「訂閱」按鈕,啊哈,如我所料。

//哼哼,誰讓 Google Reader 死得早,不然早想到這招,問題早解決了……

- - - - - - - - - - - - - -

文末感言:

1. 現在的 Google 真趕不上幾年前的好用了。

2. 最後扛起了大旗的居然是新浪微博。

3. 對「細心」的抄襲者來說,抄襲反而是一個重新排版的過程。

4. 受直覺的干擾,自己最初將原創者B誤判為抄襲者,向被冤枉的博主與作者致歉。

5. 關於抄襲者,我暫且給你留些面子,不公開@你,也不指望你會看到這篇回答。但是,假若你不巧看到這裡,請你問一問自己,你的下限在哪裡?


這個問題是因為有網站抄襲我們的文章,而且居然分享到知乎並鏈接到他們網站的侵權內容,我又得到網站授權在知乎分享,恰好被題主遇到,at到我,就發生了這些事。題主邀請我回答,我想談談我的看法:

1,聲明原創都是被逼的:因為在一個自覺、自律的社會,你的就是你的,我的就是我的,不需要過多的聲明,當大家去拿別人的東西(轉載或者採用)會先徵求別人的意見,並且徵得同意之後於最顯眼處聲明原出處,別人不同意的你不能拿,不會說隨便侵權,他不會把時間浪費在各種維權上,而是專註在創作上,但這種環境太過於理想化,而現實的情況是各種抄襲侵權,各種無下限,即便你聲明,也無視,而不聲明則更是被認為棄權。所以聲明都是被逼的。

2,抄襲是很快的,基本上在你發表之後的幾秒鐘就可以抄襲,但一般抄襲別人內容的網站,你會發現他們的大多數都是抄襲的,所謂相由心生,這點是可以看出來的。所以更多的是一種信任和網站所傳達的價值觀。本質上我認為很多精選網站也是一種抄襲和侵權,比如頭條之類的,因為你們收錄別人的文章必須經過授權,沒有授權就不能收錄。但實際情況卻不是如此。

3,題主談到了一些技術細節,也可以從時間線,關鍵點辨別是非,這點很好。

4,上面有人說,真真假假都一樣,反正讀者都看完了,錯,區別太大了。如果原創者的利益和權益得不到保證,就沒有文章可讀了。環境被破壞了人人都會遭殃,關於這點可以看看我們這篇文章:《關於盜版》

5,我們在每篇文章中都註明「本文版權屬於softu.cn,未經許可禁止轉載,商業使用請聯繫@softucn。」就是為保護我們的原創和勞動成果,但依然是由很多侵權,可見這個環境有多惡劣。另外題主提到的時間線問題是因為我們的網站是以更新時間為準(比如你修改了一個錯別字,修改了兩個措辭會導致文章的發表時間更改為修改時間),這點我們會儘快改正。

6,可笑的是很多侵權抄襲別人的文章竟然還在他們的網站上標明原創,並且要求別人轉載的時候註明出處,但他們卻完全沒有按照他們所要求的去做。要求別人怎麼做,首先要自己怎麼做。

最後再次感謝題主的支持、提醒和考據。環境的維護需要你我他,讓我們共同架構一個良好的互聯網環境。


或許只是作者的兩個不同ID發布在不同社區了而已。


推薦閱讀:

如何評價滿漢全席江岸?
爐石傳說里你還自創或改造牌組么?給牌組起過什麼有趣的名字?
新晉段子手崔始源搞笑功力果然藏得夠深呀
虛擬偶像
莫做虧心事,小心鬼敲門

TAG:互聯網 | 抄襲 | 原創 |