發布郵件地址時用「#」「at」等替代「@」有助於反垃圾郵件嗎?

我問這個問題的原意是試圖探討:隱私保護和用戶體驗之間的權衡問題。
對於公布郵件地址,我能想到的方案有:
用戶體驗最好,保護隱私最差:使用mailto標籤(點擊直接發信,移動終端友好,對於爬蟲太明顯)。
用戶體驗居中,保護隱私居中:文字寫出郵件地址,並對其中進行一些替換(可以複製,對於爬蟲防護力未知)
用戶體驗最差,保護隱私最好:使用圖片(不能複製,移動終端使用者只能背下來在敲字,但保險)。
------------以下原描述-------------
比如用「#」,「[at]"替換「@」,用「[dot]」替換「.」。
如果真的要爬取,這些顯然攔不住爬蟲的,郵件地址可以有很多手段判斷,最簡單的比如gmail這個關鍵字就暴露了,防止SPAM主要還是靠郵件服務商以及從內容下手吧。
相反直接在網頁上用mailto標籤公布郵件地址的人也很多,說明直接寫出並沒有很大的垃圾郵件風險。
這種替換的寫法反而會對正常用戶造成些許不便,比如不能複製粘貼,更不用說直接點擊。所以是不是可以歸為一種陋習了?
有沒有人對此有過研究,寫過爬蟲,做過實驗,或者有過相關經歷?


看得出來題主很有想法也很聰明,但 too simple。我來貢獻點乾貨,回答樓主問題之後介紹幾種常見的郵件隱藏方法。

在見到真實世界數據之前,你臆想一個依靠「gmail」關鍵字就可以準確抓取一個郵件地址,在面對真實世界各種noise文本的時候,相信你會像曾經的我一樣流下絕望的眼淚。

小時候上課的時候,曾經上一門NLP機器學習課程,本來重點是機器學習演算法分析,可以選擇學術界很多現成的數據集上做實驗。不過當時還天真無邪的我毅然選擇自己爬數據,結果見到爬下來的真實文本讓我欲哭無淚,我花了整個項目將近一半的時間精力去把noise的數據洗乾淨。

==============
回到正題

【1】
這樣替代方法總是可以防止一部分爬蟲的,再簡單的防護方法也比沒有好。要記住,爬蟲的目的不是爬你這個網址,它的目標是儘可能多的捕獲到email address。一般是靠正則表達式。[dot]容易被抓出來,那就&總可以吧?&不行我&<&&>總行吧?你來抓我呀~

爬蟲作者永遠無法提出一個完美的解決方案去預想捕獲所有的情況,行話叫做recall太低。你想要一個十全十美的系統不是不可以,這樣成倍的成本投入是否能夠換來相應的回報呢?


【2】
順便按照慣例,分析過問題之後貢獻一點乾貨:如何隱藏自己的電子郵件地址?

a) FirstName.LastName@XXX.com 這種方式一般常見於bio簡歷頁面

b) 把email做成圖片

c) HTML源代碼迷惑方法,比如

yourname&@. --&>@&@. --&>yourdomain&@. --&>.&@. --&>com
yourname#64;yourdomain#46;com.

d) 用javascript

&