如何讓你的知乎內容更受歡迎?——圖片與粉絲的作用分析
編者按:隨著社交問答社區應用的日益普及,越來越多的網路用戶傾向於閱讀和瀏覽其社區中的用戶生成內容(user generated content, UGC)。而作為國內知名的知識型問答社區——知乎,其社區的用戶生成內容也受到許多學者的關注和興趣。今天,小編選取了一篇專門分析知乎受歡迎的用戶生成內容的特徵的會議論文,該論文發表於2017年6月份的第21屆亞太信息系統年會(PACIS 2017),作者們來自清華大學經濟管理學院 (Yue Jin, Jinghua Huang & Xinyao Wang)。作者們研究發現,1)答案中包含的圖片數量會正向影響內容的熱度;2)隨著答案篇幅的增加,答案被點贊的數量呈現倒U型,即先減少後增加;3)粉絲的數量對答案的熱度有積極影響,而朋友數量卻沒有顯著影響;4)回答的內容特性對有很多粉絲的回答者影響較小,但對有很多朋友的回答者有著較大的影響。
1. 研究背景介紹
網路社區中內容熱度通常會由用戶的投票機制決定。像美國的http://Quora.com和國內的知乎等問答社區在使用用戶投票數為回答排序已經有了相對成熟的機制。例如http://Digg.com和http://Instagram.com也是依靠相似的機制尋找用戶關心的熱點內容。網路社區中的用戶投票機制十分重要因為它既反映了用戶群對信息質量的評價,也會影響讀者注意力的分布。
除了投票機制,社會問答社區的另一個重要特色是社交網路機制,用戶可以關注或者與他們喜歡的內容貢獻者相互交友。因此,投票的結果通常會備受爭議,因為網路大V或者是那些為了提升熱度不斷交友並請求別人投票的網路用戶會影響投票的結果。『』
那麼在這種情況下,什麼樣的用戶以及什麼樣的內容會收到更多的投票?那些擁有大量粉絲的用戶會在長時間的範圍內得到更多的投票嗎?用戶會為了提升投票數而更積極的交友嗎?內容本身會影響作者的社會網路關係嗎?
本文從信息採納和信息傳播的角度,探究內容的特性和作者的社會網路關係對內容熱度的影響。結果顯示,回答中有越多的圖片數,回答者有更多的粉絲數,這些內容會收到更多的投票。但是,字數的多少對投票機制沒有線性的影響。隨著回答的變長,投票數先是減少,然後上升。回答者有較多的粉絲但是較少的朋友,他回答的內容特性就顯得越不重要。本研究揭示了社會網路機制對投票結果的影響,以及該影響隨著回答者關係類型的變化情況。
2. 研究的理論基礎
雙重過程理論與投票機制(Dual-process Theory and Voting)
依據雙重過程理論,投票是信息採納的一種形式,是信息處理的結果。HSM和ELM是兩個基於雙重過程理論的重要模型。這兩個模型密切相關,它們都認為信息採納由兩條處理路線管理:系統處理和啟發式處理。系統處理需要動力,能力和足夠的認知資源。然而啟發式處理取決於線索的可獲得性以及與這些線索相關的啟發式意識。研究表明,內容質量作為系統線索,資源的可靠性作為啟發式線索,這兩者都對信息採納有影響。
雙過程理論通常被用來分析在線評論投票的有用性。研究結果顯示,評論的內容,評論的排序以及評論者的信譽都會影響評論的有用性。已有的研究認為內容因素作為系統線索,回答者的個人特徵作為啟發式線索共同影響用戶的信息採納行為。但是,他們並沒有分析回答者在社區中的社會網路影響和社會影響與內容特性的交互影響。例如,回答者的朋友和粉絲可能會更有可能給其投票。
社會關係的影響(The Influence of Social Relationship)
在社會關係研究中最常提及的兩種關係是強聯繫和弱聯繫。在我們的研究中,我們把用戶之間單方面的關注當作弱聯繫,把互相關注的朋友關係當作強聯繫。沒有直接聯繫的用戶則被當作是陌生人。通常而言,粉絲相比於陌生人來說有更大的可能性看到回答的內容,並且在傳播信息方面更有效率。相對而言,朋友可以看到回答的內容,但是在傳播方面效率較低。
以往的研究表明,從信息傳播和採納的角度來看,不同的關係可能會有不同的影響。相對而言粉絲在信息傳播方面更有效率。因此,粉絲和朋友對投票結果的影響需要進行比較。在本文的研究中,我們比較粉絲和朋友對回答內容票數的影響以及它們如何調節內容特性的影響力。
3. 研究變數與假設
通過對理論基礎和已有相關文獻的梳理,作者們提出了表示回答內容熱度的研究變數,這也是本研究的因變數——用戶回答收穫的投票數量。
在自變數的選取方面,作者提出了四個研究變數:回答的字數(Words)、圖片數(Pictures)、回答者的粉絲數(Followers)、回答者的朋友數(Friends)。在控制變數的選取方面,作者選取了七個控制變數:回答者是否提供微博鏈接(Weibo)、回答者是否提供個人描述(Desc)、回答者是否有個性簽名(Sign)、回答者在觀察期貢獻的答案數(Exp)、觀察期與提問的間隔時間(AbsImmd)、回復的間隔時間(RelaImmd)、回答的流行度(QuesPop)。
根據相關的文獻梳理,作者提出了7個研究假設:
H1: 回答的字數越多,得票數越多;
H2: 回答包含的圖片數越多,得票數越多;
H3: 回答者的粉絲越多,得票數越多;
H4:回答者的朋友越多,得票數越多;
H5:朋友對得票數的影響小於粉絲對得票數的影響;
H6:回答者的粉絲越多,內容特點對得票數的影響越小;
H7: 回答著的朋友越多,內容特點對得票數的影響越小。
4. 數據的收集、處理與分析
作者們在知乎上隨機選擇了兩個熱門話題,在每個話題頁面下爬取了1000個問題及其截止到2015年6月的回答。選擇接下來的三個月作為觀察期,從每個話題里隨機選擇1000個回答者,並追蹤他們回答的熱度。在觀察期中沒有提供任何回答的用戶被去除,最終的數據集中包含了895位用戶。平均每個用戶有396個粉絲和24個朋友。在觀察期間平均每人每月貢獻8條答案。
作者們使用零膨脹負二項回歸(zero inflated negative binomial)進行數據的擬合。模型2在模型1的基礎上增加了社會關係與內容特點的交互作用,以此來驗證社會關係的調節作用。
圖1 研究模型1
圖2 研究模型2
分析結果顯示,內容特性影響投票數。答案中的圖片越多,回答收到的投票數越多(H2成立)。然而,回答中字數的影響是負面的(H1不成立)。答案越長,得票數先減少後增加,字數與得票數之間呈非線性關係。回答者的社會關係也影響得票的數量。回答者的粉絲越多,他們回答收到的票數就越多(H3成立)。但是朋友數量的影響並不顯著,因此,更多的朋友不一定會得到更多的投票數(H4不成立)。朋友和粉絲影響的差異是顯著的,H5成立。關於調節作用,回答者的粉絲數量越多,回答中包含圖片數量的重要性越低(H6成立)。相反,回答者擁有的朋友越多,回答中包含圖片的數量就越重要(H7不成立)。
5. 對研究結果的思考
首先,當答案變長時,用戶回答的得票數量先減少後增加。可能的原因是社會問答社區的答案相對較長,而讀者的時間是有限和分散的。因此當預期的認知和時間資源消耗較大時,他們可能會停止閱讀。在知乎網站中有一個有趣的現象「抖機靈」意思是說用戶提供的答案很短,卻引發了笑聲,這樣的答案往往收到較高數量的投票。因此,簡短或者是全面的答案的投票數量要高於那些中長答案。
其次,圖片數量對票數有積極的影響。回答者應盡量以最短的方式表達自己,因為人們的注意力是有限的。圖片比文字更能傳達信息,耗費的時間也少。包含圖片的回答更加生動有趣,可以提升閱讀體驗。因此,圖片增加了內容的熱度。
第三,回答者的社交網路關係影響內容熱度。回答者的粉絲數量越多,他們收到的票數越多。相比之下,朋友的影響較小,但仍是積極的方向。不顯著的原因可用強關係的冗餘來解釋。Shi等人提供了另一個可能的解釋:朋友在採納信息時更加謹慎,因此,他們需要更多的證據來證明,這會導致文字和圖片等內容特性的影響增加。
最後,內容的影響力受社會關係的影響。對於有很多粉絲的回答者來說,圖片的影響效果會減低。對於有很多朋友的回答者來說,圖片的影響效果會增加。這個發現肯定了我們之前的解釋:朋友在投票的時候會更加謹慎,更加關注內容特性。這也為Shi等人的解釋提供了證據。但是,朋友的影響機制還需要進一步的探究。
推薦閱讀: