論文解讀:SURF: Summarizer of User Reviews Feedback?
摘要
持續發布(Continuous Delivery (CD))這件事兒使得開發人員可以不間斷的更新軟體;
但是更快的上線速度或者更高的應用質量並不能保證用戶滿意程度或者商業收益。
先前的工作表明app的評論中可能包含大量的信息能夠指導開發人員的軟體更新維護朝向用戶滿意程度更高的方向。
但是先前的工作也表明手動分析這麼多數據也是很難的。
- app每天接收到的評論數量很多
- 而且評論的內容都是非結構化的
SURF (Summarizer of User Reviews Feedback)
- 能夠分析以及聚類包含在app評論中的信息
- 能夠將可用於改進應用程序的可實施的change tasks分離出來
- 系統性的總結成千上萬的評論
接下來就是日常吹X,我很強!!!
引用
user involvement during the software evolution process is a crucial aspect for satisfying user needs and building successful products.
用戶反饋包含很多重要的信息,能夠幫助定位bug或者指出應用的不足之處。
前面的工作都表明了要解決評論信息太多,手動分析太過於複雜這一點,基本都採用預分類的方式進行分類,便於開發人員查看。
但是以前的工作忽略的一點就是:不能夠減少評論的數量以及開發人員不得不處理的信息量
SURF:
能夠自動生成用戶評論的摘要信息以便於開發人員更好的理解用戶需要以及應對大量的評論。
基於我們以前工作的改進:
- 能夠輸出XML格式,使得集成更加的方便
- 全新的report-viewer
- a reviews downloader能夠直接下載評論數據通過應用商店
SURF』s purpose is to make information contained in user reviews more man-
ageable and actionable for developers.
優點:
- determine for a large number of reviews the specific topics discussed in the review (e.g., UI improvements,security/licensing issues, etc.)
- identify the maintenance task to perform for addressing the request stated in the review (e.g., bug fixing, feature enhancement, etc.)
- present such information in the form of a condensed, interactive and structured agenda of recommended software changes.
正文
SURF步驟:
- extract the topics of a review
- classify the intention of the author to suggest the specific kind of maintenance task required to act on the review
- group together sentences covering the same topic
這篇文章是建立在他們以前寫的一篇文章的基礎上, User Reviews Model
定義數據格式:
因為不同App store源的評論格式不一樣,需要統一文件格式
Intention Classification:
對於每個評論,將評論文本劃分成句子,每個句子通過STD解析器進行解析。基於STD解析器我們定義了246種模板用於intention分類。更多的詳細信息還是要去看User Reviews Model
Topic Classification:
for each of the topics in Table II we define a list of n-gram keywords that could be clues for the assignment of a sentence to that specific topic.
Sentence Scoring:
Summary Generation:
結論
推薦閱讀:
※香港評論(23):智慧城市反映出的「強盜邏輯」│脫苦海
※玄奘的大愛之路——《西遊降魔》
※評論拾遺(五)
※評論拾遺(一)