標籤:

終極十強英雄在此,「達觀杯」文本智能處理挑戰賽完美落幕

9月17日,「達觀杯」文本智能處理挑戰賽頒獎盛典在上海正式舉行。本次比賽歷時74天,由達觀數據主辦,Datacastle承辦、機器之心和浦東軟體園協辦,並得到了復旦大學、上海交通大學、東南大學的合作支持,以及 CIO 時代、中國中文信息學會、51CTO、CSDN 等行業和媒體合作夥伴的大力支持。

最終比賽角逐出的十強團隊:TNT_000_、未提交參與排名、會說話的機器狗、隨緣比賽、地表最強、CIKE-華腩鯉、NLPRookie、redhand、彳亍口巴、萬里陽光號。頒獎當天十支獲勝隊伍帶著各自在比賽中的技術實踐心得前來現場,頒獎盛典也因此成為了精彩的技術交流盛宴。

本次演算法比賽累計近3500人報名,3000隊伍參賽,14127次提交,吸引了包括微軟,騰訊,阿里巴巴、百度、京東、攜程、小米、中國移動,以及著名金融巨頭、運營商、軍工行業等354個國內外知名企業的技術人員,以及來自斯坦福、北大、清華、復旦等國內外知名高校的學生。

達觀數據創始人陳運文致辭分享

在頒獎典禮現場,達觀數據創始人陳運文傾心分享了自己曾經參加各大國際演算法比賽的經歷:「創辦達觀數據之前,我曾和大家一樣,喜歡寫演算法,打比賽,但在成立達觀數據之後,我發現讓演算法在實際工業中發揮作用需要做更多的工作。想要靈活應用好在學校里學習的基礎演算法,需要更多的應用練習。這也是我們做達觀杯的初衷,給更多演算法愛好者提供真實的場景練習,讓技術在真實的場景中發揮它最大的價值。探索技術在行業的應用場景是達觀數據持續在做的事情。」

達觀數據聯合創始人張健分享

本次賽題任務為」建立模型通過長文本數據正文(article),預測文本對應的類別(class)」,本次演算法大賽命題人達觀數據聯合創始人張健也在現場分享了命題的初衷。

自然語言處理一直是人工智慧領域的重要話題,而人類語言的複雜性也給 NLP 布下了重重困難等待解決。長文本的智能解析就是頗具挑戰性的任務,如何從紛繁多變、信息量龐雜的冗長文本中獲取關鍵信息,一直是文本領域難題。隨著深度學習的熱潮來臨,有許多新方法來到了 NLP 領域,給相關任務帶來了更多優秀成果,也給大家帶來了更多應用和想像的空間。比賽中達觀數據提供了一批長文本數據和分類信息,張健表示,從比賽結果來看,選手們做了非常多的嘗試與應用,取得了很好的效果。

十強分享,精彩連連

本次比賽的十強選手,現場分享了他們在比賽過程中的經歷,如何對演算法調參,如何突破效果瓶頸 ,每支團隊分享結束後,觀眾席中舉手提問的人絡繹不絕,預計的演講分享成為了演算法交流的盛會。

優勝團隊:萬里陽光號、NLPRookie、彳亍口巴、redhand 代表分享

季軍團隊:CIKE-華腩鯉、隨緣比賽、地表最強 代表演講分享

季軍團隊CIKE-華腩鯉的成員談星偉在分享最後總結了他們在比賽中對文本分類演算法的發現:

當使用了較好的詞權重衡量方法時,傳統的向量空間模型仍然有一定競爭力;基於LSTM的模型容易受雜訊影響,在文本長度較長的情況下,適當使用數據增強能夠提升效果; 模型之間的差異性越大,融合之後的結果就會越好,傳統模型和深度學習模型融合之後能提高1個百分點; 融合模型較少的時候,直接使用等權重概率融合就會有很好的結果。

亞軍團隊:未提交參與排名、會說話的機器狗 代表分享

比賽冠軍團隊代表演講分享

冠軍團隊TNT_000_的成員肖小粵在比賽分享了他們的「獲勝秘訣」:

「在本賽題場景下,我們在網路結構上的創新與改進所帶來的提升是顯著的,這也是我們這次隊伍能夠排名第一的關鍵點之一。第二點是訓練一個比較好的embedding不僅能夠加快網路的訓練,並且效果俱佳。這也是一些隊伍的深度學習模型沒有達到預期的關鍵原因之一。第三,傳統模型對於融合的提升是巨大的。這與後期深度學習融合提供極大差異性,帶來了很好的穩定效果。

頒獎盛典,榮耀時刻

本次比賽主辦方達觀數據也為各優秀的參賽選手準備了豐厚的獎金和直通面試機會。

優勝團隊:萬里陽光號

優勝團隊:redhand

優勝團隊:NLPRookie

季軍團隊:CIKE-華腩鯉

季軍團隊:地表最強

季軍團隊:隨緣比賽

亞軍團隊:會說話的機器狗

亞軍團隊:未提交參與排名

冠軍團隊:TNT_000_

比賽有始終,技術交流無止境。

頒獎結束後,季軍團隊【隨緣比賽】成員朱翔宇DOTA表示:

「雖然是最後10天才加入的,但是我收穫很大,短短的一兩周感受到了主辦方的負責,最後一周關鍵時期出現的問題也在達觀工作人員的幫助下解決了,很感謝。」

「達觀杯」是達觀數據發起的,專為技術和演算法愛好者舉辦的線上演算法比賽。至今已順利籌辦兩屆,吸引了4000多名選手參加。

從第一屆個性化推薦演算法挑戰賽到本次文本智能處理挑戰賽,達觀數據希望在技術與應用場景之間搭建互通的橋樑,讓優秀的技術在解決實際問題中發揮最大價值。

明年達觀杯,我們不見不散。

推薦閱讀:

TAG:科技 |