國內IT巨頭髮表過哪些頂級學術會議論文?
google,Facebook等國外大佬經常在頂級會議上(SOSP/PLDI/NSDI等等)發論文,那麼國內巨頭BAT們也經常發論文嗎?有哪些代表作?
拿17年CVPR來說
阿里巴巴共有四篇論文被接收,其中阿里 AI Lab 3 篇,阿里 iDST 1 篇:Deep Level Sets for Salient Object Detection
Global Context-Aware Attention LSTM Networks for 3D Action Recognition
Episodic CAMN: Contextual Attention-based Memory Networks With Iterative Feedback For Scene Labeling
Video to Shop: Exactly Matching Clothes in Videos to Online Shopping Images騰訊 AI Lab 共有 6 篇論文被 CVPR 2017 接收:
Real Time Neural Style Transfer for Videos
WSISA: Making Survival Prediction from Whole Slide Histopathological Images
SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning
Deep Self-Taught Learning for Weakly Supervised Object Localization
Diverse Image Annotation
Exploiting Symmetry and/or Manhattan Properties for 3D Object Structure Estimation from Single and Multiple Images
商湯科技及香港中大-商湯科技聯合實驗室共有 23 篇論文被接收。
1.Multi-Context Attention for Human Pose Estimation
2.Multi-Scale Continuous CRFs as Sequential Deep Networks for Monocular Depth Estimation
3.Accurate Single Stage Detector Using Recurrent Rolling Convolution
4.Mimicking Very Efficient Network for Object Detection
5.Object Detection in Videos with Tubelet Proposal Networks
6.Spindle Net: Person Re-identification with Human Body Region Guided Feature Decomposition and Fusion.
7.Discover and Learn New Objects from Documentaries
8.Learning object interactions and descriptions for Semantic Image Segmentation - Saturday
9.Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification Saturday
10.Scale-Aware Face Detection
12.Detecting Visual Relationships with Deep Relational Networks
13.Joint Detection and Identification Feature Learning for Person Search
14.Learning Cross-Modal Deep Representations for Robust Pedestrian Detection
15.PolyNet: A Pursuit of Structural Diversity in Very Deep Networks
16.Pyramid Scene Parsing Network
17.Person Search with Natural Language Description
18.Quality Aware Network for Set to Set Recognition
19.UntrimmedNets for Weakly Supervised Action Recognition and Detection
20.Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade
21.Residual Attention Network for Image Classification
22.ViP-CNN: A Visual Phrase Reasoning Convolutional Neural Network for Visual Relationship Detection
23.Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing
在今年的國際人工智慧聯合會議(IJCAI)上,阿里巴巴有11篇論文入選。這是繼今年的CVPR會議入選4篇、KDD會議入選5篇後,阿里巴巴在人工智慧頂級會議上斬獲的最新成果。
IJCAI被認為是人工智慧領域最頂級的學術會議之一,涵蓋機器學習、計算可持續性、圖像識別、語音技術、視頻技術等,對全球人工智慧行業具有巨大影響力。今年IJCAI共收到2540篇論文投稿,再創歷史新高,最終錄用660篇,錄用率26%。
阿里巴巴入選的11篇論文中,有6篇論文來自阿里巴巴-浙大前沿技術聯合研究中心,3篇來自螞蟻金服,均被主會收錄。另外2篇來自天貓和菜鳥物流,被主題為「AI Applications inE-Commerce」的Workshop收錄。
(IJCAI阿里巴巴workshop現場照片)
今年3月,阿里巴巴推出NASA計劃,面向未來20年組建強大的獨立研發機構,為服務近20億人的新經濟體儲備核心科技。為實現該目標,一方面由金榕、華先勝、任小楓等技術領軍人物,組建iDST、AI Labs等研究機構;另一方面發布首個全球性科研項目「AIR」計劃,推進計算機科學領域基礎性、前瞻性、突破性的研究,構建技術生態。
當前的阿里巴巴正從「互聯網+模式」的商業模式創新引領者,變成科技創新的引領者。
以下為IJCAI2017阿里巴巴入選論文(前6篇來自阿里-浙大前沿技術聯合研究中心,後3篇來自螞蟻金服)
Image Gradient-based Joint DirectVisual Odometry for Stereo Camera
一種基於圖像梯度聯合優化的雙目視覺里程計演算法
作者:朱建科
本文中提出了一個全新的並且可以改進收斂獲得更精確姿態的雙目里程計方法。我們演算法的關鍵部分是一個基於多尺度金字塔構架的雙雅克比優化方法,並介紹了一個基於梯度特徵的圖像表示方式。這使得我們的演算法對光線變化很魯棒。創新地提出的聯合優化的雙目視覺里程計演算法將結合最新幀和之前關鍵幀的信息。
地址:
https://www.ijcai.org/proceedings/2017/0636.pdf
DeepFacade: A Deep Learning Approach to Facade Parsing
深度表面:一種基於深度學習的建築表面解析方法
作者:劉漢唐,張加良,朱建科,許主洪
我們提出一種基於深度學習的解析建築物表面的方法。人工製造的建築規則通常具有很高的對稱性。基於這個觀察,我們為神經網路提出了一個對稱的約束項。我們的方法可以同時採用深度學習和人工先驗信息的優點。我們通過給FCN-8s增加對稱損失函數來檢測我們方法的效果。實驗結果顯示我們的方法在ECP和eTREIMS數據集上打敗了之前領域內最先進的方法,是第一個在全圖尺度上使用深度神經網路的方法。
地址:
https://www.ijcai.org/proceedings/2017/0320.pdf
CFNN: Correlation Filter Neural Network forVisual Object Tracking
CFNN:一種協相關濾波神經網路的可視物體跟蹤演算法
作者:李洋,徐展 ,朱建科
我們提出了一個新穎的協相關濾波神經網路結構以及一整套跟蹤演算法,是傳統卷積神經網路的一個特例。它的網路初始化不需要在任何額外數據集上進行任何的提前訓練。得益於循環採樣技術,我們提出的方法在網路初始化時便可以得到有效的判別能力並且在網路更新時兼具向後傳播演算法的優勢從而習得新樣本的外觀變化。整個跟蹤過程同時繼承了卷機網路以及協相關濾波演算法的互補優勢。
地址:
https://www.ijcai.org/proceedings/2017/0309.pdf
Deep Optical Flow EstimationVia Multi-Scale Correspondence Structure Learning
基於多尺度對應結構化學習的深度光流估計
作者:趙杉杉,李璽,奧馬
我們提出的MSCSL學習框架利用深度學習得到多尺度特徵空間,進而在該深度特徵空間中學習多尺度圖像之間的對應結構。MSCSL通過建立一個空間卷積GRU(SpatialConv-GRU)神經網路模型去自適應地建模不同尺度對應結構之間的內在依賴關係。最後,在端到端深度學習框架中實現上面兩個過程。
地址:
https://www.ijcai.org/proceedings/2017/0488.pdf
Group-wise Deep Co-saliencyDetection
基於端到端全卷積神經網路的組協同顯著性檢測
作者:魏李娜,趙杉杉,奧馬,李璽,吳飛
我們設計了一個統一的端到端深度學習框架對組內共享特徵和單張圖像特徵的互動及關聯關係進行聯合學習,從而使模型更具準確性和魯棒性。
地址:
https://www.ijcai.org/proceedings/2017/0424.pdf
Boosted Zero-Shot Learningwith Semantic Correlation Regularization
基於語義相關性約束的提升零樣本分類學習
作者:皮特,李璽,張仲非
我們設計了一個語義相關性正則化(SCR)方法,以約束提升分類模型使之與類別間的語義相關性結構相一致。隨著將SCR正則化嵌入提升分類,以及嵌入針對魯棒學習的自控制樣本選擇過程,我們提出了一個統一的框架,基於語義相關性約束的提升零樣本分類模型(BZ-SCR)。通過平衡受SCR正則化的提升模型選擇過程和自控制的樣本選擇過程,BZ-SCR能夠捕捉從特徵到類別語義的有判別性的、可適應的校準,同時保證被學習樣本的可靠性和對目標類別的適應性。
地址:
https://www.ijcai.org/proceedings/2017/0362.pdf
Local Linear Factorization Machines
Chenghao Liu, Teng Zhang, Peilin Zhao, Jun Zhou, Jianling Sun
局部線性因子分解機
劉成昊, 張騰, 趙沛霖, 周俊, 孫建伶
摘要:因子分解機(FM)是一種被廣泛應用的方法,因其在分類和回歸任務中可以高效利用高階特徵交互。不幸地,儘管對因子分解機有不斷增長的興趣,現存工作僅僅考慮了輸入特徵的二階信息。這限制了它在非線性問題上的能力且不能捕捉更複雜數據的潛在結構。在這個工作中,我們提出了一種新的局部線性因子分解機(LLFM)。它利用局部編碼技術克服了上述FM的缺陷。現存局部編碼分類器的學習方法包含了一個無監督錨點學習階段和一個預定義的局部編碼方案。由於編碼方案中沒有利用數據的類別信息,這些方法會導致用於預測的編碼是次優的。不同於已有方法,我們在錨點、局部編碼坐標、和FM參數上規划出一個聯合優化方案,來最小化分類或回歸風險。最後,我們通過實驗證明了,我們的方法取得了比其他已有FM方案、以及利用無監督錨點學習和預定義編碼的LLFM明顯更好的預測精度。
論文鏈接地址:
https://www.ijcai.org/proceedings/2017/0319.pdf
Learning User Dependencies for Recommendation
Yong Liu, Peilin Zhao, Xin Liu, Min Wu, Lixin Duan, Xiaoli Li
為推薦學慣用戶相關性
劉勇, 趙沛霖, 劉星, 吳敏, 段立新, 李曉黎
摘要:社交推薦系統利用用戶的社交關係來提高推薦精度。直覺上來講,一個用戶對於不同的場景傾向於信任不同的用戶。因此,社交推薦的一個主要挑戰是對於一個給定的推薦任務如何利用用戶間的最合適的相關性。以前的社交推薦方法通常是基於預定義的用戶相關性而開發的。因此,對於一個具體的推薦任務,它們可能不是最優的。在這篇文章里,我們提出了一個名為概率關係矩陣分解(PRMF)的推薦方法,它可以自動學慣用戶相關性來提高推薦精度。在PRMF里,我們假設用戶的潛在特徵是服從矩陣變數正態(MVN)分布。此外,用戶的正負相關性都可以用MVN分布的行精度矩陣來模擬。為了求解PRMF里的優化問題,我們提出了一個交替優化演算法。最後,在四個真實數據上的大量實驗證明了所提PRMF演算法的效力。
論文鏈接地址:
http://static.ijcai.org/proceedings-2017/0331.pdf
Online Multitask Relative Similarity Learning
Shuji Hao, Peilin Zhao, Yong Liu, Steven C. H. Hoi, Chunyan Miao
在線多任務相對相似度學習
郝書吉, 趙沛霖, 劉勇, 許主洪, 苗春燕
摘要:相對相似度學習(RSL)旨在通過由相對約束組成的數據來學習相似度函數。以前的大部分為RSL設計的演算法是離線學習演算法,所以在處理現實世界中的流式數據時會遭受極差的可擴展性。此外,這些現存演算法經常被設計來為一個具體的任務學習一個單獨的相似度函數。因此,它們在解決多任務學習問題時是次優的。為了克服這些缺陷,我們提出了一個可擴展的RSL框架,並命名為在線多任務相對相似度學習(OMTRSL)。具體來說,我們首先針對多任務相對相似度學習開發了一個簡單有效的在線學習演算法。然後,我們又提出一個主動學習演算法來節省打標的成本。所提出的演算法不僅享有極好的理論保證,也在現實數據集的實驗上展現了其高效能和效率。
論文鏈接地址:
https://www.ijcai.org/proceedings/2017/0253.pdf
以下兩篇被主題為「AI Applications in E-Commerce」的Workshop收錄
Solving a New 3D Bin Packing Problem with Deep ReinforcementLearning Method
利用深度強化學習解決新型三維裝箱問題
作者:胡浩源 張曉東 王龍飛 徐盈輝
本文通過近些年被成功應用於組合優化問題的深度學習技術--Pointer Network來對物品的放入順序進行學習和優化。基於大量實際數據構建和訓練了深度強化學習網路,並對此網路的效果進行了檢驗,結果表明相對於已有的啟發式方法,使用本文提出的深度強化學習方法可以獲得大約5%的效果提升。
Life-stage inference in E-commerce: adynamic merging based approach
電子商務中的生命階段推斷:一種動態融合方法
作者:周中晟,張禕東,舒智超,鄧玉明,王曉晴
為了提升用戶購物體驗,豐富用戶資料並探索用戶的潛在興趣是有價值的。例如,我們應該對初生嬰兒的媽媽展示尿布,對1到2歲寶寶的媽媽展示兒童服裝,因為媽媽們會在特定階段對購買這些商品感興趣。我們設計了一種基於動態融合方法的生命階段推斷,可用於預測用戶年齡並在電商推薦系統中使用。動態融合的關鍵是維護具有不同分類結論的多個概率分布,並在合適的時候對其進行更新。長期來看,只有有限個概率分布會被保留下來,我們可以根據這些分布對生命階段進行推斷。這樣做的優點是無論對一個或是多個用戶都能使用統一的生命階段預測結構,並且可以識別消費者的短期偏好。
我就說一句,不能眾多作者裡面有一個公司員工就說是這個公司的論文。BAT裡面都有厚著臉皮到處找人掛論文的專業戶,你讓他們講講有他們名字的文章做的什麼都會講不出來。
part1.近期數據會議及國內收錄論文數字
前段時間數據挖掘頂會 KDD 正式開幕,在接收的 200 多篇論文里,有 20 多篇來自中國大陸的高校和企業,而 KDD Cup 則由中國團隊包圓。
作為美國計算機學會 ACM 旗下數據挖掘和知識發現的專業組織,SIGKDD 每年都會主辦 KDD 大會,是數據挖掘領域的最高學術會議,每年都吸引2000 多與會者,大部分來自產業界,學術論文的接收比例不超過 20%。根據 KDD 2017 官網列出的接收論文,可以粗略統計出每家公司發表的文章數量:
谷歌 9 篇 Facebook 2 篇 亞馬遜 1 篇 微軟 9 篇 IBM 12 篇 百度 2 篇(百度人才情報中心) 阿里 5 篇 華為 4 篇 滴滴 2 篇
part2.如何獲取論文信息
1科學網
2中國學術會議在線
3 IEEE conferenceevent (http://ieeexplore.ieee.org)
4 allconference
part3.國際數據會議簡析
SIGMOD(Special Interest Group on Management Of Data.)數據管理國際會議,是由美國計算機協會(ACM)數據管理專業委員會(SIGMOD)發起、在資料庫領域具有最高學術地位的國際性學術會議。會議的目的是在全球範圍內為資料庫領域的研究者、開發者以及用戶提供一個探索最新學術思想和研究方法、交流開發技巧、工具以及經驗的平台,引導和促進資料庫學科的發展。
VLDB (Very Large Data Base) 是資料庫研究人員,供應商,參與者,應用開發者,以及用戶一年一度的主要國際論壇。涉及範圍廣泛,稍偏應用
ICDE International Conference on Data Engineering 數據工程國際會議。是數據和資料庫領域的頂級會議。
KDD ACM SIGKDD Conference on Knowledge Discovery and Date Mining數據挖掘最高會議
ICML International Conference on Machine Learning機器學習會議
SIGIR International ACM SIGIR Conference on Research and Development in Information Retrieval信息檢索會議
PODS ACM SIGMOD Conference on Principles of DB Systems資料庫理論會議
EDBT International Conference on Extending Database Technology資料庫會議
ICDT International Conference on Database Theory 資料庫理論會議
CIKM Conference on Information and Knowledge
SDM SIAM International Conference on Data Mining 數據挖掘方面僅次於SIGKDD
ICDM International Conference on Data Mining信息檢索、知識管理和資料庫領域
ECML-PKDD The European Conference on Machine Learning and Practice of Knowledge Discovery in Databases
你們看不上的龍芯,發過兩篇isscc
工業界的論文更應該是分享一些更高層次的挑戰性問題和更普遍性的解決方案。大家更希望看到公司發表一些類似於Facebook Ads Prediction(雖然是一個workshop paper)這種實用的論文,而不是那種低年紀研究生一個人在實驗室也可以完成的小修小補照葫蘆畫瓢的論文。
瀉藥,大廠的牛人太多,很多文章水平都非常棒,二線小廠還是等著攢攢再過來說說吧,不班門弄斧了。
好了,WSDM結果出來了,京東數據科學實驗室投了6個中了3個,還好還好,而且都是第一作者在京東的時候完成的工作發的(full-time research intern),還都是解決了電商平台上面非常基礎的幾個難點。作為其中2個工作的mentor,突然輕鬆了,雖然比不得某些TOP3巨頭,自己還是很欣慰的。
其實研究啊,論文呢,主要還是要自己開心,就醬
據我所知,騰訊優圖實驗室在iccv,cvpr上好像也有所作為
阿里自問自答,好套路啊
會的,每年都有。不只有bat 才發。每個公司有自己擅長的領域,所有發的會議或期刊不盡相同。
推薦閱讀:
※IT互聯網男都是通過什麼途徑找到女朋友的?
※小白從頭學習編程需要看哪些書起步?
※R語言和Python一塊學習會弄混嗎??
※IT業適合女生的職業規劃?