哪些人工智慧領域已經或者未來1-2年會實現盈利?
17年AI很火,可是我一直都看不太明白,AI到底怎麼賺錢?
現在各種準確率超過人類,但攝像頭加上人臉識別功能就是我們期望的AI的未來嗎?這方面的應用海康威視做就差不多了,還能支撐這麼多貴上天的創業公司嗎?
語音識別方面出現了Echo和智能家居,可是感覺Echo作為個人助理還有點困難,你可以讓他做一些簡單的工作(放音樂關燈等),可是更加困難的功能似乎還不是很常見?
智能客服很火,我自己試了很多家,但是很多時候我想找客服就是因為有一些我自己看說明搞不定的問題,可目前所謂智能客服只能推一些我已經知道的東西,結果每次無一例外還是得轉人工客服。
自動駕駛確實感覺是未來,谷歌也開始了L4的路測,但是未來3年內能實現完全自動駕駛嗎?退一步講,比如做貨車自動駕駛的圖森,三年內能實現貨車在高速上的完全自動駕駛嗎?感覺自動駕駛似乎並不是未來3,5年能實現的技術。
最後廣告和推薦方面確實賺錢了,可是這些領域在dl火起來之前早就賺錢了,和這一波熱潮也沒有太大關係吧?
醫療圖像領域離消費者比較遠我不是特別了解,還請知情人士介紹下哪些技術實現了商用,謝謝!
另外很多人提到to B方面確實盈利很難,因為大家期望太高,to C方面是不是已經有了很多盈利的案例呢,也希望業內人士能來介紹一下,謝謝!
請大家能多邀請大牛來回答謝謝!
當然是Numerai啦。(網址:Numerai)
自從 @文兄 帶我入了numerai的坑之後,簡直是打開了新世界的大門,現在的我每個星期都沉迷numerai。我愛調參,調參使我快樂……
以下是認真回答:
Numerai是一家基於人工智慧的對沖基金,成立於2015年。它成功結合了機器學習、數據競賽、眾包(crowdsourcing)、密碼貨幣等諸多前沿的互聯網概念。截至2016年,Numerai已經籌集了750萬美元的融資。
如果參加過kaggle或者天池大數據競賽,那麼你一定不會對Numerai的網頁感到陌生:
每個星期,Numerai會公開提供新一輪的金融數據。世界各地的數據科學家和程序員都可以下載數據,訓練相應的機器學習模型,並把模型給出的預測值上傳到Numerai的網站上。
Numerai會選擇最優秀、最有原創性、最穩定的若干個預測,將其整合為最終的交易策略,並投入到真實的市場中。根據這些預測在現實中的表現,Numerai會給予用戶相應的報酬,以美元和numeraire(一種由Numerai創造的電子密碼貨幣)的形式給出。
Numerai比賽提供的獎金極為豐厚。每個星期,它都會發出總計6000美元的獎勵。(顯然,Numerai公司的盈利遠超於此,簡直是壓榨勞動力。)此外,在傳統的機器學習競賽中,只有前三名的選手才能獲得獎金。而在Numerai中,只要能符合上榜的標準(下文會詳細說明),就有希望獲得或多或少的獎金。
當前,Numerai擁有超過3萬個活躍的數據科學家,遠多於任何其他的對沖基金公司。它已經接收了400多億個來自用戶的預測。
分散式AI
相對於一般的對沖基金公司,Numerai最大的特徵是「去中心化」。
雖然公司的管理人員不超過10人,但是Numerai吸引了來自五湖四海的數萬個用戶。這些用戶可能是數據工程師,也可能是機器學習愛好者——他們都不是Numerai公司的正式僱員。但是,他們可以提供預測,並獲得Numerai的金錢獎勵。最終,Numerai平台將用一種複雜的演算法,綜合考量各個模型的預測,搭建一個元模型,以參與現實世界的金融市場交易。
Numerai的公司成員不需要進行最基礎的建模工作,也可以獲得極其優秀的AI模型。我認為,其創始人最了不起的創新,就是搭建起一個crowdsourcing平台。
在Numerai上,用戶完全匿名。除了一個郵箱、一個昵稱之外,用戶不需要提供任何的個人信息。為了保證匿名情況下的公正交易,Numerai的獎勵都通過電子貨幣ethereum發放。
和另一個較為成功的眾包在線交易平台Quantopian不同,Numerai的用戶擁有自己模型全部的知識產權。我們不需要提供自己的代碼,只需要上傳我們在測試集上做出的預測。
這也意味著,我們訓練模型時,可以調用所有想得到的運算資源,花費任意長短的時間。我們使用的機器學習工具,也不需要受限於python和R這兩種常用的語言。
公開數據,匿名特徵
對於個人而言,及時搜集完整的市場數據耗時耗力,投入大量的資金則更不現實。Numerai幫助用戶克服了這兩個困難:數據的完整度和Numerai公司本身的體量都有充足的保障。
從Numerai網站上下載的數據numerai_datasets.zip包括以下內容:
- example_model.py:基於python的模型範例。閱讀其中的代碼,可以幫助理解提交文件的格式。
- example_model.r:基於R語言的模型範例。
- example_predictions.csv:提交文件的範例。
- numerai_tournament_data.csv:用戶需要預測的比賽數據。
- numerai_training_data.csv:可以用於擬合機器學習模型的訓練數據。訓練數據來自過去,而比賽數據用於未來。
用pandas打開訓練數據,我們可以看到,表格的每一行代表一個訓練樣本,每一列代表樣本的某類信息。
54列可以分為5個部分:
- id:字元串。每一個樣本都擁有一個獨特的id作為標註。試圖反向工程id的編碼是不現實的,而且大概率會導致模型的過擬合。
- era:這個樣本所在的時間區間。隨著era從小到大,我們可以把訓練集看作一個時間序列。一般而言,一個era中大約有3500個樣本。為了削弱過擬合,在交叉驗證選擇模型時,最好的做法不是根據樣本隨機分fold,而是根據era隨機分fold。畢竟,用未來預測過去並不光彩。
- data_type:字元串。數據類型,分為training(訓練集)、validation(驗證集)、test(測試集)以及live(實時預測集)。訓練數據中只包含training,比賽數據中包含validation、test和live。training、validation和test的數據都來自過去,所以它們的target值都是預先存在的。不過,用戶下載的數據里,只有training和validation才會有target。理論上說,用戶只允許使用training的數據。然而,既然validation的target已經給出,大家往往會把training和validation放在一起,作為最終模型的訓練集。
- feature(從feature1到feature50):浮點數。50個特徵。這些特徵都經過匿名化處理,全部為區間[0, 1]之間的實數,沒有缺失值,但也絲毫還原不出原始的金融市場變數。
- target:需要預測的目標,取值僅有0和1兩種。因此,Numerai比賽是一個二分類問題。
能向全世界免費提供大量金融數據,當然是一件好事。不過,為了保證這些數據都會被用於比賽,而不是他人自己的獨立項目,Numerai對所有的數據特徵都進行了加密。加密的過程類似autoencoder,保留了數據結構,但無法反向工程。
排行榜與入選標準
Numerai共有兩個排行榜:普通提交和下注提交。在這一部分,我們先介紹普通提交排行榜的入選標準。
兩個排行榜都會顯示預測的logloss,也就是針對二分類問題的對數損失函數/交叉熵。logloss越低,說明模型的預測力越強。(註:logloss和準確率未必有嚴格的單調關係,但大致呈負相關:logloss越低,準確率一般越高。)
排行榜的logloss由validation部分的數據決定,與test和live的表現無關。所以,在排行榜上排名高,並不代表最終的收入高。
普通排行榜的特點:只要上榜,這個預測就會影響Numerai最終的交易策略,為用戶帶來收入。
不過,進入排行榜並不是一件容易的事,因為用戶提交的預測必須通過三項檢驗:
Concordance(協調性):validation,test和live的預測值必須(看起來)來自於同一個模型。
之前在分析數據的時候提到,用戶可以看到validation的target答案。假如把訓練數據的validation target直接用於提交,理論上說可以達到完全準確的結果。然而,這種接近作弊的行為無法通過concordance檢驗。
Consistency(一致性):在每一個era中,如果用戶提交的預測比隨機亂猜更準確(小於-ln(0.5)),那麼就算是通過了consistency檢驗。最終的consistency分數是:通過consistency檢驗的era數量/總era數。只有分數高於75%的預測才能上榜。
金融應用的機器學習對於損失很敏感,所以我們需要讓模型保持穩定,在每一個時間段內都給出優於隨機亂猜的預測。
Originality(原創性):用戶提交的預測,必須不同於當前比賽中已有的任何預測。「相同」與「不同」的比較方法是柯爾莫諾夫-斯米爾諾夫檢驗。
原創性是令選手們最為怨聲載道的檢驗。我們能想到的最優秀的模型,往往已經被前人捷足先登。此外,由於stacking、bagging和voting等集成方法傾向於給出相似的最終預測,它們的預測往往無法獲得原創性。更糟糕的是,假如你已經提交了一次預測,當你第二次提交同一個預測時,你將無法通過原創性檢驗。
原創性檢驗的存在,一方面阻止了部分用戶註冊多個賬號、提交幾乎完全相同預測,以圖獲利的作弊行為,另一方面避免了Numerai為了同樣的預測,向不同用戶發過多的冤枉錢,同時也鼓勵選手打破思維框架、進行創新。
獲得原創性的方法有很多,例如使用神經網路——神經網路的參數空間極大,variance也很大,通過改變初始的隨機狀態即可得到擁有原創性的模型。
當然,懶惰如我,是肯定不會去苦苦尋找新模型的。針對柯爾莫諾夫-斯米爾諾夫檢驗的一個內在局限性,我發現了一種修改預測值的方法,既能讓任何「不原創」的提交通過原創性檢驗,也不會明顯改變準確率和logloss。寫成python代碼,核心部分只需要一行。我認為分享這種技巧並不是特別合適,不過感興趣的讀者可以自行探索^_^。
Numerai已經在Github上公開了檢驗標準的代碼:numerai/submission-criteria
(未完待續)
numeraire:用下注與自信度對抗過擬合
先貼一個鏈接:https://numer.ai/whitepaper.pdf
未來的發展計劃
κυβερνητικ?? μ?σω των αριθμ?ν
人工智慧最大的應用目前看就是互聯網廣告了,g在16年收入了900億美金大部分都是廣告收入,fb也是靠互聯網廣告的,國內的話baidu啊 weibo啊應該主要收入都來自廣告。
然後比較看好的領域是幾個toB的:
1.智能客服,這個可以節省很多call center的成本,大中型企業應該都需要,這個只要能拿到合同應該都能盈利。
2.cloud AI,在雲上提供AI的api,比如分詞,翻譯,人臉識別等等,這樣很多無力自己做這些hardcore研發的企業會願意花錢在上面,這個未來肯定能大筆賺錢。
3.無人駕駛車隊做物流,高速點對點的幹線物流,加上編隊技術,即省人工又省油。然後大貨司機疲勞駕駛導致的事故會大大減少,對大家都有好處。猜測接下來一兩年應該就能上路了吧。
人工智慧培訓機構
最盈利的是替代生產線工人的機器人,一台24小時工作的不用工資的機器人價值多大知道嗎,需求多大知道嗎,成本是機械手,攝像頭,人工智慧系統。這比自動駕駛市場更廣大。幾億需求,幾十億需求。做出這系統也不需要多高智能,能識別零件和對零件進行操作就行。比自動駕駛更容易實現。
AI+教育(語言學習) 流利說C輪融資背後:實現規模化盈利,啟動企業合作
無窮多的盈利辦法。
這個就類似問蒸汽機出來時如何盈利一樣,計算機出來時如何盈利一樣。
因為這是又一項大面積代替人類工作的工具。人類GDP應該為此增長個好幾倍。
大家現在不盈利的原因是在投入,明知道10年後100倍的收入,誰現在把錢取出來?
短期內的盈利,最簡單模式,賣公司賣人頭。
恐怕再過幾年人們就得問還有什麼是人工智慧賺不了錢的領域了,因為現在來講人工智慧真的是發展的極為迅速,效果極為可怕。簡單舉個例子吧,現在的人工智慧在經過大量數據的訓練之後,在一定的限定條件下,可以做到看你一段說話的視頻,然後生成你說任何話的音頻和視頻,音色、嘴形,面部表情全都能對上,普通人根本分辨不出來。或者生成偽造的用戶評價,什麼「這家的雞肉真的很好吃,醬料也非常贊!我和媽媽來好幾次了,全力推薦!下次還會再來」之類的話換著花樣地給你編,同樣普通人根本分不出來,以後五毛都當不了了,因為機器生成的文字、音頻、視頻與真人的沒有任何區別。這種技術一旦布局起來,真的是隨心所欲,為所欲為。書籍自動轉有聲讀物,自動拍攝電視電影(隨便操縱劇情),自動偽造新聞(而且還是有圖片和視頻證據的那種),煽動民眾輿論走向,自動生成值得付費的內容來賺錢。這一切是全程不需要任何真人參與的,可以通過演算法批量化、高速生產。不用考慮萬一了,因為這種技術現在已經被小規模實現了,趕緊考慮怎麼應對吧。政府應該考慮怎麼立法使其規範化,商家應該考慮怎麼不讓自己的生意一夜之間暴斃,普通人則需要考慮一下怎麼不讓自己被演算法洗腦,因為你再也不知道什麼是真的,什麼是電腦生成的世界了。美國這次大選各種政治廣告能夠做到落實到具體個人偏好的精準投放,就是靠了Facebook等社交平台對每一個用戶的長期數據積累和學習。
參考資料:
AI trained on Yelp data writes fake restaurant reviews 『indistinguishable』 from real deal
http://grail.cs.washington.edu/projects/AudioToObama/siggraph17_obama.pdf
[1703.10593] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
Adobe is working on an audio app that lets you add words someone never said
Amazon Polly – Lifelike Text-to-Speech
人工智慧培訓。
就像當年學好英語能不能一定賺到錢不知道,但英語培訓機構賺到了錢。
身邊也有出國學人工智慧這個專業的,費用很高,國內貌似才起步。
一己之見,AI最開始盈利的領域可能是在教育行業。
視覺圖像方面很多公司已經營收不少,直播時候的特效、美顏,監控視頻中的人數統計,商場中的人臉識別,未來新零售無人售貨,金融服務中的人臉驗證,這些要麼提高體驗,要麼提高效率,要麼提高自動化程度降低人力成本,不管這是不是想像中的AI的未來,這些應用可能看起來很小,但是能創造實際的價值就有人買單。AI並不是非要搞出大新聞才算AI。
Alexa(Echo)這類虛擬個人助理的價值不在於他能讓用戶付錢使用,而是展示了一種場景的可能性:未來是否可以讓虛擬個人助理(搭載在音箱也好、電視也好、網關也好)成為智慧家庭的中樞?Alexa之所以重要並不是因為它能讓Echo賣得更好,亞馬遜從來也不是一個靠硬體賺錢的公司,而是Alexa在未來可以讓用戶更多地在亞馬遜上消費(現在效果還不明顯),並且成為一個控制其他設備和服務的平台。現在體驗不好,只能完成簡單的任務?沒錯,但是這個未來太誘人了,而且很有可能在兩三年內慢慢成為現實,當然會有很多公司心動。
智能客服就是更加直接的邏輯了,使用智能客服的商家最關心的是能不能幫助節省成本(在不太影響體驗的基礎上),假設是一個每天一萬個客服諮詢的公司,就需要一個幾十人的客服團隊,每年幾百萬的成本,如果這一萬個客服諮詢中,有哪怕50%的可以用智能客服就得到滿意的結果,每年就可以節省百萬級的成本。而實際上行業的數據是,智能客服可以攔截掉的客服諮詢遠不止50%。
而自動駕駛技術就更厲害了,簡直是顛覆整個行業的厲害,這種革命性的技術,沒有任何一家汽車行業的公司敢說我遲點再參與,畢竟3-5年對於汽車行業是很短的,已經算是迫在眉睫的事情了,還不到一個新型號的設計生產周期長。
總結一下,AI是賺錢的,並且還有比現在賺錢更重要的價值。
AV,虛擬現實AV、3DAV、根據觀影者所想演繹故事情節的AV,399$一年會員,你要不要嘗試一下?
斯皮爾伯格最近有一部新的電影叫《頭號玩家》,各位可以看看,講的就是用意念操控的虛擬現實。
http://www.1905.com/video/play/1239462.shtml?fromvsogou=1fromMovie=1238662
目測一會要有很多AI公司要來說自己已經盈利了。
樓上的回答都正確。。不過我感覺題主的顧慮在於人工智慧的不可靠性。這個問題可以用一對概念來回答。有一個講座將人工智慧應用分為「關鍵性應用」和「非關鍵性應用」。比如自動駕駛,就是關鍵性應用,一旦不正常可能撞死人。比如醫療圖像理解,遊戲robot機器人,就是非關鍵型應用。醫療圖像理解本身就是給醫生做輔助判斷的,遊戲AI更不用說,打輸了頂多掉個段位。。關鍵型應用的實用我也懷疑,不過那些非關鍵型應用應該會最早盈利吧。
ai參與經濟決策的數據是從現實中收集來的,而現實中的數據是人類相互博弈產生的,如果ai通過這些數據得出的結論導致資產增值,那麼ai就會取代人類做出決策。那麼當大部分數據都是ai相互決策所產生的時候,這時ai到底在分析什麼,會有什麼結果。
有人說快遞分揀么?全天候無休息工作,不用法定節假日,不怕生病虐待員工上新聞,永遠不會鬧脾氣暴力摔件,說一不二
1.實時比較的客觀需求。比如電商之間的折扣,如果你過一天才發現對方價格比你低那你已經損失一大筆交易了
2.人員裁撤帶來的收益,比如現在你在銀行辦事大多可以自助是信息化的,這部分人員就被裁撤了,變成了利潤。舉個圖像識別的例子,銀行有大量手寫單據以前可能需要100a人去錄入數據,拿到一個好的專用系統,現在可能只要a個人就能完成了,這99a的人工成本就是利潤
3.大規模數據下的客觀要求,比如你在某地買房,想要買某一類的商品,給每個商品在上架前打上完全的標籤是不現實的,這個時候人工智慧就可以幫你列出一些類似的出來給你選擇。再比如每天有數不清的人交通違章,以前可能需要人去辨別,現在直接靠ai,那麼可以大範圍減少人力成本
個人碰到的有這些,除此以外應該還有更多。但大致的手段都是取代掉了部分人的工作,人力成本減少了。比如以前可能需要100人的事現在一個人就能做了。這也是我為什麼認為ai絕對不會只是一場泡沫的原因,因為它和虛擬現實之類的技術不同,它替代了工作,提高了生產力。而大幅提高生產力是工業革命技術的特徵,第一次是機械,第二次電力,第三次信息化,第四次估計大概率是ai。能取代人類工作是工業革命生產力發展的最重要的特徵。
幼兒教育,結合最近不斷發生的不合格幼教人員虐童事件。有閑的家人(老人),搭配高質量幼教AI是一個趨勢。
AI外包啊
跟軟體外包一個流程,銷售去調查客戶需求,然後商量一套為客戶解決問題節省成本的ai方案,談好價錢,然後ai民工解決數據,模型和實施部署問題。TO B端的話自然是物流行業啊,京東的無人智能倉庫已經有了雛形了。而且前幾天京東的物流大會也表明了京東已經開始向智能物流進發了,個人認為如果京東這次智能物流做得好,很可能會吸引其他物流公司的效仿。
TO C端自然就是看創意了,現在只要有個好點的創意再加上人工智慧的噓頭,出個TO C端產品小賺一波還是沒什麼問題的。不過目前還很難說,因為就現在的人工智慧技術來說,太過智能的TO C端產品還難以產出,即便產出也會價格偏高。而一般的智能產品則屬於可有可無的地位,所以要等到人工智慧技術真的可以大幅度盈利還需要一段時間。
不是高端老闆層更應該知道這個問題么,有大數據,有錢,有人!
這麼提問,不會有真答案
推薦閱讀:
※可以不用openCV,用C++寫一個簡單的人臉識別程序么?
※你的導師coding能力如何?
※工業相機自動對焦如何實現?機器視覺的自動對焦開發與應用前景如何?
※雙目立體視覺中,標定內外參數後,如何由左攝像機和右攝像機獲取的圖片的某一像素坐標求出世界坐標?
※為什麼視覺搞了這麼多年,標定還是各種問題,3D還是各種不靠譜?
TAG:人工智慧 | 人臉識別 | 計算機視覺 | 自動駕駛 | AmazonEcho |