交通銀行新推出的「交交」智能機器人,按照目前的機器人水平能達到嗎?

今天微博上,「交交」機器人一下子就火了,好多人說是有人在後台控制,最多算個變聲電話機,但網上的報道說這是開發出來的,我個人覺得這個真的很萌很智能,請問國內機器人水平來看,這個到底是能夠開發出來,還是真的是人工在控制?

(第一次提問……不太清楚規矩……是不是該放個視頻?……)

秒拍視頻

額,在網上報道的新聞,字裡行間的意思都是說開發出的是個人工智慧機器人的樣子啊……什麼語音識別面部識別縮短交互時間神馬的……難道是騙人的?

捷通靈雲智能機器人「交交」全面入駐交通銀行服務大廳


今天簡單了回答了一下這個問題,原答案已經放在了分隔線以下,其中包括對其中幾個答主的評論,不得不認真的來回答一下這個問題,否則你們這幫妖孽也太小看知乎用戶的水平了吧?

視頻看過幾遍,總體上來說這個機器人視頻的宣傳目的達到了,並且做的很不錯,在不懂得人眼裡一定覺得這玩意很高大上,科技發達balabalabla

但這裡面一堆帶著參數,帶著公司名字帶著褒獎的回復的確讓我覺得這幫人有點侮辱人的智商的意思,要知道知乎里是有可能有各方面的專才的,水軍在知乎不是沒有,但我想發揮的效能可不一定是好的,比如前幾天那個什麼遊俠汽車就被乾的一塌糊塗,今天你們要是想來干這個,我就打算跟你們說道說到了!!

「並且憑藉靈雲平台強大的多能力融合和大數據處理能力,整合了包括語音識別、語音合成和自然語言理解技術甚至圖像、人臉和聲紋等多項頂尖人工智慧技術」

該機器人有這些能力我是沒辦法否認的,但是我從視頻中除了語音合成能力其他的能力根本感覺不到,因為整個流程都是由人與人進行溝通的。之所以下這個結論,那麼聽我慢慢道來

第一點,尋找銷售經理的這一點上,首先機器人如何定位客戶經理的位置的?從我已知的技術上無法理解這個問題,首先計算機先要知道誰是客戶經理,客戶經理在哪裡,我該如何去找她,我該怎樣判斷客戶經理現在是不是方便接待這位客戶,這三個問題僅靠這台機器人理論上是無法完成的。

問題一:

誰是客戶經理

首先,誰是客戶經理,這個地方個人認為按照那些答案里的回答,需要用人臉識別,聲紋識別方式來確認,但這兩項技術的實際使用要求都非常高,而且有距離的限制,我做過聲紋識別的測試,也是某銀行的項目,下載已經在部分分行進行推廣,被用作加強密碼的一個補充保護。下面說說測試結果,通過電話連接伺服器,使用移動,聯通,電信三種不同制式的網路連接被測設備,因數據傳輸模式和音頻效果不同,同一個人是用其他制式的網路進行測試,是無法通過聲紋驗證的,如果降低準確率又會造成被識別成其他人。同時,大廳環境的影響,距離的影響導致機器人通過聲紋識別的方式尋找客戶經理的位置是不可能的,其次呢,人臉識別,這項技術相對成熟一些,但實際應用過程中也對使用者有很多十分重要的要求,同樣的,在距離相對較遠時無法通過人臉識別系統區分被識別者身份。

問題二:

客戶經理在哪裡,

室內定位系統?GPS系統?跟這幫人的討論中,我看到有人提到機器人是科沃斯出品的,正巧我家有兩台科沃斯的機器人,一台掃地機器人,一台擦玻璃機器人,擦玻璃的不提了,根本不會自己充電,掃地機器人是可以自己找到自己的充電器的位置的,這個技術說白了十分簡單,科沃斯機器人的充電底座上有一個360度照射的紅外led,簡單來說就是遙控器上那個led燈管,當機器人電量低以後會在室內關閉清掃功能,繼續隨機搜尋紅外信號,直到發現目標後向目標方向前進或因為電量低而自己歇了。這種低科技含量的技術我實在無法想像機器人用了這種方式尋找客戶經理,如果是真的的話,其實有一種可行性,就是每個不同角色的銀行職員身上都安裝上隨時閃爍的標識,機器人通過紅外攝像機確認特定標識再去找,但這種情況會遇到一個問題:就是標識的可識別性,如果標識只是客戶經理胸前的一個工牌,那麼當客戶經理背對著機器人或者被遮擋的時候,機器人無法找到相應的標識,另一種方案效果會好很多,每個員工帶一個帽子,上面支一根天線,在頂端發射紅外信號,這樣辨識度就可以提高很多,不過估計這幫桂圓姑娘們沒人願意都變裝成天線寶寶吧?那麼GPS定位系統?每個員工身上都揣著一個GPS模塊,這個可能性不是沒有,但室內定位的精準度大家是有目共睹的,顯然這個機器人是沒有使用這項技術的,下面最有可能的就是室內定位技術,通過多wifi使用多點定位法,確認某設備在房間內的位置,但這項技術目前好像只有蘋果在玩吧?而且該技術就不僅僅是這個機器人的技術了,需要對整個網點進行重新改造才可以實現,並且客制化每個不同網點的地形給每台不同的機器人,恐怕這個成本不會比請幾個臨時工來的低。但目前這個是未來最可行的辦法。然並卵,這機器人沒用這個功能。

問題三:

機器人如何識別客戶經理是不是在忙?

說實話,我除了想到客戶經理拿一個遙控器對著機器人按一下「我在忙」的按鈕,我想不到什麼方式能在不打斷客戶經理工作的情況下,快速的告知機器人滾蛋,去找別人,因為光靠剛才上面說的技術,計算機恐怕還沒辦法理解人正在做什麼事情。

以上是對該機器人不合理的地方的一個方面進行的思考

下面一點來說說語音識別,自然語言分析這兩個方面來思考一下其不可行性

語音識別領域裡 siri、小娜、微信恐怕是大家最熟知的三款產品了,在啟動以後都需要較短時間的識別翻譯,但視頻中的機器人,不但快速的理解了客戶所說的話,而且極快速的就做出了合理的反饋,回想起之前那個笑話,對著Siri說我要吃屎,大家看看Siri如何回答的。如果說全球最好的品牌做的語音識別技術和自然語言分析技術都只能到那個水平,這個產品現在的黑科技足夠領先世界起碼5年了吧?最重要的是不僅識別速度快,其對話語的理解能力簡直超越了目前搜索引擎的識別效率~!

包括我之前說過,在它轉身的時候,卡了一下,然後這玩意居然說,哎呀,卡住啦什麼的,這種話,技術上可以實現我確信,但中國有一家公司能做到這個地步,抱歉,我不信。

所以說這個機器人富含各類高科技,我相信,但整個視頻中對其所描述的高科技的使用我只感受到了人聲模擬技術。其他的在我看來無非就是遠程真人與客戶之間進行視頻對話,僅此而已

我對這個小東西真的挺感興趣的,其實也只是打算調侃一下就完了,沒想到這麼多文宣跑到知乎來開始把這種產品描述成全自動化高精尖人工智慧產品,我就有點煩了,而且一來來一大幫,我就無奈了。歡迎來反駁我,我就在銀行上班,也是搞過軟硬體的,自己寫過軟體,做過硬體,不服來辯!

————————————————————我是分割線———————————————————

這玩意我簡單來說吧,從轉身的時候一句,哎呀,卡住啦就能判斷出這不是人工智慧的產物,理論上應該是一個遙控機器人,實時音視頻傳輸,同時可以移動,僅此而已,做宣傳不錯,做事就算

複製一個在別的答案下的評論

(作者) 回復 張嘉樂

卡住了那個我在展會現場看過,的確會說卡住了,當時的情況是它卡住了,然後會說類似「我暫時響應不過來,給我點時間」之類的話,但是是很機械的話語,利用機器內部感測器來反應是可以的,存疑的點是它的反應能不能做到那麼快,一半機器人都有一點點延遲。

我進入了他們的靈雲官網去了解,發現他們的識別服務有一個身份識別功能:「通過人臉識別、聲紋識別等方式辨識交互人的身份」,它對客戶的記憶是較為短暫的,但是估計員工是有一定檔案錄入的,比如我只需要認識大堂經理是個姐姐……

從我來看這也不算是人工智慧,更多應該是一種交互方式,將回復的延遲時間盡量縮短,同時將語音配得更有個性一點,符合機器人的形象及氣質,回復也是在詞庫裡面編寫好的,具有一些大家可能會問到的問題,檢測關鍵詞來回應。

你可以看看國外的BUDDY機器人,PEPPER機器人,它們的交互情況也很理想。

16:06

張嘉樂 回復 (作者)

設備報錯「暫時響應不過來」我信,感測器控制說「哎呀卡住了」技術上可以實現我也知道,但是結合當時的視頻,整套問答皆屬於人工智慧我真不信了,視頻里設備對答如流,回憶現在的siri和微信的語音識別系統反饋時間也一般吧?再回到人臉識別這個問題上,技術上可以實現我也知道,但實現的方式絕不是像現在一樣高效快速的,未來十年內技術可以達到這個水平是我堅信的,但現在他的反饋速度之快,無論是語音識別,人臉識別的準確性,再回到換表情這個部分,他的反饋是極其人性化的,不僅如此,再換表情的時候速度慢了,他自己還會給自己找話題,你說這是人工智慧,就逗我了吧?

20:26

張嘉樂 回復 何門恩(作者)

看到你對人臉識別這部分作出了回應,那麼就說說聲紋識別和人臉識別這部分,當時機器人找人的時候很果斷的180度轉身去找人,正巧那個人就在它身後?它的尋人技術如何實現?身後還有攝像頭?聲紋識別的項目我做過測試,在安靜的環境下識別率都有限,通過電話網路傳輸的音頻都會因為不同制式的網路而發生無法識別的情況,那麼如果是本地識別就是在本機里對被識別對象進行數據存儲,也就是說客戶經理要預先錄製音頻和視頻,回過頭來看,即使這兩點都已經解決了技術難題並做到了現在的地步,也會造成過多的誤判,識別率的閾值設定會很複雜,重點就是這麼多技術難關他都處理好了?我才不信

20:34

顧劍 回復 張嘉樂

找人那個應該能做到,掃地機器人都能回去充電了,大堂經理身上帶個東西應該就行?這個機器人實際使用的範圍就是銀行大堂,輔助進行身份識別的設備應該很多,比如攝像頭和刷卡叫號機等等,交行環境也相對安靜些。就是不知道有沒有搞過這些輔助設施,看其他答案好像沒特別做過,人工輔助的可能就比較大了。不過就算是個遠程的大堂輔助也挺好,銀行vtm不也是在做么,這個至少還萌,滿足需求的就是好技術。

21:08

張嘉樂 回復 顧劍

我加油科沃斯的機器人,回去充電是依靠紅外光.....用這個找人簡直就是開玩笑....

21:28

顧劍 回復 張嘉樂

所以還有說輔助措施,利用攝像頭之類。其實是想起了之前設計的一個銀行大堂方案,類似谷歌眼鏡給大堂經理用,叫號機識別身份,攝像頭判斷位置,然後大堂經理看每個人都能看出來戰鬥力。。啊資產凈值。。。最後問題太多主要是投入產出比不高所以就沒搞

21:35

張嘉樂 回復 顧劍

計算機識別的方式咱們來討論一下,無非就是各種感測器,那麼光學感測器是應用的最多的,另一個能夠像這種定位準確的就是gps定位,咱們先來說gps的室內定位效果,可以說很差,機器人通過gps定位方式定位銷售經理的可能性基本可以排除,下面是光學定位,科沃斯機器人的底座上有一個360度照射的紅外led,簡單來說就是遙控器上那個led燈管,當機器人電量低以後會在室內關閉清掃功能,繼續隨機搜尋紅外信號,直到發現目標後向目標方向前進,但紅外信號在大廳內會受到嚴重地干擾,而且要想區分大堂人員的身份就需要在每一個工作人員的身上安裝不同的標誌,而且還得是裹一圈,不然特定角度機器人就找不到了,而且我剛才說了機器人是直接回身就找到人的,這不符合我剛才說的尋找半天才找到的情況,通過攝像頭掃描二維碼標識也是很好的辦法,但同樣遇到超過一定距離就無法識別二維碼,只能通過近距離識別身份,大堂範圍內找人是不能通過二維碼實現的,rfid也是一樣的是識別方式而不是定址方式,人臉識別一樣無法完成這個功能

21:46

張嘉樂 回復 顧劍

現在建行的平板電腦有這個功能,但還是要靠人來識別,平板上會顯示客戶的照片,但Google眼鏡就開玩笑點了,識別的依據都沒有...總不能每個客戶都進行面部分析吧修改

還是那句話,我不信現在能有人工智慧機器人在移動過程中遇到問題會說出那句,哎呀卡住啦,說白了遠程遙控的機器人而已,跟你小時候玩的玩具汽車沒什麼區別,別的高科技技術沒看到,就視頻里那段沒什麼技術含量


達不到,我看過那個視頻,語音識別能力遠超Siri和Cortana,如果真的能做到對答如流,那應該早就通過了圖靈測試,還沒做成機器人的時候就已經是個大新聞了。


這台機器人是科沃斯的,經過我的嚴刑拷打,科沃斯那邊研發損友們終於承認是有人在後台操作的,這些傢伙只是玩了一把營銷,不過確實玩的不錯,雖然無節操!肯定不是研發部門的人的主意,我們都是踏實苦幹的獃頭鵝

所以我還是匿名吧!


不看回復的內容,只聽音頻就可以初步判斷不是合成的聲音,為什麼?

1. 目前我見識過的中文語音合成水平最高的就是cortana(可能我見識少),遠遠沒達到視頻里的水平。

2. 視頻中機器人聲音是童聲(?其實聽起來很像是變聲軟體的聲音),合成如此流暢的童聲得需要多少訓練數據~語音的訓練數據多費力才能得到一小時可用的!


語音識別如此流暢,一看就知道是人為操作的。。。所以答案是,目前水平達不到。

語義分析和語音合成水平應該可以達到。

真相:ECOVACS Robotics Co., Ltd. 簡單翻譯一下:有一個人工客服在遠端通過這個機器人的麥克風和音響,在和你愉快地聊天。


一看這麼多名詞堆身上,一定是假的。


百度有個人工智慧的科學家,多呆百度快兩年了吧,多沒有開發出像樣的對話機器人,這東西不太可信!還上電視台忽悠主持人!


去看了一下後台公司的官網,產品可以實現部分智能功能,但是和宣傳的那個小機器人天壤之別,宣傳的那個實際是人遠程控制的。

機器人本身的水平不會超過現有語音識別技術的平均水平


絕B不是電腦自己生成的對話。。。。那個語言韻律就不是電腦合成得來的,而且語音識別的速度未免也太快了!甚至它說話的時候人再跟它講話,它都能正確識別然後給出回應。這個就是人工的智能,不是人工智慧。


推薦閱讀:

為什麼網易新聞做了一個上滑關閉的交互?
交互設計領域的扁平化設計,還會持續火熱嗎?
像 Jony Ive 這樣負責工業設計和人機交互軟體界面的設計師還有哪些?
微軟在語音翻譯領域處於什麼水平?目前最高水平的語音翻譯能達到什麼程度?
為了參與 Microsoft HoloLens 這樣的項目需要對哪些學術領域的知識有所了解?

TAG:機器人 | 人工智慧 | 人機交互 | 智能機器人 |