怎麼設置用戶體驗,才能讓 Siri 成為有效的 Apple TV 操控界面?


我記得那天晚上,在中信的會議室里看《史蒂夫·喬布斯傳》的稿子,說到蘋果正在製造一個電視機(television set)的時候,我就想到了 Siri —— 聽起來是不是像一個十足的傻逼事後諸葛亮?

我還記得我第一次用 Kinect 的時候,對於送的那些遊戲沒有太大興趣,而是一直在 dashboard 裡面看 Kinect 的模擬全息圖像,並且花了不少時間玩弄它的聲控功能。我覺得,這簡直太神奇了,如果蘋果造個電視機,大概也該是這樣的——起碼有個前所未有的遙控輸入界面。

提一個很多人沒注意到的 iPhone 4S 細節:在前面板上方,多了一個紅外線感應器(http://www.ifixit.com/blog/blog/2011/11/09/little-sister-siri/)。因為 Siri 需要知道你在什麼地方,是不是靠近電話,是不是在和它說話。位置感應+語義識別——這像極了 Kinect 。

Siri 一定不會是蘋果電視機的唯一輸入選項。原因很簡單:殘障人士也要看電視。

但僅就 Siri 本身而言,正如它現在的迷人之處一樣——放到電視中,它不能僅僅做語義識別,還應該做到在視頻觀賞環境中的人工智慧。這可能包括下面這些使用情景,也可能根本一條都沒有(反正都是瞎噴,那就瞎到底好了):

- 身份識別:電視是一個公用設備,而非手機那樣只對應一個使用者的產品。所以,誰坐在沙發上,電視機最好能夠識別出來,無論是看臉還是聽聲音,然後進行相關的推薦,以及其他一系列的匹配,比如播放進度。這個很容易實現,起碼 Kinect 已經做到了,而蘋果也收購過相關的公司,而且仍未商用: http://www.slashgear.com/apple-buy-polar-rose-facial-recognition-specialists-ar-recognizr-coming-to-iphone-20103315/ 。

- 環境識別:在 Siri 目前的功能整合里,一個很棒的功能就是配合上 Reminder 的「到達什麼地方提醒做什麼事兒」。如果我能夠在周一早上離開家的時候,說「晚上我回來的之後,開始播放今天的《海濱帝國》」,那就實在太棒了。這隻要識別聲音和光線的變化就可以,賬號綁定和後台下載也不是什麼高科技。

- 內容匹配:簡單來說,可能是類似於 SoundHound 或者 Into_Now 這樣的識別功能,也可能是我躺在沙發上,說我想要看《鋼鐵俠》第二部里羅伯特·唐尼躺在地上被鞭子追著抽的那個章節。這可能才是 Siri 對應到電視機上應該的樣子,而不是我說十遍「快進5分鐘」加上五遍「快進5秒」然後找到某分某秒。

- 功能整合:我說的大概是 Universal Search 之類的功能。Siri 一個很好的地方,就在於把自己變成了一個「門戶」(portal),把各種格式的信息都整合進去,而日後如果開放 API 的話,必然會有更有趣的應用方式。就目前的情況看,如果用到電視上,它應該很智能地通過用戶的指令,來調取所有 iTunes Store 和傳統電視信號中的各種內容。

上面扯的很多夢話,都需要建立在蘋果對自己的內容池進行進一步完善的基礎之上。可能要有能夠媲美 Pandora、SoundHound、Into_Now 的資料庫,才能達到非常完美的效果。

當然,希望到時候蘋果能夠推出一個可靠的 remote 軟體,來控制電視機。或者加入 Kinect 那樣的身體語言識別功能,不然純粹用 Siri ,還是很討厭的一個事情。比如你老婆躺沙發上看《美國往事》睡著了,你還得大喝一聲「Turn the fucking shit off」就實在太不天倫之樂了。

延伸閱讀:Kinect 和 Siri 哪個更牛逼? http://www.zhihu.com/question/19876748


很難哦,假想一下你跟老婆孩子三個人你一言我一語,siri 該聽誰的?如果電視上的人還正在說話的話。。。遙控器本來是一個「令牌」,獲得這個令牌的人有權利控制電視,但語音卻可以所有人同時發出。你甚至無法禁止你的兒子搗亂。

我個人認為只有私人的產品才適合 siri,因為語音識別必定意味著,你必須保持你所在環境的私密性與安靜性。

我用語音輸入很久了,基本上在嘈雜的環境中語音識別類的產品是沒法用的。

我還是一直覺得,隨著科技發展,意念控制可能會是更靠譜的輸入方式。


受邀,但我想說「沒有幫助」的,如果電視沒變成「一塊大屏幕的××」:

留住人類可享用慵懶的的港灣吧!

所以,如果把 Siri 看成人工智慧,未來人們或可以讓其全程監聽,配合其他個人的數據,來維持和保護那個」慵懶的港灣「,比如你坐下沙發,不需要說什麼做什麼,Apple TV 自動以一個愜意的過程讓你進入最佳狀態,比如精力還旺盛,就馬上調出喜歡的電視劇。

其他類推,一切為「慵懶」服務。


為Siri配備合成語音(最好是甜美女聲),而非僅僅將」對話「顯示在屏幕上——這一點非常重要,昭示Siri的存在感,讓人感覺它更接近一個獨立的人格。

For example,

「Siri, has the new episode of The Walking Dead been online now?"

"Yes, master. Do you want me to play it now?"

"Yes please."

」Subtitle please, Siri."

(字幕顯示,Siri在播放中保持靜默)

「Pause, Pause, 吾戳那, 只胖子哪能死脫額啦, 么看清爽, 倒回去倒回去……「

」Sorry, master. English please."

"Backward for 10 seconds!"

……

差不多類似於這樣,將遙控器使用減至最低限度。還要能分辨不同人的聲音特徵吧,不然我老婆跟我搗亂,我要看《行屍走肉》,她要看《法證先鋒》怎麼辦?好吧,這個要求似乎有些高……

另外,千萬不要用iPhone做遙控器,那樣就太傻逼了!!!!!!!!

BTW,我覺得Siri這個名字好獃,如果能自己起名字就好了。

最後,來說說為什麼用iPhone做遙控器是個壞主意,並不是因為我沒有iPhone哦,而是因為iPhone上的那個Siri可以做「陪看」嘛,很多片子,一個人看總是沒兩個「人」看那樣有趣的。至於我說的話到底是對哪個Siri說的——我都說了要給它們起不同的名字了!


我覺得簡單的聲控似乎意義沒那麼大

Siri 擅長的是理解你想要什麼

並給出恰當的推薦

聽聽李菁、何雲偉相聲《西餐廳點餐故事》

http://v.youku.com/v_playlist/f3701765o1p90.html

就知道哪種體驗是 Siri 需要避免的了


個人還是很期待這個在家庭中的「大屏幕」的。

和@馬力的看法類似,純粹的聲控沒有什麼意義。並且對於調整音量這種頻繁精確的任務,聲控的效率遠遠比不上遙控器。重要是在TV上可以整合多少信息。

例如以下一系列場景:

Annie正在收拾後天出差的行李,找不到她白色的外套。

她問:「Siri,我和乾洗店有預約嗎?」。

「是的,您預約了明天下午3點的會面。」

應該是送去乾洗了還沒拿回來,算了,先搞定其他事情吧。

「Siri,幫我查一下後天去上海的機票。」

「11月13日,從深圳到上海,我找到12架航班。」

Annie瀏覽了一下航班信息,決定中午出發。

「訂購MU53234次航班。」

「請在您的iPhone上輸入密碼確認。」

Annie的手機出現一個密碼盤,她在上面輸入身份驗證密碼。(手機會成為身份標識)

「OK,已經預訂。」

稍後,簡訊聲音響起,SIri說:「您收到一條簡訊,來自10898660332。」

「讀出來。」

「您在XXXX訂購的航班已經成功,客票號XXXXX,起飛時間11月13日12點45分......您需要我為您設置一個提醒嗎?」

「OK...............呃,Siri,再給A Project發一封郵件。」

「請講....我在聽...」

「標題:Annie 11日出差上海,不在公司,有事請電聯。」

「內容呢?」

「直接發送。」

「郵件已發出。」

正事處理完了,幹嘛好呢?

「Siri,《猩球崛起》上映了嗎?」

「我找到3條正在上映的《猩球崛起》。」 Annie瀏覽了一下,選擇了Youku的片源,才5塊錢。

這個片子不錯,剛看了20分鐘,突然頂部滾動出一條信息。

「Annie,你訂閱的《步步驚心》將在5分鐘後開始。」

嗷,真鬱悶,Annie想。她抬頭看了下鍾,現在8點半,9點半她還可以繼續她的電影。

「切換到電視。」

電視中打開了「電視」APP,接入了6頻道。

一個悠閑的晚上。


這種關於未來的問題,答起來最有意思:

1、不用專業知識,不必費勁查資料

2、不用負責任,apple沒有實現這些功能,可不能怪我

關於APPLE TV的地位和Siri的整合,分開了談:

apple TV未來就是家庭的媒體中心,一個家庭中與媒體相關的系統,包括:

1、多個媒體源:

1.1、家庭電腦、移動硬碟、NAS或IP SAN上存儲的節目源

1.2、存儲在icloud上的節目源

1.3、其他網路節目提供商的節目源

1.4、有線電視供應商提供的節目源

1.5、家庭內部及外部的攝像頭(包括手機、IPAD上的攝像頭)

2、展示終端(包含展示、存儲等操作)

2.1、家庭的多部電視屏幕

2.2、家庭電腦的屏幕

2.3、移動終端的屏幕(手機、IPAD)

2.4、家庭其他屏幕(冰箱、桌面、鏡子,參見http://v.youku.com/v_show/id_XMjQ2MTk3MzQ0.html)

2.5、家庭其他媒體終端(背景音樂西系統、功放)

2.6、外部的其他屏幕(工作電腦、包括大屏幕廣告牌嗎?。。。。。。)

2.7、家庭存儲設備

2.8、圖像分析終端

3、動作

遙控器上的複雜按鈕,比播放、查找、快進、回退、暫停、加大音量、縮小音量、色調調整等等。。。。。。。

apple TV和Siri的整合,指令模式就是

「節目源」+「動作」+「終端」

這樣最接近用戶的實際思維指令方式。比如:

  • 把硬碟上的「3D玉蒲團」送到卧室的液晶屏上

  • 把youku的「艷照門」送到浴室鏡子,同時存儲在移動硬碟上
  • 把卧室的攝像頭視頻送到客廳
  • 訂閱icloud中的某日本文藝動作片,快進到RGB(251.225.159)面積超過70%的地方,慢速播放,放大其中RGB(77.56.3)的區域

等等等等


遙控器上有個按鍵,點擊一下就開啟電視上的Siri,直接說自己想看什麼頻道,想看什麼內容,直接說電視劇名稱,直接說電影名稱,


如果你連接到電視的存儲設備中就有這些電視劇電影,siri會直接打開它們,如果存儲設備中沒有,會給出列表,顯示正在播放這些節目的頻道,你再選一個,如果都沒有,會自動連接網路,找到資源下載並播放


再點擊一下那個按鍵,關閉Siri


同時亦可直接聲控開啟Siri,設定只有家裡人的聲音可以開啟,開啟咒語自定義,比如:芝麻開門。然後Siri就出來了:您想看什麼?


遙控器開啟和控制與聲控兩種方式可能會並存,用戶應該也有不想說話安靜操作的需求,尤其晚上。

其實可以用iphone當遙控器,而且這是必然的,如果有單獨的遙控器,iphone也得能當遙控器用。


所有的需求,只需要給 apple remote 一個小麥克風就可以實現了。而iPhone,iPad,iPod touch,本來就已經是一個帶有麥克風的 apple remote 了... so,你懂的

PS. Apple TV 不只是用來看電視的...


我覺得以上各位所言都牽涉到人工智慧的問題。在這方面沒有重大突破以前,個人覺得也只能單純做為INTERNET TV/或者一個操作終端出現。


受邀回答。

如果考慮交互瓶頸是人,人不可能長時間無負擔地和 Siri 交談或者發出指令,那麼 Siri 作為「有效」的電視操控界面無疑是痴人說夢。


其實Siri的角色是作為人機交互的一個介面,讓人類和機器能夠方便的溝通。讓機器能夠聽明白人類的語言,同時令機器能夠分析出這些語言和行為的內在聯繫。

至於Apple TV,應該是作為機器的一個很小的子類存在,而且適合其機器類相互協調工作的。

P.S:之前聽一個朋友說,下一個科技熱門不是什麼移動互聯網、NFC這些,而是機器人時代。我想補充下,是具有人工智慧的機器人。


現在已經實現了


推薦閱讀:

Cortana 可以怎麼玩?
Siri 可以通過圖靈測試嗎?
iPhone 4S 發售至今,Siri 現在在美國人生活中扮演的角色重要嗎?
據傳下個月 Siri 將推出中文版,你怎麼看?是否看好 Siri 中文的市場?會去購買嗎?

TAG:蘋果公司AppleInc | AppleTV | Siri |