微軟發(fā)布Bot開發(fā)框架,用人工智能對話平臺豪賭未來
在談到 Tay 時(shí),Satya Nadella 對彭博新聞的記者坦言:「我嚇壞了以至于不敢問它任何事情,因?yàn)檎l知道它會(huì)說些什么呢?我甚至可能理解不了。」他笑著說。
但他真的不使用 Tay,他說自己更喜歡更有企業(yè)風(fēng)范的 Bot。在北京時(shí)間今天凌晨的主題演講中, Nadella 告訴場下以及全球的開發(fā)者們:「我們正在汲取人類語言中的強(qiáng)大能量,并將其廣泛的運(yùn)用到電腦中去,我們認(rèn)為這將產(chǎn)生重大影響,就像圖形用戶界面首次出現(xiàn)在桌面電腦或觸屏首次出現(xiàn)在智能手機(jī)上一樣。」
Nadella 演講
「我們致力于將最好的技術(shù)應(yīng)用在產(chǎn)品中,就在上周,當(dāng)我們發(fā)布 Tay 時(shí),我們很快意識到這并未達(dá)到這個(gè)要求。」現(xiàn)場發(fā)出一陣笑聲,不過 Nadella 繼續(xù)嚴(yán)肅的說:「所以,所以我們要回去重頭做起?!?
Nadella 將其定義為「對話平臺」。微軟展示了 Bot 的多種應(yīng)用場景,比如你可以使用文本與 Bot 對話,如 Tay;而更豐富應(yīng)用則是則寄托于開發(fā)者們,比如當(dāng)你使用Skype 時(shí),會(huì)有 Bot 「主動(dòng)」為你規(guī)劃旅行路線或預(yù)定房間,抑或是盲人或視覺障礙者使用手機(jī)攝像頭調(diào)取 Bot 出來,從而幫助這些人「看見」別人的表情或圖書的內(nèi)容。
所有 Bot 的開發(fā)工具和模版——Microsoft Bot Framework 都可以免費(fèi)下載。開發(fā)人員可利用它將各種智能對話機(jī)器人集成到自己的應(yīng)用中。微軟已經(jīng)開發(fā)出6種工具幫助程序員創(chuàng)建機(jī)器人,微軟不僅希望程序員能夠快速上手,按照 Nadella 的想法,他還要三明治店、干洗店、汽車公司乃至無編程基礎(chǔ)的普通用戶都能開發(fā)一款屬于自己的 Bot。
微軟為何開始鐘情 Bot ?
Satya Nadella 兩年前成為微軟歷史上第三位 CEO,在微軟錯(cuò)失移動(dòng)互聯(lián)網(wǎng)的背景下,Satya Nadella 一上任就提出了「云優(yōu)先、移動(dòng)優(yōu)先」的口號,大力推進(jìn)以 Azure 為核心的云計(jì)算業(yè)務(wù),成績斐然。在2016 年 1 月底的微軟第二財(cái)季財(cái)報(bào)中,微軟云服務(wù)(Azure+office365)收入增長 5%,達(dá)到 63 億美元,占到微軟第二財(cái)季總營收的 26%(總營收為 238 億美元)。如果考慮到微軟在 2010 年才開始發(fā)展云計(jì)算業(yè)務(wù),這也就意味著,在 Satya Nadella 轉(zhuǎn)型理念的推動(dòng)下,微軟的云計(jì)算營收已經(jīng)支撐起了整個(gè)公司四分之一的營收。
說起微軟在移動(dòng)尤其是手機(jī)領(lǐng)域的辛酸歷史,Satya Nadella 有自己的一番看法,「人們自然而然的以為:『因?yàn)槟銢]在手機(jī)應(yīng)用商店中撈到甜頭。』」手機(jī)的應(yīng)用程序當(dāng)然很適合查看某項(xiàng)服務(wù),但在搜集、重組、優(yōu)化并以自然的交互方式與用戶互動(dòng)方面,Bot 的作用更重要。如果你想查看你的預(yù)算開支情況,你需要打開(記賬)的 App、等待你就加載出來所有的消費(fèi)和收入。而通過一個(gè)基于某個(gè)聊天應(yīng)用中的財(cái)務(wù) Bot,你可能只需要一句話就能返回自己想要的結(jié)果。是不是很酷炫?
Nadella 從去年十月份才開始計(jì)劃微軟的戰(zhàn)略轉(zhuǎn)移,這也是他就任 CEO 以來,第一個(gè)真正屬于自己的戰(zhàn)略思考。
在從硅谷返回西雅圖的兩小時(shí)航班上,他與負(fù)責(zé)必應(yīng)、Skype 、 Office 等應(yīng)用和服務(wù)的陸奇和搜索工程部門副總裁 Derrick Connell 進(jìn)行了會(huì)談。陸奇拿出自己的筆記本電腦,向 Nadella 展示了一些自己正在開發(fā)的人工智能的想法。他描述了一遍背后的科學(xué)原理,Nadella 問這對微軟的產(chǎn)品意味著什么。Connell 則向他展示了用人工智能強(qiáng)化過的新版本的 Outlook 電子郵件程序和 Skype。到飛機(jī)降落的時(shí)候,Nadella 決定,這就是微軟的轉(zhuǎn)型方向。
在早前的幾個(gè)月,陸奇在中國期間與中國的學(xué)生和客戶進(jìn)行了深入交流,并實(shí)地了解到他們使用智能手機(jī)的方式。最讓他印象深刻的是中國人使用微信的方式。微信從一個(gè)最簡單的聊天應(yīng)用,成長為一個(gè)類似操作系統(tǒng)的產(chǎn)品——用戶可以用微信預(yù)訂酒店、信用卡賬單分期、預(yù)約醫(yī)生、購買電影票以及在線購物。當(dāng)越來越多的公司開始使用微信銷售自己的產(chǎn)品時(shí),它們雇傭人類閱讀用戶發(fā)來的聊天信息,并積極回復(fù)從而完成銷售。
發(fā)信息「我想要兩張周五晚上的《死侍》的電影票。」陸奇說,然后你就能收到一張帶有時(shí)間和座位選擇的交互圖像,接下來,你只需要簡單地點(diǎn)擊購買,你就得到了一段取票的文本信息。然后你就可以去影院消費(fèi)了,而且這樣操作的也不只是年輕人,陸奇表示,他 80 歲的母親也生活在「微信」中,這位住在上海的老人不信任網(wǎng)站,但她會(huì)在微信上購物和叫出租車。這些對話 Bot 的力量「有些已被微信發(fā)明出來,但現(xiàn)在 Facebook 看到這一點(diǎn),很多公司都在打造類似的體驗(yàn)。」陸奇補(bǔ)充道,「我認(rèn)為微軟會(huì)扮演一個(gè)領(lǐng)導(dǎo)者的角色?!?br />
對話式的 bot 并非新鮮事物。第一個(gè)對話式的 Bot 可以回溯到早期的計(jì)算時(shí)代。MIT 研究員 Joseph Weizenbaum 在 1960 年代寫出了一個(gè)名叫 ELIZA 的 Bot。90年代后期在互聯(lián)網(wǎng)里為搜索引擎搜索網(wǎng)頁索引的爬蟲也是一種 Bot 。
Clippy
微軟在90年代也曾嘗試用 Bot 提高用戶交互體驗(yàn),其中一個(gè)便是類似大眼夾(Clippy)的 Office助手,但這個(gè) Bot 很傻,它不知道何時(shí)出現(xiàn),很多時(shí)候都是默認(rèn)出現(xiàn),也不會(huì)提出真正有用的建議,這個(gè)號稱基于貝葉斯算法的 Bot 幾乎毫無用處。
這一次,微軟要給自己的 Bot 來點(diǎn)不一樣的。
人工智能驅(qū)動(dòng)的 Bot
正如陸奇所言,幾乎所有的大公司都將對話 Bot 作為重要的產(chǎn)品,而人工智能成為其背后強(qiáng)大的推動(dòng)力。過去幾年,人工智能已經(jīng)成為硅谷新的風(fēng)向標(biāo)。根據(jù)CB insight的統(tǒng)計(jì),2015年,基于人工智能的創(chuàng)業(yè)公司共完成3億美金的融資,而在五年前的2010年,人工智能公司的融資總額只有4500萬美元。
以 Facebook 秘密開發(fā)的「M」為例,這是一個(gè)基于Facebook 聊天應(yīng)用 Messager 里的對話 Bot,它可以幫你搜索、預(yù)訂機(jī)票、遞送免費(fèi)咖啡、寫歌、甚至畫畫。當(dāng)你和它聊天時(shí),「M 」會(huì)通過自動(dòng)化、深度學(xué)習(xí)、人工智能相結(jié)合的技術(shù)架構(gòu),并結(jié)合人類「教練」的建議,從而完成在海量數(shù)據(jù)的挖掘整理,快速回復(fù)。
Facebook M
而在微軟今天發(fā)布的「對話平臺(Conversations as a Platform)」,微軟希望將人工智能更靈活、更自然地融入到用戶的對話里。
第一,將 Cortana 作為交互 的核心。當(dāng)開發(fā)者在Skype 上開發(fā)一款 Bot,微軟 Cortana 則可以從旁協(xié)助,甚至直接和機(jī) Bot 進(jìn)行溝通,讓使用體驗(yàn)更順暢。比如用戶在為下一次的假期訂機(jī)票旅館時(shí),Cortana 就可以適時(shí)地介入,從你過去的旅游經(jīng)歷、甚至是之前的聊天內(nèi)容中,提供建議。
第二,HoloLens 開發(fā)者版本發(fā)售。微軟不僅在新版本 Skype 里增加了視頻通話功能,還將支持 HoloLens。作為目前唯一不需要外部攝像頭、線纜、手機(jī),也不需要連接PC,就可以提供自然全息計(jì)算的設(shè)備,Hololens 開發(fā)者版本的發(fā)售將給微軟的 Bot 帶來更多驚喜,這意味著用戶可以在任何地點(diǎn)啟動(dòng)對話,并通過 Cortana 獲取幫助或建議。比如日本航空正在開發(fā)一款HoloLens 應(yīng)用,其想象力空間非常大。
點(diǎn)擊查看原視頻鏈接
第三,推出HoloLens 模擬器。與 Hololens 開發(fā)者版本發(fā)售的同時(shí),微軟還悄悄推出 HoloLens 模擬器,幫助沒有買到 Hololens 的開發(fā)者開發(fā)相關(guān)應(yīng)用。利用 Hyper-V 虛擬機(jī)器,開發(fā)者同時(shí)使用微軟的 Visual Studio 開發(fā)工具就能做出類似于 HoloLens 上的功能。不再是依靠眼鏡的環(huán)境輸入,模擬器使用鍵盤和鼠標(biāo)(或者Xbox控制器)進(jìn)行控制,得到的回應(yīng)和在 HoloLens 上操作一樣。進(jìn)行控制時(shí)就像你打游戲,使用鍵盤的 WASD 按鍵進(jìn)行移動(dòng)控制,移動(dòng)鼠標(biāo)調(diào)節(jié)攝像頭。如果你打算開發(fā)全息應(yīng)用,HoloToolkit on GitHub上提供很多腳本和組件,能夠加快開發(fā)進(jìn)度。
第四,開放更多認(rèn)知技術(shù)。此次大會(huì)上,微軟更新了一組機(jī)器學(xué)習(xí)工具,這些認(rèn)知服務(wù)工具包共包含22項(xiàng) API。其中的臉部識別程序也是去年朋友圈刷屏的「How old do you look」的基礎(chǔ)技術(shù),也包括去年11月推出的可偵測面部情感的API,還包括語音識別以及智能自定義識別API等等。開發(fā)者可以隨時(shí)調(diào)用這些 API,將其加入到自己的 Bot 中。
第五,更簡單的 Bot 開發(fā)工具。Nadella 告訴彭博新聞?dòng)浾?,「這(Bot 開發(fā)工具)幾乎是我見過的最簡單的一段代碼?!挂晃晃④浌こ處煷蜷_ Bot 基礎(chǔ)模版,接著他添加了幾行代碼,從而讓 Bot 和 Domino 披薩店的點(diǎn)單系統(tǒng)連接起來,并設(shè)置了幾個(gè)選項(xiàng),諸如披薩的尺寸和配料,然后這個(gè) Bot 就完成了。試想一下,如果你在路上與朋友們用 Skype 聊天,而且每個(gè)人都想吃披薩,你就可以在不離開 Skype 的情況下快速預(yù)定披薩。
就在當(dāng)天會(huì)議的最后,微軟展示正在處在研發(fā)階段的人工智能項(xiàng)目「Seeing AI」,利用計(jì)算機(jī)視覺和自然語言處理技術(shù),通過這款下載在智能手機(jī)以及微軟合作的Pivothead 智能眼鏡的應(yīng)用,盲人可以「看到」和「了解」他眼前的世界。視頻中,當(dāng)盲人工程師薩科戴上 Pivothead 智能眼鏡時(shí),滑動(dòng)鏡腿就可以拍下眼前看到的景象,而 Seeing AI 則可以幫助薩科識別出景象,并通過語音告訴薩科眼前是什么,例如「一位男人在玩滑板,一個(gè)小女孩在公園扔飛盤」。當(dāng)薩科在與人會(huì)談時(shí),滑動(dòng)鏡腿拍照,「Seeing AI」還可以識別出面前坐客的年齡、性別以及情緒,讓他可以向普通人一樣參與到真正的對話當(dāng)中。當(dāng)薩科在餐館點(diǎn)菜時(shí),他可以拿出下載Seeing AI的智能手機(jī),在人工智能的語音提示幫助下找到并對著菜單拍照,而Seeing AI可以自動(dòng)讀出菜單,幫助他選擇自己想點(diǎn)的美食。
點(diǎn)擊查看原視頻鏈接
對微軟來說,在錯(cuò)過移動(dòng)互聯(lián)網(wǎng)浪潮之后,這一次的轉(zhuǎn)型對公司的未來至關(guān)重要。而從此次大會(huì)第一天所發(fā)布的產(chǎn)品和技術(shù)來說,微軟已經(jīng)邁出了堅(jiān)實(shí)的第一步,那么接下來呢?Nadella 比任何人都清楚實(shí)現(xiàn)這一目標(biāo)有多么困難。可能還會(huì)有更多 Tay (不完美的產(chǎn)品)。彭博新聞?dòng)浾哂涗浺粋€(gè)細(xì)節(jié):他靠在椅子上對自己的管理團(tuán)隊(duì)微笑道:「這很困難,對吧?」