邊緣人工智能的夢想與挑戰(zhàn)
在本文中,我們主要探討兩個主要問題,即在“小型機(jī)器”中實(shí)現(xiàn)人工智能的理由,以及開發(fā)人工智能小型機(jī)器將面臨哪些挑戰(zhàn)?
未來,在人工智能方面,我們應(yīng)該有飛行汽車和機(jī)器人管家。甚至還可能遇到有感知能力的機(jī)器人決定起來反抗我們。雖然我們還沒有發(fā)展到這種程度,但顯然人工智能(AI)技術(shù)已經(jīng)進(jìn)入了我們的世界。
每次當(dāng)我們讓智能語音助手做一件事是,機(jī)器學(xué)習(xí)技術(shù)就會先搞明白你說了什么,并試圖對你想讓它做什么做出最好的決定。例如,每次視頻網(wǎng)站或電商平臺向你推薦“你可能喜歡的電影”或“你可能需要的商品”時,它都是基于復(fù)雜的機(jī)器學(xué)習(xí)算法,盡可能地向你提供具有說服力的建議,這顯然比過去的促銷活動更有吸引力。
雖然我們可能不是所有人都有自動駕駛汽車,但我們敏銳地意識到這一領(lǐng)域的發(fā)展以及自動導(dǎo)航提供的潛力。
人工智能技術(shù)承載著一個偉大的希望——機(jī)器可以根據(jù)周圍的世界做出決定,像人類一樣處理信息,甚至以一種優(yōu)于人類的方式。但如果我們考慮一下上面的例子,就會發(fā)現(xiàn)只有“大型機(jī)器”才能實(shí)現(xiàn)人工智能的承諾,這些設(shè)備往往沒有功率、尺寸或成本的限制?;蛘邠Q句話說,它們會發(fā)熱,有線路供電,體積很大,而且很昂貴。例如,Alexa 和 Netflix 這些全球領(lǐng)先的IT巨頭企業(yè)依靠云中的大型耗電服務(wù)器(數(shù)據(jù)中心)來推斷用戶的意圖。
雖然自動駕駛汽車很可能依賴電池,但考慮到這些電池必須轉(zhuǎn)動車輪和轉(zhuǎn)向,它們的能量容量是巨大的。與最昂貴的人工智能決策相比,它們是巨大的能源支出。
因此,盡管人工智能前景廣闊,但“小機(jī)器”卻被拋在了后面 。由較小電池供電或具有成本和尺寸限制的設(shè)備無法參與機(jī)器可以看到和聽到的想法。今天,這些小機(jī)器只能利用簡單的人工智能技術(shù),也許是聽一個關(guān)鍵詞,或者從心率分析低維信號,如光電體積描記術(shù) (PPG)。
如果小機(jī)器能看能聽會怎樣?
但是,小型機(jī)器能夠看到和聽到是否有價(jià)值?可能很多人很難想象像門鈴攝像頭這樣利用自動駕駛或自然語言處理等技術(shù)的小設(shè)備。盡管如此,諸如詞匯識別、語音識別和圖像分析之類的不太復(fù)雜、處理密集程度較低的 AI 計(jì)算仍然存在機(jī)會:
-
門鈴攝像頭和消費(fèi)級安全攝像頭通常會觸發(fā)一些無趣的事件,例如風(fēng)引起的植物運(yùn)動、云引起的劇烈光線變化,甚至是狗或貓?jiān)阽R頭前面動等事件。這可能導(dǎo)致錯誤警報(bào)觸發(fā),導(dǎo)致房主開始忽略掉一些重要事件。因?yàn)?,房主可能在世界不同的地方旅行,也可能正在睡覺,而他們的安全攝像機(jī)卻對日出、云和日落引起的照明變化頻繁發(fā)出警報(bào)。而更智能的攝像機(jī)則可以更加精準(zhǔn)是識別物體變化,如人體的輪廓,進(jìn)而避免誤報(bào)干擾。
-
門鎖或其他接入點(diǎn)可以使用面部識別甚至語音識別來驗(yàn)證人員訪問權(quán)限,在很多情況下無需鑰匙或IC卡。
-
許多攝像頭希望在某些事件上觸發(fā):例如,跟蹤攝像頭可能希望在畫面中出現(xiàn)某一種動物時觸發(fā),安全攝像頭可能希望在畫面中出現(xiàn)人或開門或腳步聲等噪音時觸發(fā),并且有些攝像機(jī)可能想要通過語音命令觸發(fā)等等。
-
大詞匯量命令在許多應(yīng)用中都很有用。雖然有很多類似 “Hey Alexa”、“Hey Siri” 解決方案,但如果開始考慮 20 個或更多單詞的詞匯,則可以在工業(yè)設(shè)備、家庭自動化、烹飪用具和許多其他設(shè)備中找到用于簡化人機(jī)交互的用途。
這些例子只是表面上的。讓小型機(jī)器看到、聽到和解決以前需要人工干預(yù)的問題的想法是一個強(qiáng)大的想法,我們每天都在繼續(xù)尋找創(chuàng)造性的新用例。
讓小型機(jī)器能看和聽的挑戰(zhàn)是什么?
那么,如果人工智能對小型機(jī)器如此有價(jià)值,為什么我們還沒有廣泛應(yīng)用呢?答案是計(jì)算能力。人工智能推理是神經(jīng)網(wǎng)絡(luò)模型計(jì)算的結(jié)果。把神經(jīng)網(wǎng)絡(luò)模型想象成你的大腦如何處理圖片或聲音的一個粗略的近似,把它分解成非常小的片段,然后當(dāng)這些小片段組合在一起時識別出模式。
現(xiàn)代視覺問題的主力模型是卷積神經(jīng)網(wǎng)絡(luò) (CNN)。這些模型在圖像分析方面非常出色,在音頻分析中也非常有用。挑戰(zhàn)在于此類模型需要數(shù)百萬或數(shù)十億次數(shù)學(xué)計(jì)算。傳統(tǒng)上,這些應(yīng)用很難選擇實(shí)施:
-
使用廉價(jià)且低功耗的微控制器解決方案。雖然平均功耗可能很低,但 CNN 可能需要幾秒鐘的時間來計(jì)算,這意味著 AI 推理不是實(shí)時的,因此會消耗大量電池電量。
-
購買可以在所需延遲內(nèi)完成這些數(shù)學(xué)運(yùn)算的昂貴且高性能的處理器。這些處理器通常很大,需要大量外部組件,包括散熱器或類似的冷卻組件。但是,它們執(zhí)行 AI 推理的速度非??臁?
-
無法實(shí)施。低功耗微控制器解決方案將太慢而無法使用,而高性能處理器方法將打破成本、尺寸和功率預(yù)算。
我們需要的是一種嵌入式的人工智能解決方案,從頭開始構(gòu)建,以最大限度地減少CNN計(jì)算的能源消耗。與傳統(tǒng)的微控制器或處理器解決方案相比,AI推斷需要在一個數(shù)量級上執(zhí)行,并且不需要內(nèi)存等外部組件的幫助,這些外部組件會消耗能量、體積和成本。
如果人工智能推理解決方案可以消除機(jī)器視覺的能量損失,那么即使是最小的設(shè)備也可以看到并識別周圍世界發(fā)生的事情。
幸運(yùn)的是,我們正處于這場“小機(jī)器”革命的開端?,F(xiàn)在的產(chǎn)品幾乎可以消除人工智能推斷的能源成本,并實(shí)現(xiàn)電池驅(qū)動的機(jī)器視覺。例如,一個微控制器可用于執(zhí)行 AI 推理,同時僅消耗微焦耳的能量。