”見微”工業(yè)視覺智能孵化器
分享人:汪彪 高級算法專家,達摩院工業(yè)視覺智能團隊負責人
正文:
本篇內(nèi)容將通過三個部分來介紹”見微”工業(yè)視覺智能孵化器。
一、工業(yè)視覺概覽
二、”見微”工業(yè)視覺智能產(chǎn)品介紹
三、”見微”工業(yè)視覺智能產(chǎn)品實例
一、工業(yè)視覺概覽
很多同學可能都有一個英雄夢,那怎么樣成為一個英雄呢?在中國古代的三國志里面有一個英雄人物叫呂布。有一個關(guān)鍵詞叫公馬嫻熟,膂力過人。意思就是說,一個普通人能夠熟練地使用弓,必須經(jīng)過大量的技能的訓練。弩的出現(xiàn)改變了這一切,弩是讓普通人不經(jīng)過任何訓練,就能夠熟練掌握的一種武器。從這小故事,大家可以看到,武器技術(shù)的進化這,讓普通人成為戰(zhàn)士的門檻逐漸的降低。
我們團隊在2017年就開始介入整個工業(yè)視覺智能領(lǐng)域,并一直堅持到現(xiàn)在。對一些復雜的場景提供多模型組合的能力,除了公共云產(chǎn)品,我們還有有很多線下的獨立訓練。讓普通工程師,成為專業(yè)工業(yè)視覺AI應用開發(fā)專家的門檻逐漸降低。
我們來看一下,將為平臺產(chǎn)品需要解決的問題,以及技術(shù)核心的落地案例。在所有的行業(yè)里,包括光伏,冶金,化工,汽車。我們的定位在視覺缺陷質(zhì)檢領(lǐng)域。從價值的區(qū)分程度上來看,有四個重要目標。第一個,幫助客戶降低成本。第二個,增加效率。第三個,提升產(chǎn)品品質(zhì)。第四,幫助客戶實現(xiàn)柔性定制。
在工業(yè)視覺領(lǐng)域,我們面臨著非常多的挑戰(zhàn)。由于工藝,原材料,管理原因的不同,我們很難得到一樣的產(chǎn)品。很多人都采用定制化的方法來解決,工業(yè)視覺AI的解決方案。比如設(shè)備定制化的算法。
采用定制化的方法解決工業(yè)視覺的需求,有三大挑戰(zhàn)。分別是:數(shù)據(jù)挑戰(zhàn),AI模型訓練,挑戰(zhàn)以及AI模型部屬的挑戰(zhàn)。
每個行業(yè)的數(shù)據(jù)和場景非常多。它的標注成本非常高。同時,在工業(yè)視覺里對應的瑕疵異常,它的類別分布非常不均。
AI模型訓練同樣有三個挑戰(zhàn)。第一個,深度學習模型的人才要求非常高。相關(guān)報告顯示,當前工業(yè)視覺領(lǐng)域的從業(yè)人員,碩士及以上的人員占比接近70%。第二個,整個工業(yè)AI視覺,對算法的調(diào)優(yōu)要求非常高。第三個,在深度學習模型的訓練部署中,依賴很高的算力,訓練部署成本都非常高。
AI模型部署,同樣有三大挑戰(zhàn)。第一個,它的運行部署環(huán)境多樣。包括GPU,NPU。第二個,客戶對最終的部署成本非常敏感。第三個,整個應用場景的模型迭代非常頻繁,模型迭代更新的要求非常高。
在數(shù)據(jù)AI模型的訓練和部署的挑戰(zhàn),是我們解決工業(yè)定制化痛點的關(guān)鍵。我們把以上的六個流程逐進行拆解。每一個環(huán)節(jié)進行算法的創(chuàng)新剖析。最終形成了好用的工具化產(chǎn)品。
第一環(huán)節(jié),我們需要一個樣本標注管理,以及訓練集,測試集的劃分。同時,我們在模型管理方面,基于達摩院的能力,我們在鋼鐵,光伏行業(yè)提供了一些技術(shù)模型定制。對于檢測,分割,分類我們也提供了比較好的基礎(chǔ)模型。第二,我們用可視化的方式,提供了一系列數(shù)據(jù)管理的工具。利用這個工具幫助大家進行自動的樣本的清洗訓練和數(shù)據(jù)集的劃分。第三,針對工業(yè)樣本標注成本比較高,樣本較少的特點。我們提供了八種標注工具。以線帶面,從而實現(xiàn)標注效率的提升。
對于AI模型訓練來講,我們提供了一個月訓練模型,進一步用可視化的界面,允許開發(fā)者用低代碼的方式來實現(xiàn)模型的更新。同時在訓練過程中,針對樣本不均的問題。我們提供了自動樣本均衡的一些策略,來幫助大家得到更高精度的模型。
對于模型測試來講,我們以報表和報告的方式,讓開發(fā)者夠基于我們的平臺,對當前訓練模型的性能進行評估。最后,針對多個不同的應用場景。我們提供了一系列的部署工具。包括API服務(wù),私有化的SDK邊緣端定制以及在線調(diào)優(yōu)和迭代。
二、”見微”工業(yè)視覺智能產(chǎn)品介紹
我們在制造的過程中,針對工業(yè)視覺AI的需求,我們的產(chǎn)品主要包括數(shù)據(jù)標注,模型訓練,模型部署三個步驟。同時,提供缺陷檢測品的分類以及工業(yè)巡檢的API能力。我們希望這產(chǎn)品,能夠幫助大家在工業(yè)視覺AI的需求里洞見先機。同時做到無微不至的服務(wù)。
該平臺主要有三個特點,概括為簡單,便捷,可進化。從業(yè)務(wù)的視角,我們對整個流程進行劃分,提供較好的數(shù)據(jù)管理導入工具。同時提供一系列的能力,幫助客戶針對特定場景AI模型更好的訓練。最后,針對比較分散的部署環(huán)境要求。我們提供了多平臺部署的能力。我們的AI平臺,提供了一系列的智能標注,界面化的操作以及代碼操作。幫助客戶便捷地開發(fā)對應場景的AI能力。最后,這個平臺可以在運行過程中,基于已經(jīng)訓練的模型和運行過程中出現(xiàn)的新瑕疵,來進行模型的迭代和更新。
“見微”只需要通過簡單的六步,就能實現(xiàn)工業(yè)視覺AI能力的定制開發(fā)。第一個,找到對應客戶的這技術(shù)指標。第二,根據(jù)技術(shù)指標要來確定軟硬件一體化的方案。并在對對應的生產(chǎn)線上采集數(shù)據(jù)。第三,利用“見微”針對已經(jīng)采集的數(shù)據(jù),進行樣本標注。第四,利用“見微”進行模型訓練。第五,通過“見微”提供的工具,用可視化的方式判斷當前模型,能否滿足特定場景的新要求。第六,把視覺模型部署到對應的硬件環(huán)境。從而得到對應的工業(yè)視覺AI應用系統(tǒng)。
“見微”的核心技術(shù),只有三點。第一點是智能標注,第二點是半監(jiān)督學習,第三點是小樣本學習。這三個點都是解決工業(yè)視覺AI里特定的技術(shù)難點。比如工業(yè)視覺AI樣本的標注,它的難度和成本都非常高。針對這一點,我們提供了迭代標注,智慧標注方式。從而有效地降低數(shù)據(jù)成本。第二個是,半監(jiān)督學習。在工業(yè)場景里的難點是樣本非常少。這種情況下,我們希望通過有限的標注樣本,加上大量的無標注樣本,進行聯(lián)合訓練。第三個是,小樣本學習。在當前的工業(yè)場景下,良品率都較高,所以收集樣本進行訓練是非常困難的。做到了它山之石可以攻玉。
三、”見微”工業(yè)視覺智能產(chǎn)品實例
工業(yè)視覺AI開發(fā)的效率提升具體從五個方面進行介紹。第一,在利用“見微”平臺時,通過半監(jiān)督學習和樣本增廣,使標注效率提升20倍以。第二,通過困難樣本挖掘和AI輔助標注,把所需的樣本數(shù)降低到原來的25%。進一步的利用,我們的訓練效率可以提升80倍,對應AI模型的調(diào)試陣容的成本可以提升40倍。最后,部署效率提升大概60倍。
我們在廢鋼領(lǐng)域,利用我們的教學平臺落地的實際案例。廢鋼已經(jīng)成為煉鋼過程中,降低能耗和成本,優(yōu)化煉鋼產(chǎn)能的重要原料。現(xiàn)在目前使用的廢鋼種類比較多,如果沒有準確的等級劃分的話,光靠肉眼是區(qū)的偏差就很大。在達摩院工業(yè)視覺智能產(chǎn)品的幫助下,實現(xiàn)了在鋼鐵生產(chǎn)過程中,原材料質(zhì)檢環(huán)節(jié)的重大突破?,F(xiàn)在冀南鋼鐵實現(xiàn)了不受環(huán)境因素及個人主觀因素干擾的高精度,高效率自動幫助企業(yè)節(jié)省不必要開支。隨著我國鋼鐵行業(yè)的發(fā)展,廢鋼這一鋼鐵生產(chǎn)的關(guān)鍵要素,通過智能定級與煉鋼過程的標準化和智能化完成了完美對接。我相信廢鋼智能定級能為鋼鐵行業(yè)帶來持久而深遠的價值。
“見微”。除了公共云版本,獨立訓練版本之外,我們會和特定的合作伙伴,針對一些場景開發(fā)我集成組合辦。這是一個具體案例,“見微”聯(lián)合他們自己的上位機和最終的部署環(huán)境,開發(fā)了一個針對特定場景的缺陷檢測系統(tǒng)。上圖是總的架構(gòu)圖。
這是針對這個鋁扁管的缺陷設(shè)計的應用系統(tǒng)。它的缺陷檢測精度達到了98%。最終實現(xiàn)了,相同系統(tǒng)的國產(chǎn)化替代。
最后是對未來的展望,“見微”平臺針對工業(yè)碎片化場景,開發(fā)的低代碼,可配置的型產(chǎn)品。機器視覺產(chǎn)業(yè)聯(lián)盟組織了很多的工業(yè)企業(yè)一起為工業(yè)視覺智能提供綜合的解決方案。很多高校都設(shè)立人工智能專業(yè),來彌補當前行業(yè)AI人才的缺口。我們一定能夠?qū)崿F(xiàn)工業(yè)視覺AI的繁榮。