【中國安防展覽網 焦點新聞】近日,海康威視研究院預研團隊基于深度學習技術研發的OCR(Optical Character Recognition,圖像中文字識別)技術在ICDARRobust Reading競賽數據集的“互聯網圖像文字”、“對焦自然場景文字”和“隨拍自然場景文字”三項文字識別(Word Recognition)挑戰任務中,大幅超越國內外強勁參賽團隊,并刷新大賽記錄的消息備受關注。
作為2016年為火熱的技術之一,深度學習在語音、圖像、自然語言處理等領域取得了非常突出的成果,包括Google、Facebook、微軟、百度在內的各大技術巨頭都在不遺余力地推進深度學習的研發和應用。2017年深度學習的勢頭依舊迅猛,并以更快的速度滲透在各個行業當中,對世界產生深遠影響。深度學習不但使得機器學習能夠實現眾多的應用,而且拓展了人工智能的領域范圍,并使得機器輔助功能都變為可能。其應用領域也加速滲透到越來越多領域,催生了深度學習與其它應用技術的加速融合。
安防領域基于大數據、人工智能的圖像識別算法是深度學習技術應用的主要滲透領域之一。目前,深度學習技術在安防領域的應用集中在人臉識別、車牌識別、視頻分析等幾個領域。
人臉識別
其實在安防領域的人臉識別還沒有達到理想的效果,其原因主要是視頻中的人臉往往處在一種非常復雜的狀態,光照、姿態、表情、飾物、分辨率等都影響著人臉識別算法,已有的訓練算法,或者說已有的訓練數據無法調整出一個具有很強泛化能力的算法模型,人臉識別需要更豐富的樣本數據,深度學習模型也還需要進一步優化。
日前,國內安防巨頭大華股份人臉識別團隊向人臉識別公開測試集LFW提交了測試結果,大華股份人臉識別率繼續Google、Facebook、百度、騰訊,排名,大華股份人臉識別技術團隊設計了一個上百層的深度網絡(目前已公開的人臉識別網絡中深的模型),提出了一種新的度量學習方法,可以使得同一人之間的相似度盡量高,同時約束不同人之間的相似度足夠低,在訓練時,結合一種的在線采樣技術,可以極大地加快收斂速度。而且應用在2016年的G20峰會保障中,抓獲了一些在逃人員。
在深度學習的加持下,人臉識別算法已經達到了它的鼎盛時期,識別準確率甚至超過了人眼。此外,格靈深瞳的一款新型攝像機——深瞳人眼攝像機識別準確率也創下了新高。這款攝像機它采用格靈深瞳的像素動態瞬時分配技術,可以瞬間將局部畫面的有效像素提升百倍以上,整體畫面可以達到數億等效像素,50米內展現清晰的可識別人臉,100米內看清全身特征。而且在前端嵌入了深度智能的芯片,使用深度智能的算法可以快速鎖定目標位置。
車牌識別
作為智能交通的一個典型應用,車輛特征識別一直是安防廠商重點關注的技術領域。目前很多廠商都宣稱自己的車牌識別率已經達到了99%,但這也只是在標準卡口的視頻條件下再加上一些預設條件來達到的。在針對很多簡易卡口和卡口圖片進行車牌定位識別時,較好的車牌識別也很難達到90%。此外,早期的車輛特征通常為車牌號碼和車身顏色等,前幾年各大廠商也推出了產能對車牌號碼和車身顏色進行準確識別的產品,但對于車輛品牌和車型系列這些更加復雜的信息特征,并沒有很好的識別手段。近兩年,深度學習技術興起,很多廠商利用大規模的數據集訓練取得了實質性進展。目前行業水平已經可以達到上千種車系和上百種車標的識別,識別的準確率也已達到實用程度。今后,智能交通設備所能提取的車輛特征將更加豐富,將有助于提升業務部門的工作效率,推動智能交通行業的發展。
同時,在車輛檢索方面,車輛的圖片在不同場景下會出現曝光過度或者曝光不足,或者車輛的尺度發生很大變化,導致傳統方法提取的特征會發生變化,因此檢索率很不穩定。深度學習能夠很好地獲取較為較穩定的特征,搜索的相似目標更,Top5的搜索率在95%以上。在人臉識別項目中,由于光線、姿態和表情等因素引起人臉變化,目前很多應用都是固定場景、固定姿態,采用深度學習算法后,不僅固定場景的人臉識別率從89%提升到99%,而且對姿態和光線也有了一定的放松。
智能視頻監控
其實不管是人臉識別還是車牌識別,都是基于視頻監控的智能深化分析。安防行業普遍的應用也是視頻監控。隨著智能化安防的發展,深度學習技術可謂安防行業的“顛覆性力量”。隨著深度學習算法的突破,目標識別、物體檢測、場景分割、人物和車輛屬性分析等智能分析技術,取得了突破性進展。較之以往的傳統智能算法,深度學習在解決視頻結構化問題方面更“智能”。
2016年,安博會前夕,海康威視攜手業務合作伙伴NVIDIA、Movidius,發布基于深度學習技術的從前端到后端全系列智能安防產品。海康威視發布的“深眸”系列專業智能攝像機依托強大的多引擎硬件平臺,內嵌專為視頻監控場景設計優化的深度學習算法,具備了比人腦更的安防大數據歸納能力,實現了在各種復雜環境下人、車、物的多重特征信息提取和事件檢測。
宇視科技在2016年10月23日舉行的安防機器視覺戰略發布會上也披露,公司在芯片、算法、架構、產品四大層面取得機器視覺的全面突破。其中,宇視與Movidius深入合作發布了基于Myriad2芯片的全系中攝像機、卡口抓拍機與智慧棒產品。Myriad2是目前基于深度學習算法的低功耗芯片,可用于前端人臉識別與視頻特性行為的深度結構化。
深度學習還有很多應用場景,只要涉及到目標檢測、目標識別的地方,理論上都可以應用深度學習來解決。就像百度科學家吳恩達在一些報告中提到的,深度學習可以取代現有的很多特征提取、目標檢測技術。在未來,深度學習技術將與安防應用碰撞出更多的火花。