隨著全國各地平安城市建設進程的加快,城市中建設的視頻監(jiān)控攝像頭數(shù)量呈指數(shù)級別持續(xù)快速增加,北京、上海兩市的攝像機數(shù)量均已經(jīng)超過100萬級,深圳市的攝像頭分布密度均更是達到了每平方公里205個,大量的攝像機對城市的各個角落、各條道路都進行了實時的視頻采集。由此帶來兩方面的挑戰(zhàn),首先,傳統(tǒng)的采用“人盯屏”的方式進行人海監(jiān)控戰(zhàn)術,將會耗費大量的人力物力且效率低下;其次,每路高清攝像機每個月存儲的視頻數(shù)據(jù)已達PB級,快速搜索某時間或某些特征的視頻段時,這個看似簡單的想法,操作起來卻猶如大海撈針。
視頻數(shù)據(jù)記錄的主要是一系列像素的數(shù)字化信息,包含亮度、色度、飽和度等信息,是基于非語義化內(nèi)容的數(shù)據(jù),雖然信息量非常龐大,但是計算機無法理解其包含的內(nèi)容和所表達的語義。公安案件偵查過程中,能夠獲取到的線索信息往往都是碎片化、不完整的,例如需要檢索案件現(xiàn)場周圍多個攝像頭相關的視頻數(shù)據(jù)中出現(xiàn)的一位穿紅上衣、黑褲子的中年男子,或者要檢索經(jīng)過某十字路口車牌號碼為58結尾的黑色奧迪車等等,遇到這些場景,如果采用傳統(tǒng)的回看錄像的方式,耗時費力。有沒有一種類似谷歌或百度搜索引擎的技術,可以通過輸入文本化的信息作為條件,就可以對海量的視頻內(nèi)容進行快速檢索,方便案件偵查人員快速獲取視圖情報?基于圖像智能分析技術的積累,視頻結構化技術應運而生。
基于視頻結構化技術建立公安圖偵大數(shù)據(jù)
“視頻結構化”其實就是一種視頻內(nèi)容信息提取的技術,通過該技術可以在堆積如山的海量視頻中,就像搜索引擎一樣直接輸入人、車、物的特征信息就能在7×24小時錄像里面搜索到符合這個特征的目標和與之對應的所有視頻,突破視頻大數(shù)據(jù)應用的瓶頸。從技術上來講,視頻結構化描述技術是對視頻內(nèi)容按語義關系,采用時空分割、特征提取、目標識別等手段,按標準將視頻內(nèi)容組織成可供計算機和人理解的文本信息的技術。通過該技術,系統(tǒng)可以從海量數(shù)據(jù)中對視頻多媒體數(shù)據(jù)進行結構化處理,提取視頻圖像中運動的人、車、物和空間坐標以及靜態(tài)背景等信息,并通過視頻結構化大數(shù)據(jù)分析平臺進行分析、比對、碰撞,提煉更有價值的視頻信息或者情報。
要實現(xiàn)視頻大數(shù)據(jù)應用,就必須為視頻圖像中的目標和事件貼上屬性的語義化標簽,也就是視頻結構化描述的過程。視頻結構化描述技術是高清視頻監(jiān)控系統(tǒng)的發(fā)展方向,其核心是智能視頻分析算法,做到自動把視頻中的特征提取出來并貼上標簽后入庫,大量的標簽信息記錄存儲下來后,形成可語義化檢索的視頻大數(shù)據(jù)。只要這樣,才能實現(xiàn)海量視頻的快速查詢和碰撞研判。結合大數(shù)據(jù)檢索數(shù)據(jù),更可以實現(xiàn)十億級數(shù)據(jù)的秒級響應,可大大提升公安有案件偵查過程中檢索視頻資源的效率。
高新興視頻結構化大數(shù)據(jù)分析業(yè)務流程
分析視頻中的運動目標并進行“智能標簽”
視頻大數(shù)據(jù)的搜索與挖掘以人們關注的視頻內(nèi)容為主。但是,傳統(tǒng)的視頻監(jiān)控內(nèi)容除了時間和空間的屬性外,并沒有其他的標簽。視頻監(jiān)控圖像從數(shù)據(jù)到信息,結構化是關鍵,須為視頻圖像中關注的信息(人、車、物、事件等)貼上智能標簽。一張普通的圖片,不同的人能夠不同的角度可以獲取到不同的信息,因此如何按照標準、從最少的維度通過計算機去描述該畫面,將非結構化的圖像數(shù)據(jù)轉(zhuǎn)變?yōu)榻Y構化的信息是至關重要的。視頻目標的標簽越準確,檢索則越準確;反之,視頻目標的標簽失準,定位就越模糊,甚至無法定位。
為了解決視頻圖像中運動目標的結構化描述,高新興采用計算機視覺、深度學習技術,將場景中背景和目標分離,按標準實現(xiàn)視頻圖像的摘要、分析、識別、處理、比對等智能應用功能,實現(xiàn)視頻內(nèi)容特征的自動理解、智能識別和自動定位,并對異常行為視頻自動預警、將視頻非結構化數(shù)據(jù)進行結構化描述存儲,提高視頻系統(tǒng)應用效能。
高新興視頻結構化的信息提取技術
高新興視頻監(jiān)控運動目標結構化描述主要應用的技術如下:
1.人員的特征提取與識別
a)人臉檢測與識別
基于各種場景的監(jiān)控視頻圖像,從實時視頻中檢測并識別人臉信息,將人臉特征按標準提取并存儲到人臉特征庫中,并將抓拍到的人臉信息與選定的人臉庫中的特征庫實時比對,找出人員信息。
b)行人檢測與特征識別
在實時視頻中,對監(jiān)控環(huán)境進行行人目標的檢測,并根據(jù)圖像序列數(shù)據(jù)按標準提取分析出行人的性別、年齡段屬性、衣著顏色等特征信息。
2.車輛特征提取與識別
針對交通管理的海量數(shù)據(jù)處理需求,智能交通系統(tǒng)除了實現(xiàn)大量抓拍圖片、車輛數(shù)據(jù)、視頻數(shù)據(jù)的實時傳輸和快速存儲,還需要將各類多媒體數(shù)據(jù)和車輛特征信息合二為一,從而實現(xiàn)對目標車輛進行多條件檢索定位,并進行比對報警。為了實現(xiàn)交通監(jiān)控領域的大數(shù)據(jù)分析和處理,需要通過視頻內(nèi)容進行智能分析,記錄車牌、車身顏色、車型、車標、方向、駕駛人員照片以及駕駛人員是否系安全帶、打電話等安全駕駛信息。
a)車輛檢測
對視頻攝像頭監(jiān)控道路范圍內(nèi)的過往車輛進行實時檢測與跟蹤,并自動抓拍、記錄車輛的特征圖像、過往時間、車速等信息。
b)車牌識別
基于視頻圖像的車牌識別技術,主要就是應用計算機視覺技術和模式識別技術,對視頻圖像中存在的車牌進行自動車牌定位、分割字符、提取特征,并最后識別出車牌號碼的技術。車牌識別技術的核心包括車牌定位算法、字符分割算法和字符識別算法等部分。
c)車身顏色識別
基于視頻圖像的車身顏色識別,就是對檢測到的車輛圖像進行定位、抽取出車身的區(qū)域,并進行顏色分析和判斷識別。車身顏色識別包含對汽車車身位置的定位、視頻圖像的亮度分析、顏色校正和判斷識別等處理。
d)車型識別
車型識別主要是根據(jù)車牌檢測與識別結果,分析車輛的大小、輪廓特征等信息,從而判斷出車輛的類型信息。
e)車標識別
車標識別就是在車牌定位的基礎上,檢測定位出車標的圖像區(qū)域,并提取圖像區(qū)域的形狀、大小尺寸等信息,從而分析識別出汽車的廠家類型信息。
f)駕駛人員信息提取
針對交通監(jiān)控系統(tǒng)進行二次結構化,處理采集的圖片,從圖片中提取出駕駛人員的照片或者根據(jù)顏色、紋理等特征記錄駕駛人員是否系安全帶等。
3.事件結構化
視頻分析能夠發(fā)現(xiàn)監(jiān)控區(qū)域中運動的物體,并對這些目標進行記錄。除此之外,還可以根據(jù)實際應用需求,對視頻圖像中異常行為或者特定行為進行事件的結構化。
行為分析類:異常奔跑、滯留徘徊、激烈運動、人群聚集、物品丟失以及物品遺留等異常事件。
周界防范類:單向跨線、雙向跨線、翻越欄桿、進出禁區(qū)、區(qū)域內(nèi)出現(xiàn)以及區(qū)域內(nèi)消失等事件。
4.視頻大數(shù)據(jù)的快速檢索與匹配
視頻大數(shù)據(jù)搜索是針對視頻圖像中所有已經(jīng)進行結構化描述的目標或者事件信息進行全文檢索,將目標出現(xiàn)的時間、地點(背景信息)以及目標特征作為條件對目標進行查找。通過查詢結果可快速了解目標的相關信息,并且回溯原始視頻進行查看。
對人員檢索,除了“人”這個關鍵索引之外,還可以檢索衣服、褲子顏色,性別、年齡、膚色、體型高矮胖瘦等特征屬性。人員檢索如圖所示:
基于人員特征的人員快速匹配
對于車輛檢索,除了車輛目標出現(xiàn)的時間以及地點信息以外,車輛檢索條件還包括:車牌號碼、車牌類型、車牌顏色、車輛類型、車輛品牌、車身顏色、運動方向、駕駛人員照片、駕駛行為(是否違章)等。車輛檢索如圖所示:
基于車輛特征的車輛快速匹配
通過分布式搜索引擎,打破傳統(tǒng)數(shù)據(jù)庫在大數(shù)據(jù)條件下查詢速度的瓶頸,可支持10億級過車數(shù)據(jù)秒級快速查詢,提高監(jiān)看人員從視頻中提取線索和證據(jù)的效率和精度。
大數(shù)據(jù)分析、云計算保駕護航
為了支撐爆炸性增長的各類安防監(jiān)控數(shù)據(jù)的管理與應用,運用云計算技術、分布式計算技術、數(shù)據(jù)倉庫技術、數(shù)據(jù)交換技術、數(shù)據(jù)挖掘技術以及各種非結構化數(shù)據(jù)處理技術進行視頻大數(shù)據(jù)的處理和分析,在此基礎上提供適合視頻大數(shù)據(jù)搜索、挖掘和管理服務,海量視頻數(shù)據(jù)的檢索不再是大海撈針。
基于視頻結構化技術,通過視頻內(nèi)容分析和模式識別,實現(xiàn)運動目標檢測跟蹤、目標檢測、人/車輛特征提取和人臉比對等視頻結構化描述和圖形圖像處理技術,為實現(xiàn)實時視頻內(nèi)容的結構化描述及信息化管理提供“智能的大腦”。大數(shù)據(jù)分析平臺是視頻大數(shù)據(jù)計算與存儲的“心臟”,具有分布式、統(tǒng)一存儲、統(tǒng)一訪問、動態(tài)擴容的特點,用于匯集視頻智能處理的視頻摘要、視頻片段、抓圖、特征數(shù)據(jù)、空間坐標以及案事件等大數(shù)據(jù),從而實現(xiàn)視頻大數(shù)據(jù)的綜合利用,視頻大數(shù)據(jù)的搜索和挖掘成為囊中取物。助力公安圖偵實戰(zhàn)業(yè)務效率上升到全新的臺階。
(審核編輯: 滄海一土)
分享