記得幾(ji)年前(qian)看(kan)過一(yi)部電(dian)影(ying),威(wei)爾史密斯主演的(de)《國家公敵》,影(ying)片(pian)中美國的(de)各個角落充斥著攝像機(ji),CIA可以隨時調用這(zhe)些(xie)攝像機(ji)進行(xing)追蹤,無(wu)數的(de)攝像機(ji)形成了一(yi)張超級大(da)網,當時覺得有點(dian)(dian)科幻(huan)也(ye)有點(dian)(dian)背寒(han)。
短(duan)短(duan)幾年后這(zhe)已(yi)經成為了(le)現(xian)實(shi),成百(bai)萬的(de)(de)攝像頭已(yi)經聯網,給我們的(de)(de)人(ren)財安全、交通出行(xing)(xing)帶來了(le)非常(chang)多(duo)便利(li),但這(zhe)僅僅是開始,實(shi)際上,現(xian)在的(de)(de)技術已(yi)經能(neng)夠很輕松地進行(xing)(xing)智能(neng)識(shi)別(bie)、人(ren)流計數(shu)甚至(zhi)行(xing)(xing)為識(shi)別(bie)等,這(zhe)龐大的(de)(de)視頻數(shu)據分析比傳(chuan)統互(hu)聯網數(shu)據更接近于真實(shi)的(de)(de)世(shi)界。這(zhe)個潘多(duo)拉盒子的(de)(de)里面,究竟(jing)會帶來什么?
視頻監控將是世界上最大的數據生成器
2012年這個世(shi)界上增加了2.8ZB的數(shu)(shu)據,相當于30億TB。如果視(shi)頻(pin)數(shu)(shu)據也存(cun)儲下來,這個數(shu)(shu)據就要翻倍了。
以國(guo)內某(mou)(mou)省為例,公共視頻監控(kong)已經(jing)超過100多萬(wan)個(ge)攝像(xiang)頭(tou)(tou),總保有量(liang)近400萬(wan),以此估計,全國(guo)攝像(xiang)頭(tou)(tou)數(shu)量(liang)不少于4000萬(wan),某(mou)(mou)投(tou)行(xing)的(de)(de)(de)報(bao)告稱(cheng)行(xing)業每年(nian)還在(zai)以20%加速增長(chang),行(xing)業龍頭(tou)(tou)海康威(wei)視12年(nian)的(de)(de)(de)年(nian)報(bao)披露的(de)(de)(de)銷售量(liang)就達570萬(wan)套(含前后端),增長(chang)37%。而另一個(ge)數(shu)據也(ye)很驚人,英(ying)國(guo)的(de)(de)(de)攝像(xiang)頭(tou)(tou)數(shu)量(liang)與(yu)人口數(shu)量(liang)之比已經(jing)達到(dao)1:15。粗略計世界至少有1億(yi)個(ge)攝像(xiang)頭(tou)(tou)在(zai)角落靜靜的(de)(de)(de)看(kan)著。
如果這些數(shu)據(ju)(ju)存儲下來,將是(shi)超級大數(shu)據(ju)(ju)。假設所有攝(she)像頭換為1080P,每天(tian)的數(shu)據(ju)(ju)量是(shi)64G,每年的數(shu)據(ju)(ju)量是(shi)23T,全(quan)世界每年將產生23億T的視頻數(shu)據(ju)(ju)。
這(zhe)(zhe)是個可怕(pa)的數(shu)字。不(bu)知是有幸還是不(bu)幸,絕大部分視頻監控數(shu)據存(cun)儲不(bu)會超過一天。但這(zhe)(zhe)是因為(wei)從(cong)目前看來,與存(cun)儲的價格相(xiang)比,這(zhe)(zhe)些數(shu)據不(bu)值錢(qian)。
正在形成的超級視頻監控云
視頻(pin)監控已經不再(zai)是(shi)以前那(nei)樣,幾個攝像頭連到大樓保安室(shi),只有(you)進入這個神秘的(de)房間才能一窺究竟。實際上,監控攝像頭已經成為了智能終端,有(you)網(wang)口、能控制(zhi)甚至可接雙向音頻(pin),攝像頭的(de)互聯已經成為趨(qu)勢(shi)。
例(li)如(ru)公(gong)共視(shi)頻(pin)(pin),已經從(cong)一個(ge)城市內的(de)(de)(de)互(hu)(hu)聯,發展(zhan)到一個(ge)省的(de)(de)(de)互(hu)(hu)聯,逐步到一個(ge)國(guo)家的(de)(de)(de)互(hu)(hu)聯,無(wu)論是(shi)新(xin)的(de)(de)(de)網絡攝像頭,還是(shi)舊(jiu)模擬攝像頭+DVS/DVR,都開始加(jia)速(su)接入一個(ge)龐大的(de)(de)(de)云平(ping)臺,從(cong)單(dan)純(chun)的(de)(de)(de)視(shi)頻(pin)(pin)流媒體數據到云臺操(cao)作,每一個(ge)終端(duan)都成(cheng)為了一個(ge)可被遠程控制的(de)(de)(de)智能化終端(duan)。而另(ling)一端(duan),這些(xie)數據又被包裝成(cheng)各種公(gong)共應用向公(gong)眾開放,看看媒體里(li)充斥著多少(shao)手機可實(shi)時(shi)查看城市道路交通視(shi)頻(pin)(pin)的(de)(de)(de)新(xin)聞(wen)。
除了公共視頻(pin),無(wu)(wu)數(shu)私有(you)視頻(pin)也(ye)在形(xing)成(cheng)私有(you)云,分支龐大的連鎖超市、連鎖酒(jiu)店、物(wu)流公司(si)、金融機構甚(shen)至工業(ye)生產線,無(wu)(wu)數(shu)端點的數(shu)據(ju)正在向云匯集。而不少國家(jia)也(ye)要(yao)求(qiu)私有(you)視頻(pin)數(shu)據(ju)也(ye)要(yao)定(ding)向開放,可被調用和操作(zuo)。
這正是與互聯網(wang)不(bu)同的(de)物聯云網(wang)絡,從(cong)感知到互聯到應用(yong),只不(bu)過這個感知是用(yong)無數的(de)“眼睛”看世(shi)界。
歡迎(ying)進入“楚門的世界”。
視頻大數據的價值還未發掘
一般看(kan)來,視頻的冗余(yu)數(shu)(shu)據(ju)太(tai)多(duo),只有發(fa)生了突發(fa)事件(jian)才會回看(kan)記(ji)錄(lu),所以大部分(fen)視頻數(shu)(shu)據(ju)的存儲很短,超過一周的少之又(you)少。而另一方面,由于數(shu)(shu)據(ju)讀寫要求高,云端存儲極為(wei)昂貴(幾千元(yuan)1TB),所以絕大部分(fen)數(shu)(shu)據(ju)都(dou)是存在(zai)前(qian)端。
視頻(pin)智能(neng)分析的(de)(de)(de)(de)初(chu)衷就(jiu)是(shi)要(yao)解(jie)(jie)決(jue)冗(rong)余數據的(de)(de)(de)(de)問(wen)題,把人(ren)(ren)從枯燥的(de)(de)(de)(de)監控中(zhong)解(jie)(jie)放出來,幫助人(ren)(ren)更好的(de)(de)(de)(de)眼觀六路(lu)。所(suo)謂智能(neng)的(de)(de)(de)(de)核心就(jiu)是(shi)目標識別(bie)(bie)和行為分析,按照應用(yong)的(de)(de)(de)(de)要(yao)求設定規(gui)(gui)則(ze),當(dang)視頻(pin)中(zhong)的(de)(de)(de)(de)信(xin)息(xi)符合(he)規(gui)(gui)則(ze)時才進行告(gao)警和記錄,常見的(de)(de)(de)(de)應用(yong)包括(kuo)入侵檢測、周界告(gao)警、車輛識別(bie)(bie)、交通違法監控等。
目前(qian)行業(ye)主流的智能分析廠商,如(ru)國外的ObjectVideo、ioimage、Emza,國內的卓揚科技(ji)、文安科技(ji)、智安邦(bang)科技(ji)等,基本都是圍繞“監控”二字,屬于視頻數(shu)(shu)據(ju)(ju)(ju)的初(chu)級加工,一般只(zhi)是對單(dan)個(ge)攝像(xiang)頭的視頻信(xin)息(xi)進行實時(shi)處理(li),按(an)一定規則產(chan)生事件(jian)數(shu)(shu)據(ju)(ju)(ju)(如(ru)告(gao)警事件(jian)、車輛(liang)計數(shu)(shu)),跨空間和時(shi)間范圍的二次加工分析還比較少,因此,視頻監控領域并未真(zhen)正(zheng)的形成互(hu)聯網意義上(shang)的大數(shu)(shu)據(ju)(ju)(ju)。
不過(guo)視(shi)頻監控數(shu)據(ju)必(bi)定能成為下(xia)一個大數(shu)據(ju)的(de)寶庫。一方(fang)(fang)面,它(ta)具(ju)備(bei)了(le)典型的(de)大數(shu)據(ju)4V特征,數(shu)據(ju)量巨大、多樣化、表面上無序、但暗(an)含(han)著無數(shu)人(ren)(ren)和(he)物的(de)行為。另(ling)一方(fang)(fang)面,它(ta)是(shi)真(zhen)實(shi)世界的(de)寫照(zhao),這與互聯網獲(huo)得的(de)大數(shu)據(ju)有(you)很大不同(tong),真(zhen)實(shi)世界蘊含(han)了(le)無數(shu)難以用格式化文字表達的(de)信息,比如(ru)人(ren)(ren)通過(guo)視(shi)覺可以快(kuai)速形成判斷,一個地方(fang)(fang)是(shi)繁榮還是(shi)衰退,氣氛是(shi)緊張還是(shi)歡快(kuai)。
當然,前提是(shi),存(cun)儲(chu)成本能降下來,數據(ju)處理能力能升上去(qu)。
監控數據的應用潛力巨大
比如(ru)對于一個商(shang)場,除了對安防的(de)需求之外,對視頻數(shu)據(ju)的(de)二次(ci)挖掘,可(ke)以(yi)搜集顧(gu)(gu)客的(de)性(xing)別(bie)、年齡(ling)、穿著(zhu)信息,可(ke)以(yi)統計顧(gu)(gu)客的(de)購(gou)物路(lu)徑、停留模式(shi)、聚集熱(re)點,甚(shen)(shen)至(zhi)可(ke)以(yi)二次(ci)或者多次(ci)回頭率、到店(dian)周(zhou)期等。這類似于網站訪問(wen)分(fen)析,能為(wei)商(shang)場的(de)優化提供基礎(chu)數(shu)據(ju)。如(ru)果是連鎖型企業,還(huan)能結合多店(dian)的(de)數(shu)據(ju),獲得區(qu)域性(xing)甚(shen)(shen)至(zhi)全(quan)國性(xing)的(de)數(shu)據(ju)。
同(tong)(tong)樣放大到一個城市(shi),每個街道的人流(liu)數據(ju)、車(che)流(liu)數據(ju)都在(zai)其(qi)中(zhong),這些數據(ju)整體匯集起來,就(jiu)是一個城市(shi)的人車(che)分布(bu)圖,靜態的如(ru)不同(tong)(tong)區(qu)域(yu)人的特(te)征、車(che)的特(te)征,動態的如(ru)人車(che)的路(lu)徑、停留模(mo)式,這對(dui)城市(shi)的規劃(hua)和管理(li)都極有價值。
如果再結合到時間線,從(cong)無(wu)數(shu)攝像頭收(shou)集(ji)到的(de)(de)信息,還可以看(kan)出一個(ge)(ge)國(guo)家、一個(ge)(ge)區域、一個(ge)(ge)城市的(de)(de)變(bian)化(hua),如同(tong)《大數(shu)據》里所言,甚(shen)(shen)至可以預測趨(qu)勢(shi),比如是否(fou)更多(duo)的(de)(de)店鋪(pu)在新裝(zhuang)修開(kai)張(zhang)還是更多(duo)的(de)(de)歇業(ye),是更多(duo)的(de)(de)飯店還是更多(duo)的(de)(de)服裝(zhuang)店等,這些變(bian)化(hua)匯集(ji)起來我們可以看(kan)到人口的(de)(de)變(bian)化(hua)、經濟的(de)(de)趨(qu)勢(shi)、潮流的(de)(de)趨(qu)勢(shi)、自(zi)然環境(jing)的(de)(de)變(bian)化(hua)甚(shen)(shen)至人的(de)(de)快樂和緊(jin)張(zhang)程度。
這(zhe)不(bu)是(shi)天(tian)方夜(ye)譚,現(xian)在的(de)(de)技術已經(jing)(jing)完全(quan)做到。一方面高清攝像(xiang)機的(de)(de)普及,視頻信息質(zhi)量(liang)更加優良;另一方面,智能分析(xi)(xi)的(de)(de)水平(ping)已經(jing)(jing)相當(dang)的(de)(de)高,對(dui)(dui)物(wu)品的(de)(de)識別和分離、對(dui)(dui)顏色文字數字的(de)(de)識別、對(dui)(dui)物(wu)體變(bian)化的(de)(de)分析(xi)(xi)甚至還有暴力行為的(de)(de)監測。
但(dan)要(yao)實現(xian)這種意義上(shang)的(de)(de)(de)數(shu)據(ju)挖掘,需(xu)要(yao)進(jin)行(xing)大(da)(da)量(liang)元(yuan)數(shu)據(ju)的(de)(de)(de)記錄,甚至是(shi)與監控目的(de)(de)(de)無關(guan)的(de)(de)(de)元(yuan)數(shu)據(ju),要(yao)多維度(du)的(de)(de)(de)進(jin)行(xing)分析(xi),需(xu)要(yao)海(hai)量(liang)的(de)(de)(de)數(shu)據(ju)匯集存儲和(he)超大(da)(da)規(gui)模的(de)(de)(de)數(shu)據(ju)處理(li),最后還需(xu)要(yao)基于(yu)位置和(he)時間的(de)(de)(de)進(jin)行(xing)關(guan)聯性分析(xi)整合,這巨大(da)(da)的(de)(de)(de)資源和(he)成(cheng)本耗費是(shi)打開大(da)(da)數(shu)據(ju)之門的(de)(de)(de)障礙。
技術和人性的沖突
一周前Google宣布,在有(you)效的(de)隱私(si)保護(hu)機制(zhi)完善之前,禁止Glass APP使用(yong)(yong)(yong)智能識別(bie)功能。此前,Google 因為 Glass的(de)隱私(si)政策曾經遭受過國會議員的(de)質(zhi)詢,其中包括了面部識別(bie)是(shi)否會侵犯用(yong)(yong)(yong)戶隱私(si)、GoogleGlass 是(shi)否會收集用(yong)(yong)(yong)戶信息(xi)、Google 如(ru)何保障用(yong)(yong)(yong)戶數據等方面的(de)問題(ti)。
視頻監控也(ye)一樣涉及隱(yin)私問題。視頻技(ji)術中智(zhi)(zhi)能識別(bie)的(de)技(ji)術也(ye)已經相(xiang)當成熟,如果存儲夠大(da)、處理(li)夠強(qiang),在無數的(de)云數據中進行(xing)(xing)搜(sou)索(suo)(suo)(suo)同樣可以產生非(fei)常多有意(yi)義的(de)應用,比如搜(sou)索(suo)(suo)(suo)走失的(de)小孩,未來只(zhi)需要輸入照片,就能大(da)范(fan)圍(wei)的(de)進行(xing)(xing)智(zhi)(zhi)能搜(sou)索(suo)(suo)(suo),這(zhe)比靠人(ren)海戰術有效的(de)多。
但(dan)是這對(dui)隱私的(de)侵犯是難以(yi)繞開(kai)的(de)痛(tong),國內在這方面的(de)法規還是空白,例如之(zhi)前(qian)微博爆出的(de)“摸(mo)奶門”就(jiu)是典型的(de)公民隱私被侵犯的(de)事(shi)件。在監管上亟(ji)待明確誰可以(yi)建攝像頭(tou)、哪里可以(yi)建、數據怎樣(yang)保存、怎樣(yang)保障信(xin)息(xi)不(bu)外漏。
不過在(zai)(zai)現實中,攝像頭的迅猛增長已(yi)經(jing)昭(zhao)示(shi),公民隱私還是(shi)讓(rang)位于公共(gong)管理,但(dan)是(shi)隨著(zhu)視頻監控云的形成和走(zou)向云存儲,數據的威力越來越大(da),通過云數據,甚至可(ke)以(yi)描(miao)繪出一(yi)個人的生活軌跡、興(xing)趣愛好,TA喜(xi)歡去哪些店鋪(pu),在(zai)(zai)哪里活動,服飾(shi)愛好如何,經(jing)常跟(gen)誰在(zai)(zai)一(yi)塊(kuai)兒原本只(zhi)有上(shang)帝能(neng)看到的,云都(dou)在(zai)(zai)看著(zhu)你。
技術的(de)進(jin)(jin)步總(zong)會帶來新(xin)的(de)挑戰,未來睿(rui)智的(de)人們必定會想出隱私的(de)保(bao)護方法,只(zhi)有你的(de)授權(quan)才能(neng)查看你在視頻里的(de)存在,或者,我們的(de)三觀進(jin)(jin)化了,適應了技術的(de)發展。
世界(jie)本來就是舞臺,上帝正(zheng)在云端微笑。
編(bian)者(zhe)注:本文原題(ti)《視頻監控背后的大(da)數據,在超(chao)級潛力跟道(dao)德禁制之間(jian)怎么(me)選?》,原載虎嗅(//www.huxiu.com/article/15427/1.html),正文無刪(shan)節。