最近幾年的科學(xué)研究表明,在單次20分鐘的無(wú)人機(jī)飛行期間所捕捉到的空中圖像可能需要花費(fèi)半天以上的時(shí)間去分析。早些時(shí)候?yàn)榱藨?yīng)對(duì)“帕姆”颶風(fēng),我們?cè)谑澜玢y行的人道主義無(wú)人機(jī)任務(wù)中飛行了幾十次。我們捕捉到的圖像足以讓一位專家分析師專心致志工作至少20個(gè)全職工作日才能搞清楚。換句話說(shuō),航空影像已經(jīng)成為一個(gè)大數(shù)據(jù)問(wèn)題。因此,我和我的團(tuán)隊(duì)正在使用人類計(jì)算(眾包)、機(jī)器計(jì)算(人工智能)和計(jì)算機(jī)視覺(jué)來(lái)理解這一新的大數(shù)據(jù)源。
例如,一些重慶大數(shù)據(jù)公司與南安普頓大學(xué)和EPFL合作,從航空影像中分析了颶風(fēng)“帕姆”在瓦努阿圖(西南太平洋島國(guó))中所造成的破壞。這項(xiàng)研究的目的是為了能夠得到及時(shí)的響應(yīng)解答。救援組織想要的不僅僅是受災(zāi)地區(qū)的高分辨率航拍圖像,他們需要的是答案;例如,受損建筑物的數(shù)量和位置,流離失所的人們的數(shù)量和位置,以及還有哪些道路仍然可用來(lái)運(yùn)送救援物資等。簡(jiǎn)單地給他們圖像是遠(yuǎn)遠(yuǎn)不夠的。正如我在新書(shū)《數(shù)字人道主義者》中所表明的觀點(diǎn)那樣,援助和發(fā)展組織已經(jīng)被災(zāi)前災(zāi)后產(chǎn)生的擁有巨大體量和迅猛速度的大數(shù)據(jù)所淹沒(méi)。再加上另一個(gè)數(shù)據(jù)源“空中大數(shù)據(jù)”可能是毫無(wú)意義的,因?yàn)檫@些組織可能根本沒(méi)有時(shí)間和能力來(lái)理解這些新數(shù)據(jù),更不用說(shuō)將結(jié)果與其他數(shù)據(jù)集成在一起了。我們分析了部署用來(lái)跟蹤颶風(fēng)帕姆的MicroMappers平臺(tái)的眾包結(jié)果,以確定這些數(shù)據(jù)是否可以用來(lái)訓(xùn)練未來(lái)能在瓦努阿圖遭受災(zāi)難的過(guò)程中自動(dòng)檢測(cè)災(zāi)難損害的算法。在整個(gè)MicroMappers的部署期間,數(shù)字志愿者分析了3000多張高分辨率的傾斜航空?qǐng)D像,追蹤那些可能被完全摧毀、部分受損、基本完好的房屋。我和同事Ferda Ofli與Nicolas Rey(暑期和我們共事的EPFL研究生)合作,探索這些痕跡是否可以用來(lái)訓(xùn)練我們的算法。下面的結(jié)果則出自Ferda和Nicolas之手。我們的研究不僅僅是一項(xiàng)學(xué)術(shù)活動(dòng)。瓦努阿圖是世界上最易受災(zāi)的國(guó)家。此外厄爾尼諾現(xiàn)象(El Ni?o)可能是半個(gè)世紀(jì)以來(lái)最強(qiáng)的一次。
根據(jù)眾包結(jié)果,1145幅高分辨率圖像中沒(méi)有包含任何建筑物。以上是一個(gè)簡(jiǎn)單的直方圖,描述每幅圖中建筑物的數(shù)量。瓦努阿圖的航拍圖像是非常不均勻的,不僅在它們展示的特征多樣性上有所不同,而且在視角和拍攝的高度也各不相同。雖然絕大多數(shù)的圖像是傾斜的,有些圖像幾乎是最低點(diǎn)圖片,有些則非常接近地面,甚至是在起飛之前拍的。
我們的圖像數(shù)據(jù)集的異質(zhì)性使得這種圖像的自動(dòng)分析更加困難。此外,我們數(shù)據(jù)集中還存在很多尚在施工中的建筑物,因?yàn)樗鼈兛雌饋?lái)很像損壞的建筑物,所以識(shí)別起來(lái)也是一個(gè)大難題。我們的第一項(xiàng)任務(wù)是訓(xùn)練算法,以確定任意給定的航空?qǐng)D像中是否顯示了某種建筑物。這是一個(gè)重要的任務(wù),因?yàn)樵谖覀兊臄?shù)據(jù)集中超過(guò)30%的圖像不包含建筑物。因此,如果我們能夠開(kāi)發(fā)出一種精確的算法來(lái)自動(dòng)過(guò)濾掉這些無(wú)關(guān)的圖像(比如下面的“噪音”),這樣我們就能集中心力于處理相關(guān)圖像的眾包分析。
迄今為止雖然我們的研究結(jié)果還處于初級(jí)階段,但我們已經(jīng)對(duì)所發(fā)現(xiàn)的東西感到欣慰了。我們訓(xùn)練用來(lái)確定一幅空中圖像中是否包括建筑物的算法已經(jīng)達(dá)到90%以上的精度了。更確切地說(shuō),我們的算法能夠識(shí)別和過(guò)濾掉60%不包含任何建筑物(召回率)的圖像,而且只有10%包含建筑物的圖像被錯(cuò)誤地丟棄(精確率為90%)。下面就是舉例。毫無(wú)疑問(wèn)現(xiàn)在仍然存在很多的重大挑戰(zhàn),所以我們希望在現(xiàn)階段不做出過(guò)分承諾。在接下來(lái)的步驟中,我們將探索我們的計(jì)算機(jī)視覺(jué)算法是否能夠區(qū)分遭到破壞或者保存完好的建筑物。
我們之前在瓦努阿圖使用的無(wú)人機(jī)還需要我們操作著陸才能獲得采集到的圖像。現(xiàn)在越來(lái)越多的新型無(wú)人機(jī)提供了實(shí)時(shí)地將航拍圖像和視頻傳送回基地的功能。例如,大疆推出的“精靈”系列新品Phantom 3無(wú)人機(jī)(見(jiàn)下圖)就允許用戶將航空視頻直接發(fā)送到Y(jié)ouTube進(jìn)行直播(假設(shè)有連接)。毫無(wú)疑問(wèn),這是無(wú)人機(jī)工業(yè)的發(fā)展方向:實(shí)時(shí)數(shù)據(jù)收集和分析。在人道主義應(yīng)用中的搜索和救援等方面,實(shí)時(shí)進(jìn)行數(shù)據(jù)分析是更上一層樓的。