衛(wèi)星雖被形象地稱為“天眼”,事實上衛(wèi)星數(shù)據(jù)的應(yīng)用,卻難以做到“盡收盡用”。
中國工程院院士楊小牛就曾經(jīng)表示,衛(wèi)星在天上飛來飛去,效能其實并不高,每天只有幾十分鐘時段內(nèi)采集到的數(shù)據(jù)是地面需要的。
那些大量的被認為是無效數(shù)據(jù)的“廢片”,有沒有可能被利用起來?
近日,清華大學理學院院長、地球系統(tǒng)科學系主任宮鵬介紹,在高性能云計算的支持下,通過數(shù)據(jù)建模、人工智能算法等手段,清華大學地球系統(tǒng)科學系制作完成了首套中國30米逐日無縫遙感觀測數(shù)據(jù)集,以及逐季節(jié)土地覆蓋和逐年土地利用的數(shù)據(jù)集,讓“拼圖無解”的衛(wèi)星“廢片”能夠成為高分辨率的地圖資源。
人工智能深度“補片”
“傳統(tǒng)的對地衛(wèi)星觀測,拍下來的照片是不同時間采集的,拼在一起并不完整,使用門檻很高。”宮鵬解釋,衛(wèi)星直接獲得的圖片不能拿來直接用,因為衛(wèi)星圖片不是自然連續(xù)的,很可能像100塊的拼圖,有時候是少了50塊的效果,但也有可能同樣的拼圖來了好幾塊。
不止如此,衛(wèi)星軌道的偏差還會造成同一地方不同時間拍攝的圖片難以重疊,云彩的遮擋、霧氣不均勻的散射都會導致大量的衛(wèi)星遙感數(shù)據(jù)難以反映地表的真實情況,而成為難用的“廢片”。
基于此前完成10米分辨率全球地表覆蓋制圖數(shù)據(jù)處理過程中積累的經(jīng)驗,清華大學地球系統(tǒng)科學系團隊自主研發(fā)了時空數(shù)據(jù)融合重建的技術(shù)。
“我們構(gòu)建了人工智能需要的知識庫,其中包括世界首套全球全季節(jié)普適樣本庫和相關(guān)領(lǐng)域知識。庫中分為訓練樣本庫和完全獨立的驗證樣本庫。”清華大學博士生劉涵介紹,團隊設(shè)計了一套適應(yīng)遙感大數(shù)據(jù)的深度遙感特征學習和分類模型,利用機器學習和數(shù)據(jù)建模對人工智能系統(tǒng)進行了訓練,使其能夠“理解”或者說“推斷”出缺失的圖塊,進而補缺。
“就好像現(xiàn)在一些APP身份驗證時,會有一個補圖的步驟,經(jīng)過訓練的模型,也可以大規(guī)模分析現(xiàn)有的衛(wèi)星圖片,自動補圖,且做到數(shù)據(jù)與真實情況相符合。”劉涵說。
通過訓練,模型可完成高性能的推理,把不完整的“拼圖”重建成時空一致的圖像庫,建立起這一深度遙感制圖模型的“超能力”,完成各種不合格“廢片”的補片工作,從而生成與真實情況相匹配的遙感觀測數(shù)據(jù)集。例如通過人工智能技術(shù)可識別路面是瀝青、土路還是水泥路面等地表覆蓋類型。
計算上云避免巨大資源消耗
“地球系統(tǒng)科學使用和產(chǎn)生的數(shù)據(jù)是極其巨大的,例如氣候模擬和預測會生成時間間隔在小時級、地面分辨率是3公里的氣候數(shù)據(jù),這些數(shù)據(jù)的數(shù)據(jù)量級往往相當于數(shù)百萬集高清電影的量級。”宮鵬介紹,因此需要超強算力來完成。
如果為這些數(shù)據(jù)進行數(shù)據(jù)中心建設(shè)的話,需要三四百個機柜,占地成本和時間成本耗費巨大。對這些數(shù)據(jù)集中的數(shù)據(jù)進行AI處理時,如果不在云上進行而是搬運下載后再運算,那光是用來搬運的時間也可能需要幾個月。
而通過云上高性能計算,則能夠把算力部署在公共數(shù)據(jù)集周邊,圍繞數(shù)據(jù)進行計算。據(jù)介紹,亞馬遜云服務(wù)(AWS)為此次項目的完成提供了10萬核左右的云上高性能計算資源。
此外,AWS上還提供一整套完善的人工智能和機器學習的套件和服務(wù)以及自動化多層堆疊集成技術(shù),可用于對模型結(jié)構(gòu)和參數(shù)進行深度調(diào)優(yōu),并進行分布式高性能推理。
“現(xiàn)在中學生、小學生想拿數(shù)據(jù)做點什么,從里面拉幾條曲線,或者把一個區(qū)域拿出來做一些探測、變化、趨勢的分析,都已經(jīng)變得非常容易。”宮鵬說,對于衛(wèi)星公共數(shù)據(jù)的梳理、重建,讓衛(wèi)星遙感圖的使用門檻大大降低,如果說之前只有專業(yè)用戶能從數(shù)據(jù)中獲得價值,那么以后更多的普通用戶也能看懂和利用這些數(shù)據(jù)。
掃一掃在手機上閱讀本文章