楔子
近日業余做了一件事情,具體不去闡述,大概如下:某一個路口(編號為A)近期安裝了檢測器,具有良好的流量采集水平,故在京遠程分析處理了下然后給了個配時的建議,選擇早晚高峰進行了測試,從視頻看、從路況看,相應時段還是有一定的優化效果,但是在某部門給的日常監測中,幾無向好趨勢,納悶之余對比了一下其他路口,突然發現另有 B 路口,無論是實際感受、還是視頻監控等,顯示都比 A 要更堵,但是在監測中卻是比 A 好的明顯,再對比一下不同來源數據,由此禁不住懷疑,“腦”們的數據都是對的嗎?
數據的準與不準
近年來,基于大數據的“大腦”等已經流行,基于“大數據+AI”的其他各種“超腦”、“云腦”等也雨后春筍般的不斷涌現,功能紛繁復雜、令人眼花繚亂。
然而另一方面,在實際的工作中,各類“腦”等尚未發揮充分的作用,在大家關注的各類交通問題中,如緩解擁堵、提高安全、改善出行等方面似乎作用有限、場景不足。
總體來看,無論什么“腦”,其核心基礎之一就是數據,是海量的交通相關數據,而近年來在大數據概念的驅動下,似乎在有了量的積累之后,對數據的質的關心卻有些不足,再加上從不同視角給出的一些觀點(類似舍恩伯格的《大數據時代》中指出的大數據時代的三個轉變之一為“更雜:不是精確性,而是混雜性”,認為“允許不精確的出現已經成為一個新的亮點,而非缺點”、“大數據不僅讓我們不再期待精確性,也讓我們無法實現精確性”等觀點),可能使得部分大數據從業人員開始忽略數據的精準性。
當然,舍恩伯格的書中也指出了“錯誤并不是大數據固有的特性,而是一個亟需我們去處理的現實問題,并且有可能長期存在”,只是,是不是有時被忽略掉了呢? 從宏觀的交通政策的出臺到微觀的交通渠化及信號配時優化,無不需要準確的數據的支撐,而現實卻是,隨著大數據的發展,似乎當數據大了后對精準度的關注不再重要。
例如看到過眾多城市的大數據儀表盤上都有所謂“在途量”等統計參數,很多都是靠卡口識別的,然后以此作為依據,那么這個數據準確性幾何?卡口覆蓋的范圍是否能夠不遺漏車輛?卡口的識別準確性又如何?誠然,有了這個數據總比沒有好,但是有了數據后也要去精益求精。
另一方面,各種檢測器返回的數據,量越來越大,但是質是否都有所保證?眾多安裝了大量檢測器的路口,卻連感應控制遲遲用不起來,是信號機的問題?還是控制邏輯的問題?還是也有數據精度的問題呢?我們的每個檢測設備是否都有精細的標定?是否都有持續的精細的標定和質量的監督呢?
數據的多與少
一方面,現在都在喊“大數據”,交通領域相關數據一經羅列,貌似有好多可以用的數據,似乎數據已經很多很多,眾多的單位也都在推廣自己的大數據價值。 但是另一方面,很多從事各類具體工作的人員卻仍感到數據不足(當然有與其接觸到的數據類型、總量有限有關,但也要注意到是否真的現階段的“大數據”對于很多事情就是足夠了的呢?)。
從微觀上而言,做個信號優化,現在有很多用大數據做優化的,但是真正在實施的時候,除了大數據能夠在特定場景提供支撐外,眾多情況下似乎還是要詳細的分轉向、分時段的流量數據,在缺乏常規檢測器的路口很多時候還是束手無策。
從宏觀上而言,居民出行調查曾經是交通規劃的必要基礎,大數據的出現也讓部分人員開始樂觀地認為不再需要繁瑣的居民出行調查,但是現實來看,似乎到目前為止難有有效地取代方式。
雖然已經身處大數據時代,但是經常也會被人問到,“我想做什么什么,但是缺乏需要的數據,該怎么辦”,目前看現狀確實是表面看起來數據多多,實際用起來卻捉襟見肘,因此,如何客觀地評價已有數據的量、質及能效,客觀定位已有數據的價值,是當前需要理性對待的事情,以便能夠更為理性的繼續搭建堅實的數據基礎。
數據的用與效
當有了相對充分的數據或多源數據后,如何用好數據、充分挖掘數據的價值也是非常重要的方面,當然,各個數據擁有者在這方面做的工作都非常多,一種數據從無數的維度進行分析展現,但在與交通工程專業的結合上還有待進一步加強。
當前看各類指揮中心的數據平臺、各個 TOCC 的數據平臺,數據種類、數據量都是非常豐富,但是在效用的發揮上又如何呢? 現實中,受制于眾多因素限制,在數據平臺開發的時候,有時缺乏交通專業領域人員參與,致使精巧展現有余,實用價值不足;在數據平臺應用過程中,建設處(科)室(指揮中心、TOCC、科技處(科)等)組織搭建,卻缺乏更多業務部門對系統的使用反饋,使得數據平臺的價值尚未得以充分的發揮。
另外,在當前的數據使用上,受制于數據保密、部門割據等問題,實際上的數據共享、開放還是非常不足的,眾多的數據躺在了海量的數據庫或數據湖中,而被使用的可能只是一部分,其中又產生真正價值的可能更只是鳳毛麟角。
大數據有一個特性就是數據價值密度較低,要真正發揮大數據的作用,需要在浩瀚如海的數據中遨游,從中擷取有價值的知識乃至智慧,一如沙里淘金,而目前淘的機會有限,有能力淘的隊伍有限,則價值發揮亦有限。
通常將數據——信息——知識——智慧作為遞進的關系,目前情況則是數據已日漸充足,所能夠提取出來的信息也鱗次櫛比,但形成的有價值的新知識則鳳毛麟角,而智慧更似滄海一粟,難以尋覓。
尾聲
前文雖論調頗為消極,但必須承認,過去數年,交通大數據的利用取得了長足的進步,只是與理想的情況尚有差距。
未來,首先需要做到的是展示的大屏上的各類數據結果能夠是符合邏輯的、是經得住推敲的、是精準的,即無論數據的多少,務必要保證準確、說得通
(目前困境之一:一流的界面展示、二流的功能設計、三流的數據支撐);
其次,要充分融合實際的業務工作需求,數據科學家與交通工程師、管理人員等要充分交流溝通,共同提升數據平臺的應用價值及水平;
最后,要通過數據的融合、技術的融合、專業的融合等真正從當前和未來的數據中挖掘出交通系統中的智慧來。
本文來源于交通人,原文標題:李瑞敏:交通大數據背后的真相,
原文鏈接:http://www.hijtr.com/20210110-big-data-in-transportation/
掃一掃在手機上閱讀本文章