前幾日,特斯拉與AMD合作研發自動駕駛芯片的緋聞沸沸揚揚,一度讓外界猜測特斯拉與英偉達的合作有所變動。昨日,英偉達CEO黃仁勛在GTC China則表示,即使特斯拉用了別家的計算芯片,自己也對特斯拉的車也照買不誤。
計算芯片這一自動駕駛的大腦,被再度推上了風口浪尖。盡管不慎放出“假消息”的格羅方德出面否認了,但坊間的極大關注也表明,芯片,是眾自動駕駛公司的一塊心病。 做平臺的計算巨頭如英偉達、英特爾、高通,“自古以來”為車廠供貨的半導體商,以及做單點技術的初創公司,都在不斷地試圖制造屬于自己的自動駕駛芯片,以在自動駕駛競賽中掌握絕對制高點。 一、特斯拉“尋新歡”是假? 上周,從AMD拆分出來的晶圓廠格羅方德(GlobalFoundries,GF)無意間透露出來消息:特斯拉、AMD、GF三方,正在自動駕駛上“搞事情”。消息一出,自動駕駛圈子炸了鍋。AMD股價應聲而漲,英偉達股價則小幅下挫。 對于合作,報道稱特斯拉將在AMD的芯片IP基礎上,開發自己的自動駕駛芯片,格羅方德則是代工廠。 然而第二天,GF就跳出來否認,稱“與特斯拉沒有直接合作關系”。但是,這個說法很有意思,僅僅是撇清了自己和特斯拉的“直接關系”。而特斯拉與AMD兩方,對此消息則是不予置評,既不否定,也不承認。 特斯拉當然不會承認,因為: 1、現在特斯拉的車型還裝著英偉達家的Drive PX 2自動駕駛車載電腦到處跑呢。 2、英偉達CEO黃仁勛的車庫里還停著特斯拉Model S和Model X。 3、英偉達今年那款性能爆棚的深度學習利器DGX-1,老黃直接送了馬斯克資助的OpenAI一臺,還是親自交到后者的手中。 但是從馬斯克的經歷中就可以看出,他并不是一個安分的人。和Mobileye的分手已是前車之鑒,和英偉達現在雖然你儂我儂,但也架不住特斯拉的目標是星辰大海。 基于三點原因,特斯拉會熱衷于研發自己的自動駕駛芯片: 1、對核心硬件有更強的掌控力。 2、研發自己的自動駕駛芯片,能夠在硬件加速上形成差異,更有可能建立起自動駕駛技術的優勢。 3、Drive PX 2功耗為250W,而價格則直接是1.5萬美元。如果特斯拉選擇自己造自動駕駛芯片,那么成規模之后,有助于降低成本。 因此,出于提升對核心硬件掌控力、擁有更強計算競爭力以及成本等因素的考慮,自研自動駕駛芯片對特斯拉來說確實是一個可選項。 最直接的證據就是特斯拉作為一家汽車公司(至少目前來看是這樣),所擁有的50余人的芯片團隊,以及團隊的帶頭人——去年年初加入的吉姆·凱勒。 凱勒早年任職于AMD,參與締造了X86-64架構(AMD為桌面端處理器作出的最偉大的貢獻),拿出了能和英特爾正面抗衡的K8架構;后又進入蘋果,負責了A4與A5處理器;再一個回馬槍殺回AMD,奉獻了Zen架構——銳龍正是在Zen架構的基礎上,逼得今年的英特爾不再擠牙膏。 特斯拉的芯片團隊由這樣一位在行業功勛卓著的傳奇人物坐鎮,必然是有所布局的。 昨日,英偉達CEO黃仁勛在GTC China上接受采訪時,面對“如果特斯拉與其他廠商做了自動駕駛芯片,你是否還會買特斯拉”這一問題,也并未在回答中急于澄清和特斯拉的合作關系。 這次把格羅方德牽扯進去,則說明特斯拉的自動駕駛芯片至少已經到了流片測試的階段。 不過特斯拉不太可能去挑戰英偉達的GPGPU(通用計算型GPU)在深度學習中的地位,因此這枚芯片大概率會是一款針對自動駕駛的專用計算芯片。 二、三大巨頭決戰自動駕駛芯片 特斯拉與英偉達的分分合合只是自動駕駛芯片大戰中的冰山一角。在這個關鍵領域中,自動駕駛芯片延續了與其高度相關的深度學習所采用的幾類硬件技術路線:GPU、FPGA、ASIC,引來全球各方公司同臺競技。 首先不得不提的是英特爾、英偉達、高通三大芯片巨頭,它們帶領的競爭為這場芯片戰爭奉獻了絕大多數戲碼。而且,他們也恰好反映了自動駕駛芯片的不同技術路線之爭。 1、英特爾:豪擲320億美元,買出一片天 在深度學習興起的這兩年,英特爾頗有些哀傷。因為CPU天生擅長串行與通用計算,在面對需要大規模并行計算的深度學習時,暫時處于被GPU壓制的狀態。因此,英特爾繞過GPU,在2016年以167億美元完成了對世界第二大FPGA公司Altera的收購。 FPGA,現場可編程門陣列,是一種處于CPU、GPU和ASIC之間的芯片。相較于CPU、GPU的通用計算屬性(沒錯,GPU雖然比CPU“專業”不少,但仍屬于通用計算),FPGA的功能更加專一,并且更加接近底層I/O,運算實時性比CPU/GPU更高,一旦完成編程,就能進行特定的運算,比CPU、GPU更加高效。同時,它又比專用芯片ASIC更加靈活——芯片可以被反復編程,以滿足不斷變化的計算需求。 高實時,低功耗,可靈活編程,這全都切中了自動駕駛對計算芯片的要求。英特爾在年初推出的自動駕駛計算平臺Intel Go中,也使用了FPGA芯片。奧迪新A8自動駕駛所仰賴的核心計算單元zFAS,也使用了Altera的FPGA芯片,內建被英特爾收購的Movidius視覺算法,負責物體數據和地圖數據的融合,與自動停車功能的實現。 另外英特爾在服務器市場擁有不俗實力,這意味著在云端,其可以部署強大的計算能力。結合低延時又高效的FPGA,英特爾可以在云端處理大量并發的實時計算。這種模式尤其適合人們對智慧城市大腦的設想:每一輛無人車的數據都上傳到一個中樞,由其處理并洞悉每一輛車的狀態,去命令他們如何駕駛。 當然,無人車與城市中樞之間需要高帶寬、時延極低的數據通道連接起來,這也是英特爾對5G如此上心的重要原因之一。對此,英特爾在今年推出了首款車載5G通信平臺。 但是,雖然這一套設想很先進,但標準、基礎設施建設,將耗費大量的時間和財力,短期內實現難度仍然較大。因此,進入眼下有切實市場的輔助駕駛至關重要。 2016年10月,英特爾發布針對ADAS市場的凌動處理器A3900系列,為車載信息系統和ADAS功能提供計算支持。為了符合車規,英特爾還對A3900做了特別設計,最高耐受150°高溫。并且,應用了16nm制程和Apollo Lake架構的A3900在功耗表現上也相當優秀,最高不超過12W。 但ADAS的芯片市場已經有了眾多傳統汽車半導體商,還有Mobileye這一稱霸的公司,英特爾怎么可能說切入就能切入? 不能平地起高樓的一種解決方法是,直接買一棟。今年3月,英特爾一狠心一咬牙,以153億美元的天價收購了以色列ADAS公司Mobileye。對于其他公司來說,Mobileye或許不值153億美元,但是對于英特爾來說,這錢不得不花——今年初建立自動駕駛聯盟時,只有寶馬才買了英特爾的賬。 而Mobileye一方面為英特爾提供了切入自動駕駛市場的渠道——前者在全球ADAS市場的份額超過70%;另一方面,Mobileye的核心產品——ADAS專用芯片EyeQ系列,使英特爾形成了針對車輛端的計算芯片解決方案——英特爾的凌動/至強+Mobileye的EyeQ+Altera的FPGA。這153億美元,其實是英特爾為自動駕駛買的門票。 在英特爾投入巨資過后,Mobileye直接繞過了其ADAS的第四代專用芯片EyeQ4,將在明年量產EyeQ5。值得一提的是,Mobileye宣稱,EyeQ5的計算能力能夠滿足L4-L5級的自動駕駛。 當下,自動駕駛的車輛終端和云端還沒有實現實時的高帶寬傳輸,因此車輛終端的計算力顯得尤為重要。 2、英偉達:生態、性能一騎絕塵 英偉達無疑是人工智能時代計算巨頭中最大的受益者。GPGPU(通用計算型GPU)在深度學習領域的統治力無需多言,目前大部分深度學習在訓練階段,都是由英偉達的GPU支持的。 一方面,這得益于其GPU相對于CPU而言針對深度學習更強的計算能力,另一方面在于,英偉達為其GPU通用計算所做的開發易用性工作開展得是如此之好,大大降低了開發者的上手難度。 這不,昨天GTC上,老黃又帶來了更新過后的深度學習應用平臺TensorRT 3,把各種深度學習框架都囊括了進去。 而在運用其GPU為車輛端的深度學習應用(Inference)提供支持方面,英偉達的做法頗有些“浮點運算能力越高越正義”的意味。 在自動駕駛時代之前,英偉達很早就通過Tegra 系列處理器進入了眾多整車廠的供貨商名單,比如和英偉達保持了8年合作關系的奧迪,以及頗受老黃喜歡的特斯拉,不過早年英偉達的Tegra負責的主要還是車載娛樂方面。(最新消息,彭博社報道特斯拉或將其娛樂信息系統芯片供應商換為英特爾)。 而今年具備L3自動駕駛功能的奧迪新A8,其由采埃孚打造的自動駕駛計算平臺zFAS,使用了英偉達的Tegra K1芯片,負責處理車輛的環視影像。然而,zFAS主要負責實現自動駕駛功能的芯片,是Mobileye的EyeQ3和Altera的Cyclone。這一點顯然無法讓英偉達滿意,乃至都不愿意提到這一點,但Tegra K1的單精度浮點運算性能也只有350GFlops,而EyeQ3整合了完整算法支持的一整套ADAS功能,使得K1的性能看上去并沒有那么誘人。 其實,在新奧迪A8亮相之前,英偉達已經連續推出兩代性能十分強悍的自動駕駛車載電腦,其中被力推的Drive PX 2最強版本Drive PX Autochauffeur使用了兩顆名為Tegra Parker的SoC,內建6核CPU以及基于帕斯卡架構、擁有256個CUDA單元的顯示核心。Tegra Parker的上一代Tegra X1單精度浮點運算能力就達到了1Tflops,Parker性能據稱達到1.5T,兩個Parker SoC加起來性能達到3T。然而英偉達覺得還不夠,又在兩個SoC之外加入了兩張帕斯卡架構的獨立顯卡。最終的結果是,Drive PX 2 autochauffeur的單精度浮點運算能力達到了8TFlops,是Tegra K1的20倍還多(可憐的K1,人家只是一枚SoC而已)。 這一計算平臺是足以滿足L3自動駕駛的運算要求的,如果多個平臺疊加使用,Drive PX 2還能滿足全自動駕駛的計算要求。然而Drive PX 2高性能的背后是不菲的代價——這一計算平臺的功耗高達250W,乃至于產生的巨大熱量需要水冷散熱;而價格高達1.5萬美元。其單位計算量消耗的能量與成本都不菲,對于需要過車規、壓成本的量產型自動駕駛功能來說,這些都是壞消息。 這也是英偉達目前在自動駕駛車載計算芯片(其他對功耗、成本有較高要求的終端也成立)面臨的一大困境: 論訓練階段的大規模高性能計算,由于完整的生態,英偉達暫時誰都不虛;然而在人工智能的終端設備上,英偉達高性能GPU高能耗,以及令人咋舌的價格,讓不少正在研發自動駕駛的公司都感到糾結——Drive PX 2性能當然足夠強勁,但要量產的自動駕駛功能,顯然承受不起10萬的加價,和要水冷的板卡。 當然,英偉達對Drive PX 2駭人的功耗看得很清楚。Drive PX 2之后,英偉達立馬推出了新一代基于Volt架構GPU的SoC Xavier,單精度浮點運算性能達到20Tflops,是Drive PX 2 Autochauffeur的2.5倍,而功耗僅僅為30W。Xavier開了掛一般的強悍性能使它可以支持L4-L5的自動駕駛運算需求,同時低功耗和較小的體積又能夠適應車輛需求。 可以說,英偉達靠這顆芯片為其GPU進一步打入自動駕駛的應用推斷(Inference)階段鋪平了道路,全球知名的汽車供應商博世和采埃孚,都與英偉達達成了合作,將基于Xavier開發車載電腦。在強大性能與功耗之間雙雙取得大幅度進展的Xavier,將成為英偉達在自動駕駛芯片市場上的撒手锏。 不過,Xavier的量產時間為明年初,大規模出貨則要等到明年第四季度。 因此,對于英偉達來說,目前其GPU針對當下性能要求適中(滿足L2-L3)的自動駕駛計算芯片,暫時仍缺乏一個足夠便宜的整體方案。 3、高通:寄望5G,恩智浦是未知數 2014年,高通推出車載芯片驍龍602A,主要面向車內的娛樂影音計算需求。有趣的是,在兩年后的宣傳中,這款芯片被聲稱可以通過深度學習算法支持自動駕駛。但搭載了602A的2017款奧迪Q7,并不支持自動駕駛。 看得出來,整車廠對這樣一塊單核頻率最高1.5G的SoC還是不夠信任。 2016年初,高通又再次發布基于旗艦SoC打造的820A,特意加入了對深度神經網絡的硬件加速支持。推出這一車載SoC,高通主要面向的是ADAS市場。 不過,即使是820A,也是在一年之后才迎來了首個基于它打造的ADAS產品系統原型,由國內創企縱目科技推出。 由于專注于移動端,高通在高性能計算上的積累不如英特爾與英偉達,其驍龍SoC雖然在單位能耗上相對英特爾與英偉達的計算平臺都占據優勢,但在峰值性能輸出上則被其功耗限制。當前的情況是,自動駕駛公司的很大一部分“安全感”仍然來源于自動駕駛芯片的絕對計算力,驍龍SoC又并非為ADAS專門打造的計算平臺,因此想要打開市場,面臨的阻力不小。 對于這個問題,高通去年10月宣布收購了全球最大的汽車半導體廠商恩智浦(當然不僅僅是因為ADAS)。 恩智浦2016年在全球汽車半導體市場的份額高達14.6%。在被高通宣布收購之前,恩智浦就推出了ADAS專用芯片S32V234,主要用于處理視覺信號,可同時處理兩路視頻。值得一提的是,考慮到ADAS對安全性的要求,S32V234在設計之初就加入了ECC(錯誤檢查與糾正),FCCU(故障收集與控制單元)等安全機制。 而后在此基礎上,恩智浦發布了BlueBox車載電腦,內部除了搭載S32V234芯片,還加上了應用8核A72的高性能處理器LS2088以及其他傳感器芯片,除了支持ADAS,還能夠實現多傳感器數據的融合。恩智浦當時稱,BlueBox能夠為L4級別的自動駕駛提供運算支持,而功耗不超過40W。 作為全球最大的車載半導體廠商,與車廠、供應商有著緊密的聯系。某種意義上,高通的這一次對恩智浦的收購與英特爾對Mobileye的收購有著異曲同工之妙——直接買一個行業領頭羊來開辟新業務。只是恩智浦470億美元的價格,比Mobileye高得多。 但一個壞消息是,高通對恩智浦的收購并不一帆風順,雖然美國在今年4月爽快地通過了許可,但歐洲人比較謹慎。這個月歐盟的反壟斷調查機構再次暫停了對收購案的審查,理由是”雙方披露的關鍵性細節仍然不夠多”。交易遲遲未能完成,高通便無法同恩智浦作為一個整體施行其戰略。作為對比,今年3月才宣布的英特爾對Mobileye的收購,上個月已經正式完成了。 好在,高通還有一張王牌可打——V2X車聯網。今年9月4日,高通推出新一代V2X通信芯片組9150 C-V2X,符合3GPP標準,同時支持4G與5G網絡,能夠實現車對車(V2V),車對基礎設施(V2I),車對行人(V2P)三種場景的通信。并且該芯片組無需SIM即可實現通信。 作為實力強大的通信方案商,高通一直在著力推動C-V2X標準的落地。一方面通信產業是其老本行、安身立命之所。另一方面,在車輛終端計算上不太被信任的高通,可以通過這樣的方式,揚長避短——如果在自動駕駛車輛計算平臺上由于功耗、成本限制遭遇瓶頸或是被競爭對手阻擊,那么通過5G的高速傳輸特性,將數據送至云端處理再快速下發,通過發達的車聯網來實現自動駕駛。如果這一邏輯成立,那么高通將在云計算領域投入更多以提供云端的計算支持。 但對高通來說,當務之急仍是對恩智浦的收購需要快些完成。 三、其他玩家:不容小覷的潛藏力量 在自動駕駛的計算芯片戰場上,英偉達通過GPU生態的先發優勢建立起了壁壘。而攻擂者英特爾與高通,則通過大手筆的收購,希望快速切入自動駕駛芯片市場。但這三個公司雖然是這個市場中實力最強的天王,但有許多地頭蛇,雖然關注度不及三大公司,但其實力也不容小覷。 比如英飛凌。英飛凌作為老牌的半導體廠商,一直也和汽車行業保持著緊密的聯系,為它們提供著車載娛樂信息芯片。在2015年,英飛凌也針對ADAS市場,給出了自己的芯片組Real 3 3D,可實現司機疲勞檢測等功能。而在奧迪新A8使用的zFAS自動駕駛計算單元中,也使用了英飛凌提供的Aurix芯片,A8最關鍵的Traffic Jam Pilot,是由這塊芯片最終實現的。 另外說到自動駕駛,必然要給谷歌留一個席位。盡管谷歌從來沒有對外透露過自家用的是何種芯片,但日前英特爾CEO科再奇的一封信卻聲明,英特爾在9年前開始與谷歌的自動駕駛項目合作,為其專門打造了計算芯片。 更詳細的信息隨后被披露。谷歌的方案使用了英特爾提供的至強處理器,以及Altera提供的Arria FPGA芯片,和英特爾家的XMM通信芯片,這與英特爾提供給其平臺之上合作伙伴的組件類似。但有意思的是,對于谷歌是否加入了英特爾搭建的聯盟,英特爾方面卻沒有回應。 另外,負責推斷的部分是由誰負責,究竟是英特爾的芯片,還是英偉達的GPU,或是谷歌自家的TPU,都不明朗。需要說明的是,谷歌的TPU,就是一種專用于推斷階段的ASIC。當然,在其第二代Cloud TPU上,谷歌也為其增添了深度學習訓練的能力。 而國內的自動駕駛初創公司地平線機器人,則透露近期會推出其首款處理器“盤古”。雖然”盤古“頭上更多的名號是AI芯片,但從公開的消息來看,盤古的核心能力是基于深度學習對大規模的圖像進行處理。 而在今年一月,地平線與英特爾合作,在后者的Altera FPGA芯片之上集成了自家的深度神經網絡IP,做出了一套ADAS系統。以地平線本身對自動駕駛業務的看重,“盤古”顯然是要重點應用在自動駕駛之上的。 但國內并非只有創業公司在準備著自家的自動駕駛芯片。今年7月,四維圖新宣布首款ADAS芯片量產。一家圖商怎么就做起了ADAS芯片? 四維圖新這家公司是由軟到硬都切入自動駕駛,一方面在提供高精地圖服務,另一方面四維圖新去年5月收購了聯發科旗下的汽車半導體公司杰發科技。今年3月杰發科技正式過戶到四維圖新名下時,傳出第二季度將推出ADAS芯片的消息。如果讀者留心,會發現四維圖新去年在對外宣傳中愛用的一個說法是“ADAS高精地圖”。 至于這塊ADAS芯片會給誰用?最近兩個月,四維圖新密集地與蔚來、威馬、愛馳億維等新造車公司達成了合作,領域包含車聯網、自動駕駛等。對新造車公司來說,四維圖新提供ADAS芯片和高精地圖“硬件+服務”的支持,豈不美哉? 在主流手機市場已經趨于飽和的當下,各個公司正在試圖結束以手機為核心的移動互聯網時代這個說法。巨頭們、初創們搶奪的下一代終端,正是汽車,并且是自動駕駛的汽車。 在零件多達兩萬個的汽車中,正在掀起新一輪的電子革命,而這些公司,都想成為零部件中,發號施令那一個。 這其中有昔日PC時代的王者,也有移動互聯網時代的龍頭;既有一路見證半導體變遷的老牌公司,也有乘著人工智能之風起舞的初創。齊齊分食自動駕駛萬億大蛋糕。
掃一掃在手機上閱讀本文章