[ EV知道 行業(yè) ]今天很榮幸和黃浴博士在自動(dòng)駕駛方面進(jìn)行深入交流,黃浴博士作為奇點(diǎn)汽車美國(guó)研究與創(chuàng)新中心首席科學(xué)家兼奇點(diǎn)汽車美國(guó)公司總裁,將為我們分享《AI-CAR時(shí)代加速自動(dòng)駕駛落地的路線及解決方案》。
黃?。阂话闾岬阶詣?dòng)駕駛大家會(huì)說(shuō)怎么定義自動(dòng)駕駛,一般按照大家理智的一些標(biāo)準(zhǔn)從L1級(jí)到L2、L3、L4,大家知道L5是我們創(chuàng)造最高等級(jí)的完全自動(dòng)駕駛,我們就不介入了。然后從一級(jí)到二級(jí)最開(kāi)始是輔助型的,如果大家簡(jiǎn)單地理解的話,應(yīng)該說(shuō)一級(jí)基本上可以不用腳,到二級(jí)的時(shí)候可以不用腳或者不用手,到了三級(jí)基本是手腳都不會(huì)用,但是眼睛要盯著。到四級(jí)眼睛不用盯了,到了五級(jí)你就是乘客了,跟司機(jī)沒(méi)關(guān)系了,駕駛方向盤(pán)都不用了,簡(jiǎn)單地就這么理解。
關(guān)于自動(dòng)駕駛研究方向,我們看基本上大家認(rèn)可的大概是兩種,一種是模塊化的方法,就是我們把這個(gè)模塊分成感知、規(guī)劃、決策最后是控制分塊下來(lái)的。有的時(shí)候它會(huì)有地圖傳送給你,這種模塊化的。
另外一種端到端,它是從輸入,你輸入傳感器所有的信號(hào),我輸出就是對(duì)車的控制器。這個(gè)我們一般真正作為自動(dòng)駕駛的公司不怎么喜歡這種方式,因?yàn)橹饕亲詣?dòng)駕駛它作為人工智能的應(yīng)用來(lái)說(shuō),所以它有大量的比較罕見(jiàn)的情況出來(lái),我們一般會(huì)看到一些公司在做這方面的工作,當(dāng)然很少專門做自動(dòng)駕駛技術(shù)的。比如說(shuō)我舉個(gè)例子我賣零件,我賣很多系統(tǒng)給你看,證明我的零件有多強(qiáng)。但是你是做自動(dòng)駕駛是不認(rèn)可的一條路子。
如果按照劃模塊,我認(rèn)為感知是最難的,基本上來(lái)說(shuō)造成大多數(shù)的問(wèn)題都是因?yàn)楦兄膯?wèn)題,到目前來(lái)說(shuō)雖然我們?cè)黾恿撕芏喔兄?,完全超越人類的感知器的話。因?yàn)槿怂挥醒劬?、耳朵,但是可能有激光雷達(dá)、人聲雷達(dá),但是感知并不是萬(wàn)能的,所以造成了自動(dòng)駕駛研發(fā)不斷調(diào)整自己的地方。
因?yàn)閯偛盘岬蕉喾N傳感器,所以傳感器融合是大家認(rèn)可的,因?yàn)闆](méi)有任何傳感器可以獨(dú)當(dāng)一面的。比如說(shuō)攝象頭,它是通過(guò)這種我們看到感光的信息產(chǎn)生圖像里的RGB像素的圖像,它來(lái)做環(huán)境感知的理解、認(rèn)知。不管你是單的相機(jī)還是兩個(gè)相機(jī)還是多個(gè)相機(jī),它都是二維的圖像知識(shí),但是這個(gè)不夠的,所以會(huì)有激光雷達(dá)。我發(fā)出的這種激光出去接受回波,通過(guò)它來(lái)測(cè)距。這樣發(fā)出去的速度和回波力的距離,會(huì)產(chǎn)生一個(gè)非常精準(zhǔn)的三零點(diǎn)。我們?nèi)四芾斫馔昝赖囊粋€(gè)三維空間,讓機(jī)器去理解是一個(gè)重建的問(wèn)題。
另外雷達(dá)也是,雷達(dá)它的分辨率比較低,一般我們說(shuō)只是采取一個(gè)二維平面的一個(gè)測(cè)距、測(cè)速,這樣激光雷達(dá)有一些不足的地方。但是雷達(dá)相比剛才我們提到兩個(gè)傳感器來(lái)說(shuō),它有比較重要的一點(diǎn)就是天氣不影響。不論是下大雨還是雪霧都可以穿透,但是激光雷達(dá)都會(huì)受到干擾,甚至無(wú)法得到正確的數(shù)據(jù)。所以我說(shuō)傳感器融合是大家目前認(rèn)可的一個(gè)自動(dòng)駕駛的感知的一個(gè)方向。
另外它不光是感知,同時(shí)定位也是采取多傳感器融合的方法。
在融合的時(shí)候我們?cè)偌?xì)分一下,融合一般可以分前融合和后融合,前融合指的數(shù)理層融合,甚至在傳感器數(shù)的空間上來(lái)解決,一般比較提前,所以叫前融合;后融合是說(shuō)各個(gè)傳感器單獨(dú)執(zhí)行感知任務(wù),然后在任務(wù)層再進(jìn)行融合。比如說(shuō)我的激光雷達(dá)會(huì)檢測(cè)障礙物,然后我給一個(gè)障礙物信息和軌跡,我們對(duì)攝象頭也會(huì)做同樣的操作。我們兩個(gè)產(chǎn)生的信息最后來(lái)依靠一定的判決機(jī)制來(lái)重合,來(lái)合在一起這個(gè)叫后融合。前融合已經(jīng)做到硬件層了,后融合現(xiàn)在也有很多。比如說(shuō)有時(shí)候我們傳感器并不是你造的,有的時(shí)候是第三方提供的,那個(gè)時(shí)候可能會(huì)走后融合道路。
對(duì)于自動(dòng)駕駛的研究方向來(lái)說(shuō),大家可能都見(jiàn)過(guò)很多公司的一些信息。通過(guò)目前整個(gè)研究態(tài)勢(shì)來(lái)看基本算是兩條方法,第一個(gè)是低成本的方法,一種是高成本的。
低成本主要以特斯拉為主,基本上是攝象頭,另外它也是地圖不怎么看,看的比較輕。重地圖的或者比較高成本的激光雷達(dá),谷歌在美國(guó)任何地方做實(shí)驗(yàn)都會(huì)把地圖先掃出來(lái),在地圖的情況下來(lái)走。像低成本的公司不看重地圖,所以他們的思路有點(diǎn)像漸進(jìn)式的發(fā)展,因?yàn)樗_(kāi)始弱地圖,它可以逐漸添加地圖上去。我們說(shuō)地圖要分清楚這個(gè)地圖的意思,它不是導(dǎo)航地圖,是高分辨圖。比如說(shuō)我們今天從北京的某個(gè)區(qū)到另外一個(gè)區(qū)你走哪一條路,那是導(dǎo)航圖,但是你要在五條車線走哪一條線,這是高清圖,同時(shí)還有交通信號(hào)的信息,車速的信息,有的還加一些路標(biāo)的一些信息進(jìn)去。
對(duì)于這兩種模式來(lái)說(shuō),奇點(diǎn)汽車更適合于走特斯拉的這條路線。另外本身從成本考慮來(lái)說(shuō),激光雷達(dá)高成本路線一般互聯(lián)網(wǎng)公司采的,因?yàn)樗姆椒ㄊ俏蚁氚鸭夹g(shù)做到最好然后進(jìn)入市場(chǎng)。進(jìn)入市場(chǎng)我們也看到是需要一定時(shí)間,但是特斯拉不一樣。特斯拉是我先進(jìn)到市場(chǎng),技術(shù)逐漸的嚴(yán)禁,同時(shí)通過(guò)地圖的信息,通過(guò)我的用戶搜集數(shù)據(jù)慢慢增加我的信息,這條路我認(rèn)為更適合像奇點(diǎn)汽車這種新能源車公司的特點(diǎn)。
自動(dòng)駕駛是很有挑戰(zhàn)性的,一個(gè)是它的問(wèn)題比較高,而且數(shù)據(jù)處理的量非常大。剛才也談到感知這塊非常多,所以它的感知算法不是很完美。另外大家能解決這么復(fù)雜的感知問(wèn)題的時(shí)候,很多時(shí)候是采取數(shù)據(jù)驅(qū)動(dòng),也就是說(shuō)我要大量的數(shù)據(jù)。因?yàn)闆](méi)有辦法建立合理的一個(gè)數(shù)學(xué)模式來(lái)描述它,所以我只能靠數(shù)據(jù)來(lái)逼近,基本上是這個(gè)思路。
當(dāng)然這一個(gè)我們就可以看到在人工智能、在圖像、在原處理甚至包括一些機(jī)器翻譯這些都發(fā)揮了作用,實(shí)際上在自動(dòng)駕駛也一樣。因?yàn)樽詣?dòng)駕駛本身就是有大量的傳感器數(shù)據(jù),所以它扮演地角色是非常大的。比如說(shuō)檢測(cè)、識(shí)別、跟蹤包括駕駛行為的建模,包括有很多公司在做的等等的學(xué)習(xí),比我們模塊化的數(shù)據(jù)量還要多。
這個(gè)圖大家可能見(jiàn)過(guò),這是大概兩個(gè)月前waymo在網(wǎng)上放了一個(gè)360度無(wú)人車環(huán)境感知的一個(gè)視頻,大家可以看到它支持360度全景的播放,你拿鼠標(biāo)可以拖可以轉(zhuǎn)。我轉(zhuǎn)到我這面把結(jié)果拷貝出來(lái),他把人、交通信號(hào)、車都放出來(lái)了。但是大家可以仔細(xì)看,覺(jué)得這個(gè)和我們國(guó)內(nèi)比怎么樣?其實(shí)每一個(gè)環(huán)境的增加,比如說(shuō)你增加一倍,那你放的就不是一倍的增加,可能成指數(shù)的增加。所以現(xiàn)在waymo的測(cè)試,我想它的技術(shù)非常好,從2016年開(kāi)始干了。但是目前它的測(cè)試大家可以看到,它是L4的,他的測(cè)試在美國(guó)的鳳凰城,那個(gè)城市100萬(wàn)人口,那個(gè)跟芝加哥是不能比的。
這是一個(gè)我想描述出來(lái)我們自動(dòng)駕駛的一個(gè)模塊化的結(jié)構(gòu),大家可以看我們從最左邊是我們的環(huán)境,中間這一塊是車身的一些模塊,就是它包括傳感器,甚至包括了車聯(lián)網(wǎng),包括制動(dòng)部分這是硬件。那么軟件部分包括感知、規(guī)劃、控制。感知一個(gè)是對(duì)周圍環(huán)境的理解,另外是對(duì)自身的定位;規(guī)劃分為三層,一層是簡(jiǎn)單地路徑規(guī)劃,A點(diǎn)到B點(diǎn)路徑規(guī)劃,第二是行為規(guī)劃,你是換車道、左拐彎、超車。第三是你的運(yùn)動(dòng)規(guī)劃,直接告訴車你是以什么軌跡來(lái)走,最后把規(guī)劃的東西送到控制部分,控制告訴怎么樣把車按照制定的方式來(lái)走,這里面也分兩種一種是路徑跟蹤一種是軌跡跟蹤,路徑跟蹤是沒(méi)有識(shí)別信號(hào)的,軌跡跟蹤是有識(shí)別信號(hào),所以更加準(zhǔn)確。
最左邊這塊是車身部分,右邊這塊我叫云端部分,比如說(shuō)高清地圖,沒(méi)有哪個(gè)車可以把一個(gè)城市的地圖放到車?yán)锩?。比如說(shuō)以前我們買GPS說(shuō)把美國(guó)地圖放到車上,那是矢量地圖,但是你把高清地圖放在上面那不行,所以放在云端的。這方面的數(shù)據(jù),不管是大公司還是創(chuàng)業(yè)公司他們競(jìng)爭(zhēng)非常激烈。
另外你的感知的模型,因?yàn)槟阕瞿莻€(gè)東西會(huì)放在云端,不一定放在車?yán)?,因?yàn)樗袝r(shí)候需要更新,經(jīng)過(guò)包括自己的車得到新的系統(tǒng),它會(huì)更新。
另外就是規(guī)劃模型,包括我們的駕駛行為,包括路徑規(guī)劃的模型都可以放到上面,還有最后有一些控制模型。車的控制模型通過(guò)數(shù)據(jù)來(lái)優(yōu)化或者個(gè)性化放在上面。
另外還提到一個(gè)是仿真。仿真環(huán)境,大家知道完全靠車上的實(shí)測(cè)數(shù)據(jù)的話,目前來(lái)說(shuō)數(shù)據(jù)搜集能力太慢,比如說(shuō)像谷歌宣布的,它目前已經(jīng)跑到數(shù)據(jù),但是他仿真已經(jīng)跑到,包括新的測(cè)試方法和新的問(wèn)題。比如說(shuō)在實(shí)測(cè)遇到問(wèn)題會(huì)放在仿真環(huán)境里來(lái)調(diào)試我的算法,所以仿真環(huán)境也是成熟的自動(dòng)駕駛所必備的模塊。
這是一個(gè)感知的示意圖,大家看到有雷達(dá)、激光雷達(dá)、攝象頭,其實(shí)還可以看到它的攝象頭也是有環(huán)式的,有單雙的都有。其實(shí)各個(gè)部門所具備的任務(wù)或者扮演的角色有所不同,相當(dāng)于一個(gè)示意圖。還有GPS和慣導(dǎo)這些。傳感器對(duì)于自動(dòng)駕駛,相當(dāng)于你人的眼睛,就是獲取周圍信息一個(gè)方式。當(dāng)然我們希望是數(shù)據(jù)越詳細(xì)越好,或者說(shuō)你獲取的數(shù)據(jù)量越大越好,但是作為自動(dòng)駕駛車來(lái)說(shuō)是實(shí)事處理,必然對(duì)數(shù)據(jù)的優(yōu)選,必然做到?jīng)Q策的東西,不能把數(shù)據(jù)直接挑選放進(jìn)來(lái)。所以感知器多成本高,但更需要的是有一個(gè)比較好的感知算法,能夠充分地利用或者準(zhǔn)確利用傳感器的數(shù)據(jù)。
這塊就是深度學(xué)習(xí)的問(wèn)題,因?yàn)樯疃葘W(xué)習(xí)最近應(yīng)該是12年差不多,在人工智能里面發(fā)展的非常迅速,而且我看到它最早的突破是圖像、視頻和云里。因?yàn)橐郧暗膱D像、音頻都要有特征的提取,因?yàn)槿嗽趺磥?lái)識(shí)別這個(gè)聲音的內(nèi)容?怎么樣來(lái)做到分類,這些大家都在探索。探索方法就是把它變成一個(gè)模識(shí)別問(wèn)題,就是你要做模式,所以你要做一個(gè)特征,在特征里找不管是圖像還是視頻都花了很多年。甚至以云作為最早的成熟,他還要遭遇圖像。因?yàn)槲乙郧笆亲鲇?jì)算機(jī)識(shí)別的,大家真正走到一個(gè)比較好的特征是1998年左右,那個(gè)時(shí)候出現(xiàn)比較好的特征。但是深度學(xué)習(xí)的問(wèn)題解決了這個(gè)困難,因?yàn)樗褪蔷哂刑卣鲗W(xué)習(xí)的能力,它是通過(guò)自主的網(wǎng)絡(luò)模型自己識(shí)別、提取出來(lái)。很多人把這個(gè)叫做特征表述或者特征學(xué)習(xí)的網(wǎng)絡(luò),這個(gè)是有原因的,因?yàn)樗绕湓谝曈X(jué)上扮演了很重要的角色。
這一塊我列了一些,大家看左邊,這些應(yīng)該是深度學(xué)習(xí)訓(xùn)練的時(shí)候的一些小技巧。它其實(shí)來(lái)說(shuō),因?yàn)樯疃葘W(xué)習(xí)對(duì)應(yīng)的是淺度學(xué)習(xí),以前淺度學(xué)習(xí),當(dāng)然一個(gè)是計(jì)算量小,另外一個(gè)它的網(wǎng)絡(luò)訓(xùn)練更容易,深度學(xué)習(xí)它的層越來(lái)越多以后,他的訓(xùn)練內(nèi)容就很容易發(fā)散,很容易就飽和了。因?yàn)槲覀冇?xùn)練知道,它是通過(guò)誤差信號(hào)更新的,有的時(shí)候誤差信號(hào)進(jìn)來(lái)以后網(wǎng)絡(luò)T度就變成零了。所以各種訓(xùn)練的小技巧都要想辦法客服在深度學(xué)習(xí)上的問(wèn)題,這些很多都是非常有名的,因?yàn)樗岢鰜?lái)以后影響到深度學(xué)習(xí)的內(nèi)容。因?yàn)槟阋?xùn)練成好的模型才可以用。
右邊是提到深度學(xué)習(xí)在學(xué)習(xí)的應(yīng)用,因?yàn)槲覀冏鳛閿z象頭的話,我們面臨的問(wèn)題是自動(dòng)識(shí)別的問(wèn)題,最經(jīng)典就是說(shuō)檢測(cè)、分類,再往上推廣做到分割,甚至還可以做到更高層,比如說(shuō)光層、雙路等等方法都可以用它來(lái)取代。包括視覺(jué)的底層,有像素級(jí)的視覺(jué)底層的應(yīng)用,比如說(shuō)可以去噪,可以增強(qiáng),大家看手機(jī)視頻質(zhì)量怎么好,都有一堆算法。但是這些算法也可以借助,也在里頭慢慢取代傳統(tǒng)的。比如說(shuō)它能夠在這個(gè)領(lǐng)域取得更好的質(zhì)量,那么慢慢在工業(yè)界也得到推廣。
深度學(xué)習(xí)其實(shí)發(fā)展,最近幾年可能發(fā)展非???,有一個(gè)原因是比較開(kāi)放,頂級(jí)的科學(xué)家他們最早制定了比較開(kāi)放的原則,所以這幾年發(fā)展非常快也是跟這個(gè)有關(guān)的。
這些算法還有開(kāi)研,以及大家沿革的開(kāi)放態(tài)度是深度學(xué)習(xí)發(fā)展非常快,我們?cè)谧詣?dòng)駕駛里面也可以看到它在里頭我們扮演的作用也是非常多的。其實(shí)不僅僅剛才提到視覺(jué)問(wèn)題,比如說(shuō)障礙物檢測(cè)、跟蹤或者車道線檢測(cè),包括駕駛區(qū)域的檢測(cè)。比如說(shuō)我在沒(méi)有車道線,沒(méi)有任何標(biāo)志的路上我怎么找到我的駕駛區(qū)域,這些現(xiàn)在都可以做。場(chǎng)景分割,分出是街道,是大樓都是可以做的。但是特別要提到的就是它還做很多我們以前可能都不怎么去想的,比如說(shuō)它可以做傳感器融合,可以做傳感器數(shù)據(jù)的標(biāo)的或者我們叫做校準(zhǔn),大家把它融合在一汽就解決坐標(biāo)器的校準(zhǔn)問(wèn)題。大家也看到很多公司在講這個(gè),有一家公司它可以做深度學(xué)習(xí)來(lái)做數(shù)據(jù)融合。同樣來(lái)說(shuō)也可以在駕駛行為、反饋控制方面通過(guò)大量的數(shù)據(jù)來(lái)反映算法的性能。
這是去年下半年出現(xiàn)的一篇文章,我把它列出來(lái)的原因,它是做車箱頭的車輛檢測(cè),我把它列出來(lái)原因是因?yàn)樗械牡胤襟w現(xiàn)出深度學(xué)習(xí)的特點(diǎn)。它上面其實(shí)是實(shí)現(xiàn)了三層網(wǎng)絡(luò),它不光是二維的,它審議可以提取出三維的設(shè)想的姿態(tài)。右上角的方位,它還有一些車的模型,這樣他把模型和深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)合起來(lái)。然后你可以看到比傳統(tǒng)的方法要高,因?yàn)樗至巳龑硬粩嗟赝锩嫣岚笖?shù)據(jù)。當(dāng)然以后大家期望的幾個(gè)大腕的說(shuō)法,他們期望以后深度學(xué)習(xí)是不需要監(jiān)督的,希望它能夠像人一樣自己學(xué)習(xí)。但是在目前這樣,大家還是不太去用。如果說(shuō)完全的非要數(shù)據(jù)可控性就比較差了,我一般在看見(jiàn)他們用的話一般是帶有這種標(biāo)的數(shù)據(jù)的。
所以我們對(duì)自動(dòng)駕駛的期望盡可能產(chǎn)品化和商業(yè)化落地,奇點(diǎn)汽車的原則就是能夠和不同的合作伙伴在不同的策略上進(jìn)行合作。而且我們主張“以人為本”的思路,滿足個(gè)性化的需求。其實(shí)在自動(dòng)駕駛可以看到,在整個(gè)訓(xùn)練數(shù)據(jù),得到駕駛的數(shù)據(jù)之后,我們的模型是數(shù)據(jù)化的。因?yàn)榇蠹抑滥贻p人和老年人駕駛習(xí)慣是不同的,有些人就喜歡比較激進(jìn)的駕駛,而老年人更喜歡溫馨、舒適,和他經(jīng)過(guò)的路段、選擇的區(qū)域也不一樣。而且只有通過(guò)大數(shù)據(jù)的學(xué)習(xí),通過(guò)數(shù)據(jù)的用戶掌握才能做到這一點(diǎn),這也是滿足個(gè)性化需求的方法。
這是我們奇點(diǎn)汽車研發(fā)與布局,其實(shí)我們每年基本上是在自動(dòng)駕駛整個(gè)的各個(gè)方面來(lái)進(jìn)行統(tǒng)一的領(lǐng)導(dǎo)。然后蘇州是最近剛剛宣布了,會(huì)做一個(gè)全額的研發(fā)中心,現(xiàn)在在上海X-LAB也在布局,北京就是主要做ADAS產(chǎn)品開(kāi)發(fā)的,我們把這些資源整合統(tǒng)一在我們今后產(chǎn)品落地上進(jìn)行布局。
這是我們自動(dòng)駕駛的研發(fā)的示意圖,可以看到感知器,我們配和8個(gè)相機(jī)、12個(gè)超聲波和5個(gè)毫米雷達(dá)。我們的計(jì)算平臺(tái)是達(dá)到它的計(jì)算平臺(tái)的能力是非常強(qiáng)的。還有基于我們自己自主的一些控制系統(tǒng)可以來(lái)支持我們整個(gè)自動(dòng)駕駛的底層的需要。
我們的技術(shù)路線基本上是漸進(jìn)升級(jí)式,我們從2級(jí)先落地,然后逐漸我們是升級(jí)以后進(jìn)入3級(jí)的自動(dòng)駕駛的目標(biāo)還有長(zhǎng)遠(yuǎn)的話我們是走4級(jí)來(lái)發(fā)展。整個(gè)迭代因?yàn)槲覀兊挠布h(huán)境,基本上包括感知的環(huán)境都已經(jīng)支持四級(jí)的需要,只是在軟件上需要進(jìn)行升級(jí)。
這是我們目前感知的一個(gè)布局圖。大家可以看到12個(gè)超聲波,5個(gè)毫米波和8個(gè)相機(jī)。今后我們奇點(diǎn)汽車主要是自主研發(fā)+第三方合作的方式。我們今后是在明年能夠在明年進(jìn)行L3的自動(dòng)駕駛,送到我們用戶車上去。
記者:我想問(wèn)一下現(xiàn)在中國(guó)也開(kāi)放了,北京、深圳都開(kāi)放了一些實(shí)際注冊(cè)的一些城市和產(chǎn)地,奇點(diǎn)汽車有沒(méi)有實(shí)地注冊(cè)的計(jì)劃?
黃浴:這個(gè)我們是有的,我們現(xiàn)在今年比如說(shuō)量產(chǎn)落地是支持L2,我們的L2的測(cè)試已經(jīng)在進(jìn)行。然后對(duì)L3的研發(fā)在今年年底就會(huì)開(kāi)始測(cè)試,按照我們的計(jì)劃明年應(yīng)該量產(chǎn)落地,不僅是在中國(guó),在美國(guó)也會(huì)開(kāi)始進(jìn)行測(cè)試工作。
記者:對(duì)于本土化來(lái)講,你認(rèn)為從L2到L3乃至L4最大的挑戰(zhàn)和阻礙是什么?
黃?。?/strong>我覺(jué)得L2的話基本上按照一些模塊比較分割,比如說(shuō)ACC或者說(shuō)LK這些模塊比較分割,然后實(shí)際上稍微一有什么特殊情況就會(huì)退出。比如說(shuō)ICC它的控制跟LK實(shí)際上是不一樣的,一個(gè)是控制方向盤(pán),一個(gè)是控制油門,一個(gè)是橫向一個(gè)是縱向。還是因?yàn)樗惴ú惶粯?,L3是手腳都放開(kāi),我舉個(gè)例子比如說(shuō)跟車,如果跟前面的車,可能有的時(shí)候不光是車道線的保持問(wèn)題,也不光是自身調(diào)整車速的問(wèn)題,還有對(duì)方比如換車道。因?yàn)槿绻麑?duì)方違規(guī)了,你不能違規(guī),比如說(shuō)你要識(shí)別限速,要識(shí)別紅綠燈。當(dāng)然最早開(kāi)始是在高速上先做到L3,如果對(duì)方超速了你也不能就超速。這些來(lái)說(shuō)L3的綜合能力要比L2好,L2模塊化割裂比較多,L3用戶的體驗(yàn)會(huì)更好。
記者:因?yàn)榍耙欢螘r(shí)間無(wú)人駕駛致人死亡的事件,大家對(duì)于無(wú)人駕駛的安全問(wèn)題非常重視,覺(jué)得安全問(wèn)題很關(guān)鍵。如果你覺(jué)得無(wú)人駕駛安全哪一方面是最重要的,如果做到安全的話。
黃浴:安全是一個(gè)很重的話題,造車企業(yè)以前一直講安全。所以首先要考慮被動(dòng)安全,還有主動(dòng)安全,就是說(shuō)你能夠預(yù)防你的危險(xiǎn),說(shuō)白了你追尾的原因是車速和距離造成的。那你對(duì)任何的一個(gè)事件的預(yù)測(cè)性越早你越能避免它。你比如說(shuō)剛剛你提到Uber這個(gè)事情,它剛才公開(kāi)感知數(shù)據(jù),Uber只是提供了行車記錄的一個(gè)視頻給大家看。我們知道Uber車頂上有4000個(gè)激光雷達(dá),至少有3個(gè)方向的攝象頭。應(yīng)該說(shuō)Uber哪個(gè)地方有問(wèn)題還沒(méi)有公布,我們猜測(cè)行人穿行第三條車道線在第四條車道線被撞了。很多時(shí)候大家采用的安全性不夠,就是UBER更加激進(jìn)一些,你看到車開(kāi)的時(shí)候它的車非常謹(jǐn)慎,他左拐彎比人的機(jī)制性差很遠(yuǎn),它半天拐不過(guò)去,因?yàn)樗o安全鑒定測(cè)的非常大。所以在測(cè)試L4這個(gè)級(jí)別的時(shí)候,大家有時(shí)候必然會(huì)考慮到計(jì)算的復(fù)雜度和安全的線的問(wèn)題,我相信Uber的線做的比較低,造成它過(guò)于激進(jìn)造成這種事。
但是我們從L2到L3,我們的安全設(shè)置是擺在第一位的,還有一個(gè)信息安全和網(wǎng)絡(luò)安全。我們有360安全的專家,我們對(duì)車聯(lián)網(wǎng)的安全,對(duì)信息的安全也非常重視。
記者:現(xiàn)在深度學(xué)習(xí)它應(yīng)該是一個(gè)不斷地過(guò)程,跟我們老司機(jī)一樣每人都會(huì)在路上發(fā)現(xiàn)新的狀況,我們的回饋機(jī)制是什么?是我現(xiàn)在要去搜集信息,從那么多的數(shù)據(jù)里面取一個(gè)數(shù)據(jù)。
黃?。?/strong>這個(gè)題目是很大的,首先第一個(gè)我們的研究實(shí)際上是盡可能獲取用戶的數(shù)據(jù),比如說(shuō)我們模式那種靠自己的數(shù)據(jù)測(cè)去采集,所以我們相當(dāng)于用戶在進(jìn)入人工駕駛,我們采用的實(shí)際上是大家所謂公開(kāi)的說(shuō)法是引增模式(音)。獲取你的駕駛數(shù)據(jù),其實(shí)你在學(xué)我們?cè)趯W(xué)你。剛才我提到感知的問(wèn)題比較多,我們獲取大量的感知數(shù)據(jù),同時(shí)我們做定位的判斷等,同時(shí)有時(shí)候我們會(huì)出現(xiàn)一個(gè)虛擬的東西,它有時(shí)候沒(méi)有障礙物我們謊報(bào)了障礙物,而司機(jī)做出了殺車的行為。我們影子模式系統(tǒng)出現(xiàn)不同的我們都把它作為一個(gè)例子。
大家知道機(jī)器學(xué)習(xí)是深度學(xué)習(xí)的一部分,再一個(gè)分類空間上得到一個(gè)劃分,劃分的原理是讓這個(gè)間距越大,但是對(duì)于某些靠近那個(gè)帶有一定保護(hù)性,是對(duì)你的系統(tǒng)是有挑戰(zhàn)性的。一般對(duì)機(jī)器學(xué)習(xí)系統(tǒng)更新,大家更看中于。而我們?cè)谏疃葘W(xué)習(xí)上要考慮的問(wèn)題,如果出現(xiàn)我們的錯(cuò)誤,那這些數(shù)據(jù)也會(huì)作為進(jìn)入我們的云端讓開(kāi)發(fā)人員這種數(shù)據(jù)送去然后進(jìn)行更新,這是一種比較好的一種OTA的學(xué)習(xí)方式。
記者:剛才您說(shuō)使用到特斯拉的路線,我們?cè)趺聪蛴脩糇C明我們比特色拉更安全呢?第二個(gè)問(wèn)題,你講到會(huì)開(kāi)放L3的功能,這個(gè)L3的功能是基于軟件更新嗎?因?yàn)橹拔覀兛吹胶孟裢嘎缎畔⒄f(shuō)在車上有給激光雷達(dá)預(yù)留位置,會(huì)留激光雷達(dá)嗎?第三個(gè),我們講大數(shù)據(jù)是融合的概念,我們?nèi)ズY選有價(jià)值的數(shù)據(jù)這個(gè)功能怎么完成的?
記者:剛才您說(shuō)使用到特斯拉的路線,我們?cè)趺聪蛴脩糇C明我們比特色拉更安全呢?第二個(gè)問(wèn)題,你講到會(huì)開(kāi)放L3的功能,這個(gè)L3的功能是基于軟件更新嗎?因?yàn)橹拔覀兛吹胶孟裢嘎缎畔⒄f(shuō)在車上有給激光雷達(dá)預(yù)留位置,會(huì)留激光雷達(dá)嗎?第三個(gè),我們講大數(shù)據(jù)是融合的概念,我們?nèi)ズY選有價(jià)值的數(shù)據(jù)這個(gè)功能怎么完成的?
黃?。?/strong>我們希望能夠提供給用戶比較可靠的算法,讓用戶放心的去用,對(duì)安全性來(lái)說(shuō),我想安全性非常重要,同市場(chǎng)的宣傳來(lái)說(shuō)要給大家一個(gè)比較積極的認(rèn)識(shí),因?yàn)樗⒉皇荓4,連L3都不是沒(méi)有做出一個(gè)完整的L3出來(lái)。
記者:就是對(duì)于奇點(diǎn)來(lái)說(shuō),在這個(gè)方面我們?cè)趺刺嵝延脩簦咳绻脩舨唤庸?,這個(gè)車會(huì)怎么樣呢?在產(chǎn)品定義上。
黃?。?/strong>車規(guī)定義很多比較明確了,一旦不滿足會(huì)自動(dòng)退出,無(wú)非達(dá)成謹(jǐn)慎說(shuō)這個(gè)狀態(tài)已經(jīng)退出了。目前從L2的體驗(yàn),比如說(shuō)我說(shuō)LPA,ACC或者是其他一些輔助的一些功能。我覺(jué)得對(duì)我們來(lái)說(shuō)我們所給用戶的就是明確告訴你這個(gè)功能已經(jīng)退出,實(shí)際上在L2,人沒(méi)有完全脫離控制,不管是用腳還是用手,L2的警告應(yīng)該是更加明確,比L3更加直接。
記者:明年推出L3只是做基于軟件升級(jí),會(huì)有激光雷達(dá)嗎?
黃?。?/strong>我們目前沒(méi)有激光雷達(dá),激光雷達(dá)現(xiàn)在的價(jià)格,雖然很多公司在講自己的故激光雷達(dá)在量產(chǎn),但是我們有明確的信息可以證明他們得到大量的量產(chǎn)。我們做的是機(jī)械式的,價(jià)格還是比較高,在短期明年內(nèi)沒(méi)有激光雷達(dá)。
記者:沒(méi)有激光雷達(dá)的L3能夠保證它的安全性嗎?
黃?。?/strong>果我們看到激光雷達(dá)比較多的公司,比如說(shuō)谷歌、百度,應(yīng)該說(shuō)激光雷達(dá)第一個(gè)作用就是它能夠建立高清地圖,第二個(gè)作用它能夠完全用自己產(chǎn)生的三維點(diǎn)來(lái)做障礙物的檢測(cè)和分類。從目前的技術(shù)來(lái)講,低成本的我們聊了這個(gè)也是可以做的。你說(shuō)在某些情況,你比如說(shuō)在夜晚的燈光比較暗的情況下,應(yīng)該說(shuō)激光雷達(dá)不受影響的,激光它是周圍越暗對(duì)它越好。比如說(shuō)車道線檢測(cè),對(duì)于夜晚來(lái)說(shuō)激光雷達(dá)檢測(cè)車道線,它是按照光線來(lái)判斷的。比如說(shuō)你用64線的激光雷達(dá),因?yàn)榧す饫走_(dá)是輻射性掃出去的,基本上在100米以外的話,它能掃到一個(gè)人是非常小,做行人判決多半是在50米左右。你可以看到為什么那些用激光雷達(dá)的公司,比如說(shuō)在三番做測(cè)試的時(shí)候經(jīng)常對(duì)一盆花做測(cè)試,比如說(shuō)把樹(shù)枝伸出來(lái),他都沒(méi)有辦法判斷。激光雷達(dá)對(duì)于天氣還是沒(méi)有辦法判斷,比如說(shuō)大雨情況下,下雨、下雪都沒(méi)有判斷。激光雷達(dá)的更新速度是在10赫茲,毫米雷達(dá)70到80赫茲,激光雷達(dá)也不是最好的傳感器。
記者:黃博士你好,剛才你的主題是AI-CAR時(shí)代,想讓你分享一下除了技術(shù)之外,未來(lái)的一個(gè)體驗(yàn)是什么樣的?
黃?。?/strong>未來(lái)自動(dòng)駕駛在AI-CAR時(shí)代的體驗(yàn)。我相信是兩點(diǎn),也是我們沈總以前一直說(shuō)的,智能包括兩部分,一部分是講的智能聯(lián)網(wǎng),比如說(shuō)像以前出現(xiàn)的智能手機(jī)一樣,它會(huì)出現(xiàn)一個(gè)平臺(tái),這個(gè)平臺(tái)是移動(dòng)平臺(tái),可以在上面客戶,可以在上面娛樂(lè),通過(guò)車可以帶你所去的地方,比如說(shuō)你去過(guò)的任何軌跡、時(shí)間地點(diǎn),就像互聯(lián)網(wǎng)很多數(shù)據(jù)都手機(jī)了。越是手機(jī)你的數(shù)據(jù),我們可能提供更加可靠的服務(wù),這是一個(gè)車聯(lián)網(wǎng)從車作為一個(gè)品牌來(lái)考慮。
從自動(dòng)駕駛,自動(dòng)駕駛做成以后會(huì)對(duì)整個(gè)社會(huì)產(chǎn)生巨大的影響。很多人并不愿意買車,呼車和共享都很方便。同時(shí)大家可以看到很多業(yè)務(wù)都會(huì)受到影響,比如說(shuō)旅館業(yè)、餐飲業(yè)都會(huì)受到影響,以后的餐廳可能是活動(dòng)的餐廳,比如說(shuō)會(huì)議可能就一個(gè)移動(dòng)的車?yán)镞M(jìn)行了。我認(rèn)為自動(dòng)駕駛和智能車對(duì)社會(huì)的影響都會(huì)非常大。
記者:能不能多透露一點(diǎn)奇點(diǎn)團(tuán)隊(duì)在自動(dòng)駕駛上面,會(huì)提供更加量化的數(shù)據(jù),包括里程的規(guī)模、數(shù)據(jù)的規(guī)模大概人工干預(yù)的頻率量化的指標(biāo)。另外一個(gè)是我們8個(gè)攝象頭大概有5個(gè)放在前面后視鏡那個(gè)方向,這是我見(jiàn)過(guò)最多最集中的,能不能給我們講解一下。
黃?。?/strong>剛才您提到公開(kāi)數(shù)據(jù),我想我們?cè)诤线m的時(shí)候會(huì)公布的。作為一個(gè)公司來(lái)說(shuō),我們畢竟是做產(chǎn)品的,我們?cè)诤线m的時(shí)候會(huì)公布自己研發(fā)的指標(biāo)或者什么的。另外,你剛才提到8個(gè)攝象頭,它一般是前方的攝象頭主要是來(lái)做障礙物檻車,然后做交通標(biāo)志、信號(hào)燈識(shí)別。側(cè)面的攝象頭一般做車換道的時(shí)候,檢測(cè)側(cè)方有沒(méi)有出后面車道線,甚至還有當(dāng)我們做自主爬車的時(shí)候能夠幫助你來(lái)實(shí)現(xiàn)爬車需要的感知任務(wù)。
記者:我問(wèn)黃博士一個(gè)問(wèn)題,你講到特斯拉和谷歌為代表的自動(dòng)駕駛的,最終他們可靠性上會(huì)做哪些標(biāo)準(zhǔn)?
黃浴:從目前看來(lái)說(shuō),特斯拉基本上是反對(duì)這種做法。我覺(jué)得成本高是一個(gè)很大的因素,另外激光雷達(dá)也不是很完美的。像谷歌自己研發(fā)128線的激光雷達(dá),它可以來(lái)調(diào)整,比如說(shuō)我需要對(duì)很遠(yuǎn)處的地方再一個(gè)窄的區(qū)域里面做成三個(gè)足球場(chǎng)的檢測(cè)距離。我相信谷歌這方面能力很強(qiáng),他們的軟件都是自研發(fā)的,他們的硬件包括毫米雷達(dá)都是自己做的,這個(gè)別的公司都沒(méi)有這么強(qiáng)的研發(fā)實(shí)力。
至少大家能夠進(jìn)入這個(gè)車的市場(chǎng),有自己的用戶,這一點(diǎn)我覺(jué)得比較支持特斯拉的做法。目前你想做了快八年,快十年仍然只是在鳳凰城里做一個(gè)小范圍的試用的話,這個(gè)可能不是一般東西能承受的了。
記者:我想問(wèn)據(jù)我了解VIVO在鳳凰城做的可能達(dá)到L4的駕駛,這是他們有很全的高清地圖的數(shù)據(jù)。我的問(wèn)題是電子汽車本身是跟哪些公司有合作?第二是在選擇路測(cè)的城市和地點(diǎn)有沒(méi)有什么依據(jù)?
黃?。?/strong>地圖我們是有考量的,不管是高清地圖,還有包括GPS,比如說(shuō)千尋網(wǎng)絡(luò),包括地圖也不僅僅是激光雷達(dá)的地圖。我們的模式剛才比較輕地圖模式,所以更加傾向于特斯拉的路線。我們不光是依賴傳統(tǒng)的導(dǎo)航地圖,同時(shí)我們也會(huì)依賴用戶搜集的這些數(shù)據(jù),幫助我們?cè)黾痈郊拥男畔⒒蛘呤歉郊拥男畔樱热缯f(shuō)視覺(jué)層或者是語(yǔ)意層。實(shí)際上點(diǎn)云那一層應(yīng)該是高清地圖比較高的一層,有的公司它實(shí)際上像大家提供的服務(wù)可能是在云一層或者是識(shí)別層,包括千尋網(wǎng)是用RT技術(shù),比如說(shuō)在同等服務(wù)層在R級(jí)或者靈敏級(jí)的應(yīng)用。我們對(duì)車的定義是主導(dǎo)多傳感的技術(shù),不管是攝象頭、RTK,慣導(dǎo)這一層。
記者:其實(shí)在大屏幕上看到這么多的雷達(dá)、傳感器,做到一個(gè)從零到一,我能解放一下駕駛者精力的問(wèn)題,駕駛疲勞程度的問(wèn)題。我們?nèi)绾巫龅竭@么多自動(dòng)駕駛的車?yán)锩妫幸粋€(gè)個(gè)性化跟其他品牌不一樣。
黃?。?/strong>我們的個(gè)性化還是比較強(qiáng)調(diào)在OTA中能夠有一些對(duì)用戶的關(guān)心,剛剛提到的你的駕駛行為以及對(duì)你更合適的一種駕駛的動(dòng)作或者是控制的一些東西,我們學(xué)的會(huì)更加像,更舒適。比如說(shuō)中年人的駕駛習(xí)慣和年輕人有很大不同,不管是換道還是左轉(zhuǎn)彎都不一樣,包括比如說(shuō)香港、日本都是左行或者右行,這些都不太一樣。我們會(huì)通過(guò)這些用戶數(shù)據(jù),更加能夠讓你的自動(dòng)駕駛更加舒適,應(yīng)該說(shuō)像你學(xué)習(xí)也對(duì),像一個(gè)老司機(jī)學(xué)習(xí)也對(duì)。這種方法當(dāng)然我們也有我們自己自身的車聯(lián)網(wǎng)以及中控各方面,我們自研的這種設(shè)備的這些技術(shù)。我想對(duì)一個(gè)新造車公司來(lái)說(shuō),我們?cè)诖髷?shù)據(jù)、自動(dòng)駕駛和車聯(lián)網(wǎng)整個(gè)綜合這方面,我們應(yīng)該是能夠和其他的一些造車的不太一樣。
自動(dòng)駕駛技術(shù)日益發(fā)展,很多科技公司和廠家都宣布達(dá)到了L3或者L4級(jí)別,然而在真實(shí)使用過(guò)程中還會(huì)遇到很多問(wèn)題。這點(diǎn)在奇點(diǎn)汽車的自動(dòng)駕駛研發(fā)過(guò)程中,不會(huì)盲目夸大自動(dòng)駕駛能力,而是從技術(shù)入手不斷更新自己的軟硬件實(shí)力,讓用戶更加相信現(xiàn)有技術(shù)帶來(lái)的便捷。
發(fā)表我的評(píng)論
網(wǎng)友熱評(píng)
最新評(píng)論