蘋果、微軟、華捷艾米的新一代AR芯片同步量產,席卷全業的巨變即將到來。
北京北五環,占地2.9平方公里的中關村軟件園區內,分布著國內外600家高科技公司的總部和研發中心。
2017年,這片園區貢獻了超過2000億的產值,每平方公里的產值高達805億,單位密度產出依舊居全國首位。
智慧和財富在此交匯,行色匆匆的路人,思緒里或許正激蕩著改變你我生活方式的新東西。
2月,我們在這片園區拜訪了華捷艾米的團隊。本次到訪出于一則留言——稍早前,我們的一篇文章里提到了商湯科技、曠視等專攻“計算機視覺”的企業。這兩家風頭正勁的企業,分別于2017年拿下了4.1億美元和4.6億美元的新輪融資;即便放大到整個資本市場,他們的估值體量也位列第二集團,僅次于小米、滴滴、螞蟻金服、美團等超級獨角獸。
文章發布后,有業內人士留言提醒我們:在計算機視覺、乃至AI+AR領域,真正有望于芯片做出巨大突破的國內企業,或許并不在文章的名單之中,同時還提到了默默攻關技術的華捷艾米,并“提醒”我們不要“人云亦云”。
華捷艾米是誰?它憑什么被這樣認可?獲知信息后,我們認真查閱已公開資訊,得到兩條比較關鍵的產業信息:2018年6月左右,3家企業的手機芯片即將實現量產,分別是微軟、蘋果和華捷艾米。而在全球范圍內,也僅有這3家公司具備完整的智能AR技術體系(包括人物提取、骨架識別技術和動作跟蹤技術等)。
這堪稱驚人的信息背后,到底隱藏著一家怎樣的至今不廣為人知的公司,為了揭開它神秘的面紗,我們趕往了華捷艾米的北京總部,并在那里看到了“AI的眼睛”。
對于AI(人工智能),很多人早已審美疲勞。從沒有哪項技術像AI一樣,還未真正面世,便挑起軒然大波。輿論每天都面臨AI新聞的密集轟炸,但深刻改變生活的AI技術從未到來。
從企業到市場,AI劃過了一條涇渭分明的線。
幾乎所有大型的科技企業,都在為之展開“軍備”競賽:上游產業鏈的英偉達,由GPU芯片更迭至AI芯片后,市值在2年內翻了10倍;中游的亞馬遜,幾乎將“深度學習”融入了產品的每個環節,成為AI市場的最大贏家;谷歌瘋狂燒錢,隔三差五便爆出革命性的AI黑科技,但始終停留在新聞階段;國內,百度正式轉型為AI公司,阿里和騰訊為之持續并購;BAT之外,一眾初創公司打著AI的理念,產品沒成熟,便收獲了天價估值……
這些企業努力描繪著AI震撼人心的應用場景,但民眾認知中的AI卻是另一幅景象:幾年來,除了吊打各路英杰的“阿爾法狗”,鮮有其他具象且具影響力的AI成果出現。基于這份落差,甚至有人將人工智能稱為“人工智障”:吹起來比天大,學啥啥不行。
到底什么是AI?它什么時候才能改變我們的生活?這個宏觀的問題,可以做如下總結:
從發展階段看來,AI可簡單分為三類:弱AI、強AI,以及超AI。
弱人工智能是擅長某個單方面的AI,比如阿爾法狗能把柯潔打到崩潰,但你要讓它識別動物,它也得崩潰。弱AI的范疇相當廣,只要涉及歸納、運算,并得到自動化結果的,都屬其中。比如百度依托大數據,根據你的興趣推了條新聞,這就算弱AI;亞馬遜的無人機自動識路送貨,算弱AI;波士頓動力的Atlas機器人一個炫酷到爆炸的后空翻,同樣只算弱AI。
目前以及未來一段時間可見的,所有關于人工智能的研發與成果,都只能算是弱AI。普通民眾想象中的人工智能,包括終結者、星球大戰等虛構事物,都是強AI和超AI。強AI指的是人類級別的人工智能,超AI則指在幾乎所有領域都比最聰明的人類還聰明,代表AI終極形態的人工智能。
即便是弱AI領域,成果的差別也堪稱巨大,個性推送和無人駕駛顯然無法類比,后者涉及的計算機視覺、深度學習以及數據統籌的難度是前者的幾何倍數。
一言以蔽之,部分AI已經作用于我們的生活,但是效果不明顯;而那些效果明顯的,比如高智能機器人、無人駕駛等,離我們還很遙遠。
現在的AI大環境,更像是一個“有機分裂”的整體,不同公司、細分行業,研究的是弱AI的某個點,而這些點最終、也必然會結合成為強AI,徹底顛覆人們的生活。
引用學術界的觀點就是:現在的弱人工智能就是地球早期的氨基酸,它們會在某一天突然組合進化成為生命。至于這一天是什么時候,誰也說不準。
在弱AI“進化”的過程中,有一個經典的認知誤區:那些你認為很難的,對于電腦而言巨簡單,而那些你認為特“弱智”的,對于電腦而言巨TM難。
比如,解一套微積分題,電腦可以秒出結果;但識別放在面前的是一棵小樹還是一株大草,對于電腦而言則極端困難;架構一套金融市場的策略模型,對它來說輕而易舉;而讀懂幼兒的圖書、真正理解各種詞意——谷歌為此花了幾十億美元,還沒做出來。
人類覺得特別容易的事情——視覺、動態、移動,甚至直覺,對于電腦而言難于登天。伸手拿起一件東西,是人類在經過幾億年的進化后,不需要思考便能完成的事情。我們有著全宇宙已知的最復雜的東西——人腦,各處肌肉和關節、以及視覺,在人腦的指揮下瞬間配套完成各種物理工作,這是人類的本能。
這種本能,對于電腦而言恰恰是最難的——現在的電腦連網站的驗證碼都看不懂,能分辨貓狗的計算機,就能稱得上“超級”AI。
看懂、聽懂都做不到,怎么能進化成強AI?因此,弱AI的首要難點,便是解決包括計算機視覺在內的各類“基礎”問題。
AI從看、思考到做出反應,是一個非常復雜的工程。業內反復強調的“深度學習”、“增強學習”、“大數據”等,在這個工程里是相輔相成的,真正有價值的研究均離不開其支撐。而在這些之下,最最關鍵的則是邏輯原理和核心算法。
世界的盡頭是物理,物理的盡頭是數學,這句話同樣適用于AI。AI的突破基于邏輯的支撐和算法的突破,在這個基礎上,“喂食”數據才有意義。比如,你教會了電腦如何對比、歸納總結一萬條狗的特征,它才能識別出狗;反之,它就算看了十萬條狗,也是白看。
“科普”結束,主角登場。華捷艾米之所以被稱為“全球三強”,根基是它在核心算法的基礎上,賦予計算機以立體視覺,進而研發出了擁有全套自主知識產權的3D-AR解決方案。
簡而言之,它最強的地方,是在大批獨角獸公司“鉆研”二維視覺的背景下,通過AI技術,給了計算機一雙類似人眼的“三維眼睛”。
在華捷艾米,我們看到了這些場景:
一位測試員正對著屏幕玩各種體感游戲,從保齡球、乒乓球到跳舞機,不同于微軟的Kinect之于Xbox,他是“裸身”游戲,身上沒有任何體感設備。唯一的“載體”,是電視機下方一個內置了華捷艾米AR芯片的白盒子。
華捷的市場負責人介紹說:“不同于以往的體感游戲,玩家在華捷的體驗中需要拿出真實的力量。比如打乒乓球,芯片能讀出你的每次速度和加速度,你必須用真實的力度獲得足夠的勢能,才能克服重力,完成擊打。”
另一位測試員,則通過Pad與一個虛擬形象互動。在他的指揮下,這個“小人”靈巧地翻躍著辦公室間的桌椅,遇到墻壁時還不忘繞開。
看上去都是“游戲”,但其所象征的技術以及適用的場景,卻遠超游戲的范疇。
華捷艾米的創始人及CEO李驪,如此簡述整個游戲的過程:
在技術層面,上述場景的實現經歷這樣的過程:
如果你聽得云里霧里,那么只需要記住最關鍵的一點:在全球,能實現這一系統解決方案的僅有三家企業,分別是微軟、蘋果,以及華捷艾米。
這一結論或許和很多行業新聞大相徑庭——在AI業內,尤其是國內AI界,計算機視覺是最火的細分領域,平均每10家公司中,就有五六家有“獨到”的視覺技術;而根植計算機視覺的創業型企業里,已經誕生了四五家獨角獸級別的企業。
上述的每一家,都有能力做出極端精美的PPT和宏大的未來暢想,但PPT做得再漂亮,也改變不了一個基礎事實:大部分業內企業,都建立在2D視覺的基礎上。
不同的出發點,造就了不同層次的“眼睛”。“2D眼睛”的技術更多基于顏色,和相機、手機攝像頭異曲同工,它只能捕捉二維信息,對于三維空間的判斷容易產生錯誤,這是該技術的天然缺陷。
一個典型的例子是:作為全球首款搭載3D深度攝像頭的智能手機,iPhone X可以實現“支付級別”的人臉識別、設備解鎖和面部表情管理。而同一時間,大量鼓吹人臉識別的業內企業,卻只能小打小鬧,如果真要刷臉付款,他人用一張照片就能搞定。
不論是專攻計算機視覺的各大“獨角獸”,還是機場、高鐵、安防等領域廣泛投入使用的人臉識別,核心都是基于2D視覺,國內目前基于立體視覺、推出廣泛應用的,有且只有華捷艾米一家。
出于計算機視覺在弱AI領域的重要性,作為中國立體視覺的領航者,這家企業的每一步,都是將國內行業往更縱深的方向推進。
“三強”之中,蘋果是目前全球AI結合AR產業的領先者。2017年9月,蘋果推出了包括手機、平板電腦、Apple TV等在內的一系列AR產品,并且向供應商下單1.2億套AR相關組件。
雖然鮮以AI企業自居,但蘋果全面AR化的背后,包含了大量AI技術與知識產權。有統計稱,為了拿下這些技術,蘋果掏出了接近200億美元的并購資金。結合AI技術,蘋果在自己的強勢領域找到了合適的應用場景,在“落地”上為一眾企業指明了方向。
“三強”中的另一家微軟,則堪稱企業界AR乃至AI的鼻祖。早在1992年,比爾•蓋茨就對人工智能做出規劃,要“創造能看、能聽并且能理解人類的計算機”。以此為指引,微軟建立了人工智能研究所,招募了大批語音識別和計算機視覺的頂尖研究者,一“養”就是20多年。
很多AI實踐領域,微軟都是先行者。早在1998年,他們就展示過數字地圖技術,遠遠早于谷歌;其3D體感設備Kinect,被稱為革命性的交互產品……
微軟之于AI,就像美國科技之于全球。他們像燈塔一樣探索未知,為后來者提供可見的路徑。不過,在成果轉化上,微軟的AI始終不盡如人意,有業內人士稱:微軟養了20年科學家,投入的資金早就以百億美金計,至今沒有收回成本。
在蘋果、微軟百億美金級別的投資背景下,華捷艾米的成功顯得不可思議:一家創業型的中國企業,如何實現了同樣的技術壁壘?
有意思的是,造訪華捷艾米期間,正值馬斯克引爆全球。他的SpaceX成功發射了人類現役運力最強的重型火箭——重型獵鷹。輿論稱贊馬斯克比NASA還強,但實際上,SpaceX本身就是NASA的延伸與進化,其成功離不開美國“國家隊”的技術支持。
和SpaceX類似,李驪與華捷艾米的背后,同樣站著中國“國家隊”。
創立華捷之前,李驪曾供職于聯想和中興,期間完成了原始積累。2010年前后,計算機視覺大熱,國內幾乎所有上規模的科技和互聯網公司都投身其中。浪潮之下,李驪認定這個技術能“改變世界”,于是辭職創業。
不過彼時,他的出發點只是“山寨”一把微軟,和“改變世界”沒有任何關系。但一圈轉下來后,他發現:山寨的可能性完全沒有,而此前大舉進軍的企業們,也正成批撤退。
撤退和無法山寨基于同樣的原因:基礎學科和邏輯原理的難度太大。
企業經營不同于純粹的科學研究,新的項目一般周期是2到3年,如果2年沒有實質性進展,大概率會被叫停。
對于企業而言,過分執著于基礎科學并非好事,財大氣粗如微軟、谷歌,才能承受“瘋狂燒錢”沒商業回報的工程;而強如亞馬遜,也更多是在應用場景上變出花樣。
大企業撤軍,李驪和他的“山寨團隊”卻鉆進了牛角尖。思前想后,他們琢磨出了一條明路:找專家教授,而且必須是有深厚專業背景的那種。
創業合伙人中,有一位是3D計算機視覺出身,他按照門類,總結劃分了13個關鍵的邏輯原理,團隊藉此羅列了一張專家學者的表格,拿著名單挨個敲門。
從中科院、清華,到北理工、北航,團隊幾乎找遍了相關領域所有權威。“那時候中科院還沒門禁,我們算是鉆了‘后門’。”李驪回憶說。
“求學”的過程很順利,因為“難度很大,教授們一聽都很感興趣”,不僅全力配合,有的還專門給華捷的技術團隊開課授業。
雖然團結了大批專業力量,但整體的突破依舊無比艱難。李驪從未想過,光是理順邏輯原理,就需要數以年計的時間。整整4年時間里,他和團隊四處奔波,掛靠在各類學校的下屬公司里,打一槍換一個地方。
“從沒想過要那么多時間,但專家們是越難越想研究,我甚至巴不得他們說做不出來,我好徹底解脫。”李驪說。
千難萬阻化為一句話:堅持就是勝利。
在想盡各種辦法死撐后,團隊最終迎來了曙光:2014年8月,各方專家教授最終理順了邏輯原理,同一時間,華捷艾米正式成立。
雖然只是個不名一文的初創企業,但李驪隱約感覺到,自己抓住了時代的脈搏。因為出發點就是3D計算機視覺,所以華捷艾米的起點比同行都高,干的是只有巨頭才能做的事情。
回憶這段崢嶸史,李驪自認是享受了時代背景的成果,因為除了中美,換到世界上任何一個國家,怎么熬,都熬不出這家公司。華捷艾米的“背景”,根基在于中國核心技術的突飛猛進。
成立公司后,李驪在第一時間見了投資人。在清華的一家咖啡館里,他自帶可樂暢談半天,投資人聽完項目,立馬拍板了天使輪投資。
天使輪時,華捷艾米的估值是1.3億,1年后,其估值便暴漲至12億,并被工信部列為AR和人工智能核心企業。
雖然身價暴漲,但很長時間內,華捷艾米都是一家隱于水下的公司。掌握基礎原理后,他們還有大量算法、數據的問題要克服,除此之外,更關鍵點在于準確的定位和“變現”方向。
AI領域,企業的市場應用是出了名的“尷尬”。過去幾年,大批AI公司嘗試了各行各業,“小”到市場零售,“大”到航空航天,AI概念無處不在,但探索、試點期從未結束。
“雷聲大、雨點小”,是造成輿論對于AI認知混亂的原因之一,而之所以難“親民”,歸根結底是相關AI的技術和服務不能滿足行業的需求,客戶企業付出的成本高,效果卻不盡如人意。
手中的立體計算機視覺如何變現?華捷艾米做了兩個定位,其一便是結合AR技術,先做強“增強現實”。
AR和VR幾乎是同時期火起來的熱詞,但VR已經經歷了“瘋狂投錢、挨個倒閉”的狂潮,AR的發展卻方興未艾。
究其原因,這兩者雖然聽起來像,本質卻截然不同。VR所謂的虛擬現實,本質是顯示方式的革新,其入門難度相對較低,因此初創公司如雨后春筍。而AR則涉及與真實場景、動態物體的交互,對AI相關技術提出了很高的要求。
幾年前,業內便有觀念認為:在弱AI時代,AR是AI技術變現的最好方式之一,它能恰到好處地變革多個行業的用戶體驗,擁有非常廣闊的應用場景。
比如,與電商結合后,消費者可以隨意穿試鞋品乃至內衣的大小與款式,電商鞋類居高不下的退換貨率將得以迅速降低;
與游戲結合,AR能創造各式各樣的游戲場景與虛擬形象,讓真實與虛擬無縫銜接,游戲體驗數倍提升;與教育相結合,教師能創造各種適時的場景與物品,比如虛擬的器官將代替真實器官,讓學生們隨意剖析……
市場負責人介紹稱:諸多場景中,華捷艾米的技術已經做到了“無中生有”和“無處不在”,讓使用者得以身臨其境,虛擬與真實皆觸手可及。
和AI一樣,AR的應用同樣沒有主戰場,完全在考驗業界思想的極限。而所有的這一切,都必須建立在更精確的計算機視覺、更完善的人機交互的基礎之上。
如業界所料,相較大AI時代的不可預知性,AR+AI的時代已經迅猛來襲。
2015年開始,微軟發布了Hololens,谷歌投資Magic Leap,蘋果收購Metaio,百度發布Baidu Eye……巨頭加速的兩年后,業內的第一波大地震正式到來。
今年6月,蘋果和微軟的新一代芯片即將實現量產。業內消息稱,繼發布全套AR產品后,未來,蘋果所有的產品都將進入AR時代。
為了契合AR的需求,2019年,蘋果將推出徹底革新的iOS系統,與此同時,微軟的Windows也將基于AR進行全面變革。
全新的起點,為消費類電子行業劃出了一條命運的轉折口。巨變中的落后者們,不得不展開千方百計的追趕。
去年底,華捷艾米先后接待了一眾國際巨頭廠商,后者希望將華捷的IP納入自己的體系。
華捷艾米的第二代小型化芯片,第一批產出已經被下游包括手機廠商在內的各類商家索取一空,有消息稱,其AR芯片,在工藝、性能等方面都足以睥睨蘋果的A11芯片。
對于一眾廠商而言,華捷艾米的芯片就像是雪中送炭。蘋果動手后,其他廠商通過自主研發迎頭趕上的可能性幾乎為零,即便不算技術壁壘,光是從原理研發、數據采集、人工標注,到計算機運算、IC設計、供應鏈整合等一套流程走下來,都至少需要3年的時間。如此時間落差,落后者早就涼透了。
這樣的大背景下,深耕技術的華捷艾米被“強行”抬出了水面。2017年,他們的合作伙伴突增至數百家,行業遍及3C、電信、互聯網、智能家居、安防等各主流領域。
“眼睛”是AR的基礎,也是一眾弱AI變現的關鍵,無人駕駛、適用性機器人等理念,都極端考驗立體視覺。1年間的爆發,源于華捷艾米的領先技術,也與其定位息息相關。如前所述,方向上,華捷做了兩個定位,其一是結合AR技術,另一便是基于先行者與領導者的優勢,做一家賦能的基礎企業。
李驪很清楚,雖然看似和微軟、蘋果同步,但當下的華捷艾米不可能和對方做同等體量的事情,他們需要的,是和更多強者聯手。
他舉了一個簡單的例子:芯片的IC設計和投產是一件大把燒錢的事情,它包含了各種模塊,光是購買USB的IP、DDR的IP等資金,都是一筆巨大的投入。華捷艾米的最佳應用場景,是將完全自主的IP和ISK寫入手機等主芯片,以最小的功耗,實現最佳的效果。
立足賦能的定位,華捷艾米的芯片技術得以流向多個領域,比如液晶電視中的面板,智能機器人,以及手機芯片。
經過9年漫長的獨立研發后,他們將立體視覺、手勢體感、人物摳像、AR技術等完美融合,締造了當下幾乎“無所不能”的芯片。其技術能與各行各業緊密結合,讓各大企業加快進入AI時代,并且迅速走上“立體”的正途。
不過,飽受追捧的態勢下,李驪也動起了“小心思”:華捷艾米脫胎于“國家隊”,這輪變局里,他也更希望和民族產業掛鉤,互利互裨。在他看來,AR浪潮是一批中國企業重新定位、彎道超車的好機會,比如展訊等芯片公司,有能力大大縮小與高通的差距,成為中高端手機芯片市場的奇兵。
對于AR市場,業內有著趨于一致的預估:到2020年,全球AR市場規模將達1200億美元,硬件是主要的盈利方式。
而對AI產業,因為劃分標準、前景預估的差異,各家給出的數據大相徑庭:艾瑞咨詢估計,2020年,全球AI產業規模約為180億美元;但普華永道認為,到2030年,AI將給全球經濟帶來15.7萬億美元(約100萬億人民幣)的增長,僅中國經濟的總量增值就將突破7.1萬億美元(約47萬億人民幣)。
無論是眼下的AR還是未來的AI,全球行業里只有兩個大玩家:中國和美國。在這個被資本裹挾的領域里,中美對于AI的投資理念存在明顯差別:美國資本更看重技術上的突破創新,中國資本則更關心應用場景和商業回報。這樣的對比下,華捷艾米這類公司的出現,顯得異常振奮人心。
李驪對華捷艾米抱有十足的信心,按照他的規劃,未來凡是需要用到計算機視覺的領域,都可以是華捷艾米的應用范疇——這個領域,幾乎包攬了AI應用的大半壁江山。而他和團隊要做的,就是讓這雙眼睛更精準、讓它背后的大腦更快。
人類的科技進步正以持續加速伴隨著爆炸式突破的方式迅猛向前。過去100年,人類的科技成果超越此前千萬年的總和,有學者預測:21世紀的100年,人類的科技成果將是20世紀的1000倍。
在這個急速巨變的時代里,一個新技術,很有可能從根本上改變人類的生活方式,而一家小公司,也完全有機會在短時間內成長為巨頭企業。
身處其中,即便只是一個見證者,也著實刺激。
(新聞稿 2018-03-30)