當地時間10月20日下午,記者抵達美國夏威夷茂宜島,參加10月21日開啟的高通驍龍峰會。在峰會的前兩個主題日,高通在智能手機和汽車平臺拿出了三款驍龍Elite(至尊版)新品。其中最引人關注的,莫過于高通自研CPU架構Oryon的“開枝散葉”。在去年首次應用于高通AI PC芯片驍龍X Elite之后,Oryon CPU走進了此次發布的一款手機芯片平臺和兩款汽車芯片平臺。加上高通自研的Adreno GPU和Hexagon NPU,高通補齊了自研SoC的最后一塊拼圖,也統一了PC、手機、汽車三條產品線的芯片架構。
本次驍龍峰會上,高通公司總裁兼CEO克里斯蒂亞諾·安蒙(Cristiano Amon)沒有參與三款新品的發布,但他花了相當的篇幅發布貫穿三款新品的主線:第二代Oryon CPU。
安蒙用一張圖總結一年來高通在Oryon CPU上的成果
Oryon CPU的研發,可以追溯到2021年高通斥資14億美元收購CPU設計企業Nuvia。雖然Nuvia當時僅僅創立兩年,創始團隊卻擁有在蘋果、谷歌等企業擔任芯片架構師的經驗,在公司成立一年后就推出了自研CPU架構“Phoenix”,以更低功耗實現了顯著高于競品的峰值性能。
在2021年3月完成收購后,安蒙就表示高通計劃將下一代 CPU 集成到智能手機、PC、數字駕駛艙、ADAS系統等產品線。而這一愿景,在之后三年的驍龍峰會上,一步一步走進現實。
在2022年驍龍峰會,高通公布了下一代名為“Oryon”的CPU核心設計,但并未展現具體細節。在2023年驍龍峰會,Oryon CPU正式亮相,采用12個3.8GHz高性能核心,單核性能跑分領先競品的同時,達到競品峰值性能所需的功耗減少30%~70%,率先搭載于同期發布的新款PC芯片驍龍X Elite。
本次驍龍峰會發布的第二代Oryon CPU,性能相比第一代提升了30%,同等性能下功耗降低了57%。在單核、多核以及達到相同峰值性能所需的功耗等參數領先競品的同時,Oryon CPU在設備不插電的情況下,性能不會衰減。這一特點使Oryon CPU在不插電模式下,處理速度比競品CPU快134%,也使驍龍X Elite在不插電模式下相比競品處理器快90%。同時,由于第二代Oryon CPU將首次搭載到手機平臺,因此相比競品,Oryon CPU能夠將性能和能效的提升兌現在更小的封裝中。
在生成式AI的浪潮襲來之后,圍繞算力的競爭更加白熱化,頭部處理器廠商都不約而同地縮短了產品發布周期,從過去的2年一迭代走向1年一迭代。高通對于Oryon CPU似乎也有此打算。安蒙表示,對于下一代Oryon CPU,他已經看到了一些高通工程團隊所作的工作并為此感到振奮,請關注明年驍龍峰會的發布。
自研CPU架構的利好,就是能夠根據不同產品線的需求,對CPU進行微架構層面的調優和定制。“我們從頭開始打造IP,Oryon CPU正是我們自研SoC的最后一塊拼圖。這種方式讓我們擁有對CPU的完全自主權,能夠直接定義和定制所有處理通道的配置,不再依賴外部(第三方)。”高通技術公司產品管理總監Manju Varma表示。
由于第二代Oryon CPU從PC平臺走進手機平臺,因此高通CPU設計團隊首先面向移動平臺進行架構調整。高通工程副總裁、Oryon CPU設計負責人Gerard Williams(曾為Nuvia創始人)在回顧團隊這一年的工作時表示,他們大幅提升了Oryon CPU的時鐘速度,同時降低功耗,這是推動Oryon CPU走進移動終端的核心驅動力。同時,為了適應移動設備更小型的體積和電池,團隊也在降低減少芯片面積上下了功夫。
具體來看,驍龍8至尊版搭載的Oryon CPU采用了面向移動端設計的全新微架構。在核心設計上采用了2顆超級內核+6顆性能核心,不再采用能效核。超級內核引入全新的數據時序預取器,基于模式檢測預取所有緩存行(CPU緩存存儲數據的基本單位),并預測特定使用情況下哪些緩存行會被使用,以實現更高的頻率(4.32GH)和性能,并提升在緊湊產品外形設計下的能效表現。6個性能核都經過調優,在保證能效的前提下運行密集型的應用程序。
對于不再使用能效核,高通的解釋是,用亂序性能內核取代能效核,能夠提供更好的性能和功耗組合,并配合超級內核實現更高的處理速度。
高通技術公司產品管理總監Manju Varma介紹驍龍8至尊版CPU設計
內存同樣是提升CPU處理速度的關鍵。高通為每個CPU叢集配置了24MB專用緩存。通常,增加一級緩存或二級緩存都會導致時延的增加。因此,高通在提升一級緩存容量的同時,采用緩存一致性協議,將時延保持在1納秒內。同時,為了解決二級緩存擴容造成的時延,高通設計了與CPU內核同步的二級緩存,以降低時延和功耗。考慮到生成式AI高度依賴內存,驍龍8至尊版配備了目前最高速的LPDDR5內存。這樣的微架構和內存系統升級,能夠為用戶帶來更快的應用啟動速度、更流暢的多任務處理以及生成式AI功能。
而驍龍座艙和RIDE至尊版使用的Oryon CPU,圍繞車用平臺進行了三方面的提升。一是處理能力較前一代車規平臺的CPU提升了三倍。二是強化了安全功能。三是面向汽車應用設計的適應性架構,能夠支持先進艙駕功能和自動駕駛功能,也能夠在同一塊SoC上同時支持艙、駕功能,這無疑契合了當前艙駕一體的融合趨勢。
“在汽車平臺,Oryon CPU的定制化聚焦安全系數,以確保汽車在智能駕駛等場景下的安全性,讓GPU、NPU、DSP等IP模塊在安全的基礎上運行。”高通技術公司汽車、行業解決方案和云事業群總經理Nakul Duggal向記者表示。
當然,相比芯片平臺本身,手機、PC和汽車廠商能夠結合最新芯片能力設計出哪些功能,或許是消費者更為關注的點,而這需要高通與OEM及終端、車企繼續加深合作,并通過高通AI Hub等模型庫,為廣大應用開發者提供更加趁手的工具和平臺。
(文章轉載自中國電子報)
(新聞稿 2024-10-25)