當科技巨頭紛打 AI 牌:Apple 推出 Vision Pro 要價逾 10 萬,打的又是什麼算盤?

今(2023)年 Apple 開發者大會推出的 Vision Pro 除了令人驚豔外,它也很有可能解決了頻寬問題,並消除了市場上大部分 AR 與 VR 產品的痛點。不過,向來擅長生產完美、價格還算合理產品的 Apple,這次的 Vision Pro 卻有一個讓人在入手前,無法忽視的缺點。
當科技巨頭紛打 AI 牌:Apple 推出 Vision Pro 要價逾 10 萬,打的又是什麼算盤?

Apple Vision Pro 售價為 3,499 美元,換算下來約為 10.7 萬新臺幣。

Photo Credit:截自 Apple

這次 Apple 在 2023 年的開發者大會(WWDC)中,雖然沒有特別提到 AI,但發表了一款被稱為 Vision Pro 的穿戴式裝置。

這是一項具有跨時代意義的產品,對 AR 及 VR 等虛擬實境產業產生了巨大的影響。相信 Meta 和 Microsoft 等其他科技巨擘,也都認識到該產品的深度和完整性,當然還有那高的嚇人的售價。

Apple Vision Pro 的厲害 

基本上,AR 及 VR 技術的發展最主要受限於硬體方面,尤其是影像頻寬的問題。為在一個小小的介面上,呈現出不會引起動暈(Motion Sickness)的影像,需要保證足夠高的像素數。保守估計,這個數字大約在 500 至 700 萬像素左右,而 Vision Pro 最高幀數為 83 FPS,這代表如果要解決動暈的問題,需要至少 93 Gb/s 記憶體頻寬(註一)

在這樣的情況下,R1 晶片在這個產品就至關重要。它可以作為 M2 晶片的資料處理中心,你可以把這個晶片想像成一個轉接頭,接收並處理各種感測器的巨量資料,進行資料前處理、加密等等功能,再將處理過的資料傳送到 M2 中做更複雜的運算。透過這樣的作法,可以大幅減少 M2 晶片所需使用的頻寬。

以人眼影像形成的過程為例,R1 就像是整合圖中 sensors + network 的部分,進行資料前處理跟傳輸,最後送到 M2 晶片(大腦)進行更複雜的邏輯運算。圖/截自 史丹佛大學線上教材講義

根據目前所擁有的資料,Vision Pro 擁有 12 個鏡頭、5 個感測器(含光達),以及 6 個麥克風,並利用空間運算 (Spatial Computing)創造一個擴增實境空間。Vision Pro 擁有的 12 個相機鏡頭,應該就像特斯拉車子的 8 個相機一樣,用於掃描環境,建造出一個 3D 空間。

這包含了偵測使用者的手,以進行手勢控制,同時利用光達(LiDAR)讓整個空間更加準確,當然光達可能會產生一些機件上的噪音,但這就端看 Apple 如何優化此部分的使用者體驗。

感測器推測應該也擁有數個「九軸陀螺儀 」(Inertial Measurement Units),用來測速、偵測使用者的在空間的相對位置,而麥克風應該也有用到 AirPods 的技術,吸收環境聲、整合虛擬音效,以提供使用者更好的沈浸式體驗。

Apple Vision Pro 內的 M2 以及 R1 晶片圖。/截自 Apple

R1 晶片記憶體頻寬

現在的資料顯示特斯拉 HW4.0 硬體最新相機為 500 萬像素,因此我們可以合理推斷 Apple Vision Pro 也許也會有類似的標準,我們可以簡單估計 R1 晶片所需要的頻寬為約 111 Gb/s (註二), 基本上就是解決 Motion Sickness 所需的頻寬。

當然所有的技術細節都還未公開,因此真正數字為多少都還不得而知,但可以知道相機就需要 111 Gb/s,加上其他的感測器等等以及顯示所需要的頻寬,我們可以大概預測所需要的記憶體頻寬為 256 Gb/s 以上。

以 Nvidia 所設計的用來處理 GPU 伺服器網路的硬體 Connectx-7 作為舉例,其擁有頻寬為 400Gb/s,而這樣的硬體性能是使用在「雲端伺服器」高性能的應用,等於  Vision Pro 將擁有媲美雲端伺服器的傳輸效率。

Nvidia Connectx-7 硬體圖。圖/截自 Nvidia

R1 晶片在一個行動裝置擁有 256 Gb/s 記憶體頻寬,是一個相當恐怖的事情。最新一代的行動裝置記憶體傳輸標準 LPDDR5 可以支援 64 Gb/s,但離 Apple 的需求還有段距離,因此 Apple 肯定在 R1 晶片設計上對記憶體「體積、功耗、速度」做了很大的努力,甚至可能還有設計客製化的傳輸標準。

完美的產品,不完美的價格

Vision Pro 的展示除了令人驚豔外,它也很有可能解決了頻寬問題,並消除了市場上大部分 AR 與 VR 產品的痛點。因為這款穿戴式裝置無需要額外使用控制器,且擁有相對完整的軟體生態系統(visionOS),是一個非常強大的產品。

Apple 一如既往地做出了非常高品質的產品,它的完成及完整度都非常高,相信一定會吸引大眾的關注,也會讓許多 YouTuber 爭相發表產品開箱心得,而這看下來真的非常符合 Apple 一貫希望達到「產品一定要完美」的風格。

然而,這項產品唯一的問題就是價格。一個要價 3,500 美元(約 10.7 萬元新臺幣)的穿戴裝置對一般大眾來說,實在是過於昂貴,你我可能也只能眼巴巴地看著各種 YouTuber 等人開箱而無法親身體驗。

這也讓我覺得 Apple Vision Pro 無法與過往的 iPhone Moment 相比。畢竟當時的 iPhone 推出時多半只需約 499 至 599 美金(1.5 萬至 1.8 萬新臺幣),而且 Apple 始終以個人化出發,但 Vision Pro 的價格並不親民,難以大眾化,而這也是相對「不像 Apple」的地方。


因此,比起認為這是一項近期可入手的產品,我認為 Vision Pro 其實更像是軍火展示,向大家秀出 Apple 在 AR 與 VR 產業的能力與水準。因此,初步估計這個產品可能只會少量生產,但我們至少可以繼續期待 Apple 第二代穿戴式裝置的改進。

真心希望 Apple 不會陷入 1980 年代後賈伯斯時代的困境。當時的 Lisa 和 Lisa 2 電腦雖然硬體性能非常強大,但價格卻也十分昂貴,這最終導致產品銷售不佳,出現了很多問題。後來賈伯斯回到 Apple,重新整頓了公司,設計了 iMac,才帶領 Apple 走出當時面臨的困境。

總而言之,期待蘋果能夠繼續保持一貫的優秀設計及完美產品的特質,為消費者帶來更多創新與驚喜。

註一:

Apple Vision Pro 聲稱每 12 毫秒刷新一次螢幕,代表每秒 83 幀圖像(83 FPS)

一個像素通常為 24 位元(24 bits),因此可以得出的公式為:50,000,000 pixels x 24 bits per pixels x 83 frame per second ~= 93 Gb/s

註二:

Apple Vision Pro 擁有 12 個相機,假設相機像素為 500 萬畫素。因此每個畫面所需要處理 6,000 萬像素,而Apple Vision Pro 聲稱每 12 毫秒刷新一次螢幕,代表每秒 83 幀圖像(83 FPS)一個像素通常為 24 位元(24 bits),因此可以得出以下公式:60,000,000 pixels x 24 bits per pixels x 83 frame per second ~= 111 Gb/s。

執行編輯:曾聖軒
核稿編輯:梅緣緣

關聯閱讀

作品推薦

你可能有興趣的文章

#廣編企劃|新北街舞大賽的魔力,就是能讓所有人都被這股精神感染!

歡迎回來《換日線》!
您可以使用此天下雜誌群帳號,盡情享受天下雜誌的會員專屬服務,詳細內容請參考此連結