輝達(Nvidia)在第四季度的財報,帶動了整個股市的活力,甚至挽救了美國股市。過去一年股價更是飆漲了接近 237%,增幅超過兩倍。這些成績不只近期在台灣媒體上被炒得火熱、在我的部落格上也得到了充分的關注,特別是以下兩篇關於 AI 晶片和 Nvidia 公司的文章,其中談到了 Nvidia 在 AI 晶片領域的引領地位,以及 CUDA 軟體所發揮的關鍵作用,歡迎有興趣的讀者詳細閱讀參考。
而以下本篇文章將從較宏觀的角度,為非科技專業領域的廣大讀者,解釋 Nvidia 為何能在近年引領 AI 商機風潮,並獲得資本市場的高度青睞;同時也為讀者分析在人工智慧運算時代,還有哪些後起之後值得留意。

Nvidia CUDA 軟體──輝達引領 AI 運算的關鍵
「20 年磨一劍」的 Nvidia CUDA,正是如今造就輝達在 AI 晶片領域引領風騷的關鍵。
CUDA 是一種專門用於加速 Nvidia GPU(圖形處理器)運算的專利軟體技術。它於 2007 年首次發表,至今已有近 20 年的歷史。簡單來說,它是一種程式語言和編程模型,可以讓開發者利用 GPU 的強大計算能力來加速各種應用程序。由於多年下來不斷的研發調整和最佳化,CUDA 如今已經完善了一整個「GPU 加速生態系統」,它不僅成為許多 GPU 加速應用程序的標準,並且被廣泛應用在科學計算、影像處理、深度學習等領域。許多研究人員和開發者,也早已習慣使用 CUDA 這項工具,來進行產品開發和研究──而這也使得 CUDA「綁定」的Nvidia GPU,在市場上無法被輕易取代。
例如,矽谷許多科技巨頭包括 Meta, Tesla, Microsoft 在內,也都試圖自行研發屬於自己的 AI 晶片;儘管如此,他們依然繼續向 Nvidia 採購大量的 H100 GPU,以擴大自己的運算吞吐量。原因就在於這些公司還沒發展出類似 CUDA 的軟體(與其生態系),讓更多使用者更有效率地運用他們所設計的 AI 晶片。
這些公司設計的晶片,效能其實都比 Nvidia 的強大,但如果這些專門晶片只能加速非常特定的 AI 模型,就無法改進整體的 AI 模型或解決複雜的問題。因此,Nvidia 擁有 CUDA 這樣一個完善的編程模型,絕對是他們(到目前為止)的不對稱優勢。
要知道,目前全球主流的 AI 開發工具 Pytorch 也廣泛支援 CUDA,為開發者提供了更方便的開發環境;也因此我們可以說,目前世界上大多數的 AI 模型程式碼,都有 CUDA 「參與其中」,只要有了 Nvidia GPU,就可以無痛的加速任何一個 AI 模型──而這也讓 Nvidia 成為無數 AI 開發者不可或缺的供應商。
緊追其後、虎視眈眈的 AMD
然而,市場上沒有永遠的霸主,在競爭激烈的 AI 晶片市場中,Nvidia 也正面臨著 AMD 這一主要競爭對手的挑戰:AMD 正積極追趕 Nvidia 的步伐,致力於打造屬於自己的 AI 硬體生態系統。

AMD 最新推出的旗艦 AI 晶片 MI300X,在性能和成本方面不亞於 Nvidia 的 H-100,但其編程模型 ROCm(註)仍然處於早期階段,大多數開發者尚不熟悉如何使用 ROCm 來加速。此外,將現有的 AI 模型加速也需要將 CUDA 代碼轉換為 ROCm,造成效率的降低。
儘管如此,AMD 仍以其低成本和高效能特性,成為 Nvidia 目前最大的競爭對手。實驗顯示,AMD 的性能可以達到 Nvidia 的 70-80%,但考慮到其低成本,更能滿足 AI 運算所需的性價比(性價比約為 Nvidia 的 2 倍)。然而前面提到的關鍵在此又發揮了作用:當考慮到 Nvidia 的 CUDA 軟體加速後,Nvidia 晶片的性價比頓時拉高到 AMD 的 6 倍左右。

因此,AMD 顯然必須更著力發展其 ROCm 的軟體生態系統,至少使 CUDA 轉換成 ROCm 程式碼的「無痛化」成為可能。這才能使市面上的 AI 模型能夠更廣泛地使用 AMD 晶片進行加速,並充分利用其低成本和低能耗的優勢,從而幫助企業節省 AI 運算的成本,吸引更多企業的青睞。
就像 CPU 產業與老牌 Intel 的競爭一樣:他們專注於 CPU 領域的研發、以性價比更高的 CPU 晶片受到玩家的青睞,從而能夠挑戰 Intel 「套裝」的霸主地位。AMD 在硬體設計上確實也擁有獨特之處,而且在 AI 晶片設計上積極探索創新,例如小晶片技術(Chiplet)、高頻寬記憶體(HBM)等。這些技術將成為未來 AI 晶片發展的關鍵,相比 Nvidia 目前的大晶片架構而言,也顯得更為先進。
誰是下一個 AI 晶片巨人?AI 硬體產業前景展望
根據 Nvidia 於 2022 年和 2023 年的財報數據顯示,AI 資料中心的收益分別達到了 150 億美元和 475 億美元,增長率超過 200%。這顯示市場對 AI 晶片的巨大需求增長。許多機構預測,AI 晶片市場將以每年約 30% 至 40% 的速度持續增長,呈現強勁的發展動能,類似於先前電動車產業的爆炸性成長。

目前,Nvidia 無疑是 AI 晶片市場的龍頭,擁有接近 90% 的市占率,幾乎壟斷了整個 AI 運算資源。要知即使如今幾乎壟斷高階晶片製造的 TSMC,也只佔了全球 66% 的市場份額。因此,90% 的市佔率實在極為驚人。
但這也意味著,接下來必然會有其他公司挑戰 Nvidia 的龍頭地位,將 AI 晶片市場帶入競爭新局面。除了 AMD 之外,還有不少值得矚目的新創公司,如 Tenstorrent 和 SambaNova,均來勢洶洶地開發 AI 晶片。更值得注意的是,如前面提及的許多科技巨頭,也開始自主研發晶片,希望能在 AI 晶片領域取代 Nvidia。因此可以預期,未來 AI 晶片產業的整體發展前景將持續充滿熱度與話題,新競爭局勢所帶來的技術革新,也令人期待!
註:ROCm 是由 AMD 開發的開放式平台,用於加速應用程序的運行,特別是在機器學習和科學計算方面。ROCm 代表 Radeon Open Compute 平台,旨在提供類似 Nvidia CUDA 的功能,但針對的是 AMD 的 GPU 和加速器。與 CUDA 相比,ROCm 目前仍處於發展的早期階段,但 AMD 正積極地擴展其功能和生態系統,以提供更多的工具和支援,並吸引更多的開發者。
執行編輯:羅思涵
核稿編輯:張翔一