GPU 是什麼?是專為計算 3D 圖形的晶片

GPU 的全名是 Graphics Processing Unit,中文叫做「圖形處理器」。如果只能用一句話來解釋,我會說:GPU 是一顆很擅長「同時做很多簡單工作」的晶片。

這個能力聽起來很普通,但正是因為這個天賦,讓 GPU 從原本專門處理 3D 圖形的零件,變成今天推動 AI、科學模擬、高效能運算的核心引擎。你聽到 ChatGPT 很厲害、AlphaGo 打敗棋王,背後都有 GPU 在默默撐腰。

這篇文章,我會用最白話的方式,帶你徹底了解 GPU 到底是什麼、它跟 CPU 有什麼不一樣、它有哪些核心特色,以及為什麼它會變成現代科技不可或缺的存在。

GPU 的本質:同時做很多簡單工作

要理解 GPU,最簡單的方式就是拿它跟 CPU 做對比。

CPU 就像一位五星級主廚,這位主廚什麼複雜的菜都會做,從熬湯、白蘿蔔上雕出飛龍在天,到控制火候、調味,樣樣精通,但缺點是 CPU 一次只能專心做一、兩道菜,如果突然給 CPU 一百道簡單的炒青菜,他也會忙不過來。

GPU 則像一整排的廚房助手,這些助手每個人都只會簡單的工作,像是切菜、洗菜、遞盤子,但是 GPU 的人數非常多,有幾百個甚至幾千個助手站成一整排,所以當廚房湧進一千顆馬鈴薯要削皮這種大批簡單工作的時候,他們可以同時動手,很快就處理完。

這就是 GPU 最核心的本事:大規模平行處理。它不擅長做複雜的事情,但它非常擅長把一件簡單的事情,同時複製給幾千個人一起做。

GPU 的核心特色

如果我們再仔細觀察這群廚房助手(GPU),會發現他們有幾個很特別的地方。

第一,人多好辦事,高階的 GPU 裡面真的塞了幾千個小助手,他們可以同時執行好幾萬個小工作,一次搞定很多事情。

第二,動作整齊劃一,這麼多助手如果亂成一團,反而會互相干擾,所以 GPU 會把他們分組,幾十個人組成一隊,所有人同時做一模一樣的事情。比如第一隊全部在削馬鈴薯,第二隊全部在洗菜,動作整整齊齊,不會有人跑去切水果。這種工作方式就是 GPU 很有名的特色。

第三,資料吞吐量非常大,GPU 原本就是為了處理大量畫面資料而設計的,所以它配備了速度非常快的記憶體。可以這樣想像,CPU 用的是普通水管,而 GPU 用的是消防水管,一次可以灌進好幾倍的資料量,讀寫速度非常驚人。

第四,內建「特別專門料理廚師」,為了應付特定任務,現代 GPU 還會在裡面放一些專門處理特定問題的單元,例如 AI 運算單元專門處理 AI 需要的矩陣運算,像是 ChatGPT 背後的數學、光線追蹤單元則專門計算遊戲裡光線怎麼反射、折射,讓畫面更逼真等等。

GPU 和 CPU 的詳細對照

我們再把 CPU 和 GPU 的差異整理成對照表,會更清楚:

比較項目CPU(五星級主廚)GPU(廚房助手團)
核心任務擅長處理複雜、需要動腦的工作,像是管理廚房流程、決定出菜順序、處理突發狀況。擅長處理大量、重複、簡單的工作,像是削幾百顆馬鈴薯、洗幾十把青菜。
人數與做事方式人數少,大約四到六十四個核心,一次專心做一兩件事。人數非常多,幾千個核心,可以同時處理堆積如山的食材。
組織方式每個核心獨立作業。會分組,例如 NVIDIA 是三十二人一隊,AMD 是六十四人一隊,整隊做同一件事。
資料傳輸速度記憶體頻寬大約一百到兩百 GB/s,像普通水管。記憶體頻寬可以達到一到三 TB/s,像消防水管。
擅長的工作擅長處理複雜但有順序的事情,例如執行作業系統、開各種應用程式。擅長處理簡單但數量龐大的事情,例如渲染 3D 畫面、訓練 AI 模型、執行科學模擬。
追求的目標追求快,希望每個工作都能在最短時間內完成。追求多,希望在同樣時間內能夠做完最多的工作。

GPU 和顯示卡不一樣

這是一個很多人會搞錯的地方,我特別說明一下。

GPU 是顯示卡上的核心晶片,負責實際的運算工作。你可以把它想像成汽車的引擎。

顯示卡則是包含 GPU 晶片、記憶體、散熱風扇、電源管理、輸出接頭等零件的完整套件。就像一整台車,裡面有引擎、輪胎、方向盤、座椅。

所以我們平常說買一張顯示卡,買到的其實是包含 GPU 在內的整套系統。

現在市場上有哪些 GPU?

目前做 GPU 的主要有三家公司。

NVIDIA 是目前市場的龍頭。它很早就建立了一套完整的軟體生態系,讓開發者可以很方便地在它的 GPU 上寫 AI 程式。加上它不斷推出各種專門的運算單元,在 AI 領域幾乎是領先地位。NVIDIA 的架構演進從 Tesla、Fermi、Kepler、Maxwell、Pascal,到 Volta 引入第一代 AI 運算核心(Tensor Core)、Turing 引入 RT 核心,再到 Ampere、Hopper,以及最新的 Blackwell 架構,每一代都針對 AI 和圖形運算進行優化。

AMD 是市場第二大廠。它的特色是性價比高,可以用比較少的錢買到相近的效能。而且在某些科學計算領域表現很亮眼,也比較願意採用開放標準。AMD 在 2006 年收購 ATI 後,架構從 TeraScale(VLIW 設計)演進到 GCN(標量加向量混合設計),再到現在分為兩條產品線:RDNA 專門服務遊戲市場,CDNA 專攻資料中心和高效能運算。RDNA 架構導入 Infinity Cache 技術,用大型快取減少對記憶體頻寬的依賴;CDNA 架構則加入矩陣核心,與 NVIDIA 的 AI 運算核心競爭。

Intel 這幾年重新回到獨立 GPU 市場,推出 Arc 系列產品,雖然現在還在追趕階段,但因為它的規模跟技術基礎雄厚,未來值得關注(但我不會關注了)。

CPU 和 GPU 怎麼合作?

現代電腦不會只靠 CPU 或只靠 GPU,而是讓它們分工合作。流程大致是這樣的。

首先,CPU 會先判斷這個工作是複雜的,還是簡單但大量的,如果是簡單大量,就把工作分配給 GPU。

接著,GPU 接手後,用幾千個核心同時處理,快速把這些工作做完。

最後,GPU 把處理好的結果傳回給 CPU,由 CPU 做最後的收尾與整合。

這種 CPU 當總指揮、GPU 當執行者,兩者分工合作的模式,就叫做異質運算系統。也正是因為它們這樣分工,現代電腦才能同時處理那麼多複雜又龐大的任務,從 4K 遊戲到 ChatGPT,背後都是這個團隊在運作。

GPU 的歷史:從圖形加速器到運算引擎

GPU 的發展可以追溯到 1990 年代末期,1999 年,NVIDIA 推出 GeForce 256,首次使用「GPU」這個詞,並引入硬體轉換與光照引擎,把原本需要 CPU 處理的 3D 運算工作接了過去。

ATI 在 2000 年推出 Radeon 256,開始和 NVIDIA 競爭,2002 年 ATI 的 Radeon 9700(R300 系列)是重要的里程碑,首次在效能上超越 NVIDIA,並支援 DirectX 9.0 和完整的可程式化像素著色器。

2006 年是 GPU 產業的轉折點,因為這一年,AMD 以 54 億美元收購 ATI Technologies,成為唯一同時擁有 CPU 和 GPU 技術的主要廠商。同年,NVIDIA 推出 CUDA,第一次提供完整的通用 GPU 運算平台,讓開發者可以把 GPU 拿來做圖形以外的大規模運算。

2007 年,ATI 推出 Radeon HD 2900 XT(R600 系列),是 ATI 首款統一著色器架構 GPU,為後續的 GPGPU 運算奠定基礎。2008 年的 Radeon HD 4870(RV770)率先支援 GDDR5 記憶體,以優異的性價比在市場上取得成功。

2017 年,NVIDIA Volta 架構引入第一代 AI 運算核心(Tensor Core),革命性地改變了 AI 運算的效率。深度學習訓練效能相比前代提升了 12 倍。從此,GPU 正式成為 AI 時代的核心引擎。

GPU 為什麼變成 AI 的核心?

你可能會好奇,一顆原本專門處理畫面的晶片,怎麼會變成 AI 的引擎?

因為訓練 AI 模型,本質上就是讓它不斷地做超大規模的數學運算。而這些運算,恰好就是 GPU 最擅長的事情:同時做很多簡單的矩陣乘法。

為了讓這件事跑得更快,NVIDIA 和 AMD 都在 GPU 裡塞了專屬加速器,NVIDIA 的叫 AI 運算核心(Tensor Core),AMD 的叫矩陣核心。你可以把它們想像成超級計算特攻隊,專門處理 AI 最需要的矩陣乘法。再加上一種叫做「混合精度運算」的聰明工作方式,用剛剛好的力氣做事,又快又準。靠著這些技術,現在訓練一個大型 AI 模型的時間,已經從過去的幾年縮短到幾個月甚至幾週。

GPU 的極限與未來挑戰

當然,GPU 再強也有它的極限。

現在的 AI 模型越長越大,需要的記憶體容量和讀寫速度也跟著暴增,就像一個人的大腦記不住太多東西、想事情的速度也跟不上。這就是目前最主要的瓶頸。

另外,頂級的 GPU 全力運轉時,耗電量高達 400 到 700 瓦,比一台高級冰箱還耗電,產生的熱量也非常可觀。所以科學家們現在正在研究新的方向,例如設計更聰明的電路、用更低精度的數字來算(如 FP4、FP6)、讓一張 GPU 可以切給多人使用,以及怎麼讓訓練 AI 的過程更環保。

未來 GPU 的發展方向還包括:Chiplet 設計(把 GPU 分成多個小晶片,提高良率和靈活性)、3D 堆疊記憶體、更強大的光線追蹤效能,以及 AI 與圖形技術的深度融合。

GPU 就是一顆很擅長同時做很多簡單工作的晶片

回到最開始的問題:GPU 是什麼?

它是一顆很擅長同時做很多簡單工作的晶片,它從圖形加速器出身,因為這個天賦,變成了 AI 和科學運算的核心引擎。它和 CPU 分工合作,一個當主廚,一個帶廚房助手團,共同撐起了現代電腦的運算需求。

市面上多數的討論都把焦點放在 NVIDIA 身上,但 GPU 技術的完整拼圖,還包含 AMD 從 ATI 時代一路走來的精彩歷史。從 ATI 時期的 R300 系列,到現代 AMD 的 RDNA 和 CDNA 架構,每一代都有其獨特的技術創新和市場貢獻。

這篇文章只是一個起點,希望幫你建立對 GPU 的基本認識,如果你想知道更多,後面還有關於 GPU 運作流程、架構演進的深入內容,歡迎繼續讀下去。

返回頂端