Hugging Face 是全球最大的 AI 模型寶庫。如果你覺得 Ollama 內建的模型選擇不夠,或想尋找更特定的領域模型,只要在 Hugging Face 搜尋「GGUF」格式,就能直接將海量資源導入 Ollama 運行。若你還不清楚如何安裝 Ollama,建議先參考我的另一篇教學:《本地 LLM 模型連你阿嬤都會用:快來試試 Ollama 玩轉各種本地 LLM 模型》。
Hugging Face 從何而來?
Hugging Face 成立於 2016 年,總部位於紐約。有趣的是,三位法國創辦人當初並不是要做平台,而是想開發一款給青少年玩的「AI 聊天機器人(BFF)」。為了讓機器人變聰明,他們開源了內部的 NLP(自然語言處理)程式碼,沒想到這些工具在開發者社群爆紅,受歡迎程度遠超他們的機器人 App。於是,他們果斷轉型,決定打造一個讓全世界分享模型、數據集和程式碼的平台。
Hugging Face 的圖標就是那個「抱抱臉」🤗。這象徵著他們的願景:讓 AI 變得友善、開放且人人可用。他們不希望 AI 技術被少數科技巨頭壟斷,而是透過開源力量,讓每個人都能建立自己的 AI 應用。
Hugging Face 是靠什麼賺錢的?
Hugging Face 採用的是典型的 Freemium(免費加值) 模式:
- 企業級解決方案:提供企業私有的模型儲存空間與加強版安全管理。
- 算力服務:如果你想在雲端直接運行模型,可以向他們租借運算資源。
- 專家支援服務:針對需要深度導入 AI 的企業提供付費技術諮詢。
- 戰略投資:Google、NVIDIA、Amazon 都是其投資者,這讓它成為 AI 基礎設施的中立核心。
Hugging Face 下載回來的模型安全嗎?
這是社群最常討論的問題。它是相對安全的,但仍需具備基本辨識力。
- Safetensors 技術:Hugging Face 積極推廣 .safetensors 格式。相比傳統的 Pickle 格式,它不會執行不明程式碼,還能阻斷大多數的後門攻擊。
- 自動化掃描:平台會自動掃描上傳的文件是否夾帶惡意軟體或病毒。
- 社群背書:知名機構(如 Meta、Google)的帳號會有官方認證標章,且熱門模型的下載量與讚數也是重要的參考指標。
Hugging Face 模型下載步驟教學
第 1 步驟:在 Hugging Face 篩選 Ollama 模型
在 Hugging Face 模型庫中,利用左側 Libraries 篩選器勾選 「Ollama」,快速過濾出支援 Ollama 直接呼叫與執行的模型清單。

第 2 步驟:進入模型頁面並選取部署選項
進入選定的 GLM-4.7-Flash-GGUF 模型頁面,點擊右上角的 「Use this model」 按鈕,查看該模型的本地部署選項。

第 3 步驟:切換至 Ollama 專屬指令清單
從彈出的選單中選擇 「Ollama」,系統將自動生成專屬於該 GGUF 模型的 Ollama 終端機運行指令。

第 4 步驟:複製模型量化版本的執行指令
視窗顯示完整的 ollama run 指令,並預設選中特定的量化版本(如 UD-Q4_K_XL),點擊 「Copy」 圖示將指令複製到剪貼簿。

第 5 步驟:在終端機貼上指令準備下載
開啟電腦的終端機(Terminal),貼上剛複製的指令,準備透過 Ollama 引擎下載並啟動模型。

第 6 步驟:監控模型數據分片下載進度
執行指令後,終端機開始從伺服器拉取(Pulling)模型 Manifest 與資料分片,畫面即時顯示當前的下載進度與傳輸速度。

第 7 步驟:確認下載成功並開啟互動模式
模型組件下載完畢並通過校驗,終端機顯示 「success」 字樣,自動進入與 AI 直接對話的互動模式。

第 8 步驟:在 Ollama GUI 選單切換新模型
開啟 Ollama 桌面版視窗(GUI),在模型下拉選單中手動切換至剛剛下載成功的 GLM-4.7-Flash 模型。

第 9 步驟:完成部署並進行 AI 對話測試
在對話視窗發送測試訊息,確認模型能正常理解並給予回覆,完成本地 AI 環境的部署驗證。

要深入了解 AI 產品經理的基本職責和角色,請參考我的詳細指南:AI 產品經理,我的學習方法