第 7 天：開源 vs 閉源大模型——Llama、Mistral、DeepSeek 為什麼重要

如果把 AI(人工智慧) 想成一間餐廳，閉源大模型就像高級連鎖餐廳：你點菜、付錢、吃到穩定品質，但廚房怎麼做你看不到。開源大模型則像公開食譜的料理社群：大家看得到做法，能自己改口味，也能開新店。今天我們要用白話搞懂：為什麼 Llama、Mistral、DeepSeek 這些模型，正在改變整個 AI 產業。

3 分鐘秒懂

大模型通常指 LLM(大型語言模型)，也就是像 ChatGPT、通義千問、DeepSeek 這類能讀文字、寫文章、回答問題、寫程式的 AI 系統。

所謂閉源，不是說你不能用，而是它的核心「配方」通常不公開。你可以透過網站或 API(應用程式介面) 使用，例如 OpenAI(開放人工智慧公司) 的 GPT(生成式預訓練轉換器) 系列、Anthropic(人工智慧公司) 的 Claude(克勞德模型)、Google(谷歌) 的 Gemini(雙子星模型)。你像是叫外送：方便、品質穩，但餐廳掌握一切。

開源則是把模型權重、程式碼或訓練方法的一部分公開，讓開發者、公司、研究者能下載、部署、調整。代表例子包括 Llama(美國 Meta 推出的開源大模型系列)、Mistral(法國 Mistral AI 推出的模型系列)、DeepSeek(中國深度求索推出的模型系列)。你像是拿到食譜和半成品，可以自己加辣、少鹽、改成素食版。

一句話記：閉源強在省心與商用品質，開源強在自由、可控、可改造。

為什麼這重要

你可能會問：「我只是用 ChatGPT 寫週報，開源閉源跟我有什麼關係？」其實關係很大。

第一，價格會被改變。當只有少數閉源公司提供強模型，大家都得照它們的價格走。開源模型變強後，企業可以自己部署，或用競爭者服務，整體成本就有機會下降。

第二，資料安全會被改變。假設一間台灣醫院想用 AI 整理病歷，資料很敏感，不一定適合全部送到外部雲端。若使用開源模型，就能放在自家伺服器裡運行，像把廚房建在自己家，食材不必拿出去。

第三，創新速度會被改變。開源像公開積木，全球開發者可以一起改良。有人把模型變小，讓它能在筆電跑；有人讓它更懂中文；有人替它加上查資料、寫程式、接企業系統的能力。這會讓 AI 工具不只集中在幾家大公司手上。

核心概念分解

概念一：開源不等於完全免費。很多人以為開源就是「隨便拿、完全不用錢」。其實要看 license(授權條款)。有些模型允許商業使用，有些要求標註來源，有些對超大企業有額外限制。就像夜市食譜公開，不代表你開連鎖店時不用遵守規則。

概念二：開源也分程度。有的只公開模型權重，有的公開訓練程式碼，有的公開資料處理方法。最完整的開源像把食材來源、烹飪步驟、鍋具設定都寫清楚；較有限的開源則像只給你醬包和調理包。

概念三：閉源不代表不好。閉源模型通常有強大的產品包裝、穩定服務、客服支援和安全機制。對一般使用者來說，打開網頁就能用，遠比自己架模型簡單。像公司行政要用 ChatGPT 寫週報，閉源工具可能最省時間。

概念四：開源模型讓「本地部署」變可能。本地部署就是把模型放在自己的電腦、公司機房或私有雲運行。這對金融、醫療、政府、製造業很重要，因為它們常常不能把內部資料直接丟給外部服務。

概念五：代表模型各有定位。Llama 讓全球開發者有高品質基礎模型可用；Mistral 以效率和歐洲 AI 生態受到重視；DeepSeek 則因推理能力、中文能力與成本效率受到關注。它們不只是模型名字，更像三股力量：美國科技大廠、歐洲新創、中國研發團隊一起推動競爭。

實際例子

例子一：小公司做客服機器人。假設一家台中電商每天收到上千則 LINE(通訊軟體) 和 Discord(社群通訊平台) 訊息，內容包含退貨、尺寸、物流查詢。若用閉源模型，最快的方法是接 API，幾天就能上線。但每次對話都會產生成本，資料也要送到外部服務。

如果它改用 Llama 或 Mistral 這類開源模型，就能把常見問題、商品資料、退貨政策整理後，部署在自己的伺服器。前期需要工程師設定，但長期成本可能更可控，也能針對台灣用語調整，例如「超商取貨」「貨到付款」「七天鑑賞期」。

例子二：中文知識助理。某補習班想做一個 AI 助教，能解釋國中數學、幫老師整理講義。它可以使用中國通義千問或 DeepSeek 這類中文能力強的模型，也可以選擇閉源服務追求穩定。若教材是內部資產，就可能偏向開源或私有部署，避免資料外流。

例子三：個人使用者寫週報。你只是想輸入 prompt(指令)：「幫我把這週工作整理成主管看得懂的週報。」這時閉源工具通常更方便，因為你不用管顯卡、伺服器、模型版本。但如果你是工程師，想做一個離線週報工具，不希望公司內容出網路，開源模型就很有吸引力。

常見誤解

誤解一：開源模型一定比較弱。早期常常如此，但現在差距快速縮小。某些任務上，開源模型已經能接近甚至超過部分閉源模型。尤其在特定領域微調後，效果可能非常好。

誤解二：閉源模型一定比較安全。閉源服務通常有成熟安全設計，但資料仍可能需要傳到供應商。對某些企業來說，「資料不離開公司」才是最重要的安全條件。

誤解三：開源就是人人都能自己訓練一個 ChatGPT。訓練頂級大模型需要大量資料、算力和工程經驗，不是下載檔案就完成。比較常見的做法是拿現成開源模型來部署、微調或接上公司資料。

誤解四：只要模型開源，就沒有商業價值。相反，開源可能帶來更大的生態。公司可以賣雲端部署、企業支援、客製化微調、安全審查、硬體設備。就像 Android(安卓系統) 開放後，反而形成手機、應用程式和服務的大市場。

總結來說，閉源像「買現成好用的家電」，開源像「可改裝的工具箱」。你不一定要自己修電器，但知道差別後，才懂企業為什麼願意投入這場競爭。

今天小測驗（3 題）

第 1 題：閉源大模型最典型的特徵是什麼？

A. 一定完全免費
B. 核心模型細節通常不完整公開，用戶多透過服務使用
C. 只能在自己的電腦離線使用
D. 不能拿來寫中文

查看答案與解析

答案：B。閉源模型通常以網站或 API 形式提供服務，使用方便，但模型權重、訓練細節等核心內容多不公開。

第 2 題：企業選擇開源模型的一個重要原因是什麼？

A. 可以更容易做本地部署，提升資料掌控度
B. 永遠不需要工程師
C. 一定比所有閉源模型更強
D. 不需要看授權條款

查看答案與解析

答案：A。開源模型常被用於公司內部伺服器或私有雲，適合對資料安全、成本控制、客製化有需求的場景。

第 3 題：Llama、Mistral、DeepSeek 重要的共同原因是什麼？

A. 它們讓開源大模型生態更成熟，促進競爭與創新
B. 它們都只能回答英文問題
C. 它們都不允許任何商業應用
D. 它們讓所有人不需要學習 AI

查看答案與解析

答案：A。這些模型代表開源大模型的重要力量，讓更多開發者和企業能參與 AI 應用，降低門檻並推動產業競爭。