Day 72026-05-17 · AI 學習日記

第 7 天:開源 vs 閉源大模型——Llama、Mistral、DeepSeek 為什麼重要

如果把 AI(人工智慧) 想成一間餐廳,閉源大模型就像高級連鎖餐廳:你點菜、付錢、吃到穩定品質,但廚房怎麼做你看不到。開源大模型則像公開食譜的料理社群:大家看得到做法,能自己改口味,也能開新店。今天我們要用白話搞懂:為什麼 Llama、Mistral、DeepSeek 這些模型,正在改變整個 AI 產業。

3 分鐘秒懂

大模型通常指 LLM(大型語言模型),也就是像 ChatGPT、通義千問、DeepSeek 這類能讀文字、寫文章、回答問題、寫程式的 AI 系統。

所謂閉源,不是說你不能用,而是它的核心「配方」通常不公開。你可以透過網站或 API(應用程式介面) 使用,例如 OpenAI(開放人工智慧公司) 的 GPT(生成式預訓練轉換器) 系列、Anthropic(人工智慧公司) 的 Claude(克勞德模型)、Google(谷歌) 的 Gemini(雙子星模型)。你像是叫外送:方便、品質穩,但餐廳掌握一切。

開源則是把模型權重、程式碼或訓練方法的一部分公開,讓開發者、公司、研究者能下載、部署、調整。代表例子包括 Llama(美國 Meta 推出的開源大模型系列)、Mistral(法國 Mistral AI 推出的模型系列)、DeepSeek(中國深度求索推出的模型系列)。你像是拿到食譜和半成品,可以自己加辣、少鹽、改成素食版。

一句話記:閉源強在省心與商用品質,開源強在自由、可控、可改造。

為什麼這重要

你可能會問:「我只是用 ChatGPT 寫週報,開源閉源跟我有什麼關係?」其實關係很大。

第一,價格會被改變。當只有少數閉源公司提供強模型,大家都得照它們的價格走。開源模型變強後,企業可以自己部署,或用競爭者服務,整體成本就有機會下降。

第二,資料安全會被改變。假設一間台灣醫院想用 AI 整理病歷,資料很敏感,不一定適合全部送到外部雲端。若使用開源模型,就能放在自家伺服器裡運行,像把廚房建在自己家,食材不必拿出去。

第三,創新速度會被改變。開源像公開積木,全球開發者可以一起改良。有人把模型變小,讓它能在筆電跑;有人讓它更懂中文;有人替它加上查資料、寫程式、接企業系統的能力。這會讓 AI 工具不只集中在幾家大公司手上。

核心概念分解

概念一:開源不等於完全免費。很多人以為開源就是「隨便拿、完全不用錢」。其實要看 license(授權條款)。有些模型允許商業使用,有些要求標註來源,有些對超大企業有額外限制。就像夜市食譜公開,不代表你開連鎖店時不用遵守規則。

概念二:開源也分程度。有的只公開模型權重,有的公開訓練程式碼,有的公開資料處理方法。最完整的開源像把食材來源、烹飪步驟、鍋具設定都寫清楚;較有限的開源則像只給你醬包和調理包。

概念三:閉源不代表不好。閉源模型通常有強大的產品包裝、穩定服務、客服支援和安全機制。對一般使用者來說,打開網頁就能用,遠比自己架模型簡單。像公司行政要用 ChatGPT 寫週報,閉源工具可能最省時間。

概念四:開源模型讓「本地部署」變可能。本地部署就是把模型放在自己的電腦、公司機房或私有雲運行。這對金融、醫療、政府、製造業很重要,因為它們常常不能把內部資料直接丟給外部服務。

概念五:代表模型各有定位。Llama 讓全球開發者有高品質基礎模型可用;Mistral 以效率和歐洲 AI 生態受到重視;DeepSeek 則因推理能力、中文能力與成本效率受到關注。它們不只是模型名字,更像三股力量:美國科技大廠、歐洲新創、中國研發團隊一起推動競爭。

實際例子

例子一:小公司做客服機器人。假設一家台中電商每天收到上千則 LINE(通訊軟體) 和 Discord(社群通訊平台) 訊息,內容包含退貨、尺寸、物流查詢。若用閉源模型,最快的方法是接 API,幾天就能上線。但每次對話都會產生成本,資料也要送到外部服務。

如果它改用 Llama 或 Mistral 這類開源模型,就能把常見問題、商品資料、退貨政策整理後,部署在自己的伺服器。前期需要工程師設定,但長期成本可能更可控,也能針對台灣用語調整,例如「超商取貨」「貨到付款」「七天鑑賞期」。

例子二:中文知識助理。某補習班想做一個 AI 助教,能解釋國中數學、幫老師整理講義。它可以使用中國通義千問或 DeepSeek 這類中文能力強的模型,也可以選擇閉源服務追求穩定。若教材是內部資產,就可能偏向開源或私有部署,避免資料外流。

例子三:個人使用者寫週報。你只是想輸入 prompt(指令):「幫我把這週工作整理成主管看得懂的週報。」這時閉源工具通常更方便,因為你不用管顯卡、伺服器、模型版本。但如果你是工程師,想做一個離線週報工具,不希望公司內容出網路,開源模型就很有吸引力。

常見誤解

誤解一:開源模型一定比較弱。早期常常如此,但現在差距快速縮小。某些任務上,開源模型已經能接近甚至超過部分閉源模型。尤其在特定領域微調後,效果可能非常好。

誤解二:閉源模型一定比較安全。閉源服務通常有成熟安全設計,但資料仍可能需要傳到供應商。對某些企業來說,「資料不離開公司」才是最重要的安全條件。

誤解三:開源就是人人都能自己訓練一個 ChatGPT。訓練頂級大模型需要大量資料、算力和工程經驗,不是下載檔案就完成。比較常見的做法是拿現成開源模型來部署、微調或接上公司資料。

誤解四:只要模型開源,就沒有商業價值。相反,開源可能帶來更大的生態。公司可以賣雲端部署、企業支援、客製化微調、安全審查、硬體設備。就像 Android(安卓系統) 開放後,反而形成手機、應用程式和服務的大市場。

總結來說,閉源像「買現成好用的家電」,開源像「可改裝的工具箱」。你不一定要自己修電器,但知道差別後,才懂企業為什麼願意投入這場競爭。

今天小測驗(3 題)

第 1 題:閉源大模型最典型的特徵是什麼?

A. 一定完全免費
B. 核心模型細節通常不完整公開,用戶多透過服務使用
C. 只能在自己的電腦離線使用
D. 不能拿來寫中文

查看答案與解析

答案:B。閉源模型通常以網站或 API 形式提供服務,使用方便,但模型權重、訓練細節等核心內容多不公開。

第 2 題:企業選擇開源模型的一個重要原因是什麼?

A. 可以更容易做本地部署,提升資料掌控度
B. 永遠不需要工程師
C. 一定比所有閉源模型更強
D. 不需要看授權條款

查看答案與解析

答案:A。開源模型常被用於公司內部伺服器或私有雲,適合對資料安全、成本控制、客製化有需求的場景。

第 3 題:Llama、Mistral、DeepSeek 重要的共同原因是什麼?

A. 它們讓開源大模型生態更成熟,促進競爭與創新
B. 它們都只能回答英文問題
C. 它們都不允許任何商業應用
D. 它們讓所有人不需要學習 AI

查看答案與解析

答案:A。這些模型代表開源大模型的重要力量,讓更多開發者和企業能參與 AI 應用,降低門檻並推動產業競爭。