AO 代理 AI 工作流 · Agent OS ← 總覽

模組 2 | 工具功能逐一拆解

工具地圖:這件事該交給誰

同一件事,用對工具五分鐘搞定,用錯工具卻越改越亂。這個模組把三師爸頻道半年來示範過的 AI 工具,一個一個拆開來看:它是什麼定位、最關鍵的功能在哪、三師爸實際怎麼用、以及操作時最容易踩的雷。看完你會有一張清楚的「分工地圖」——拿到任務先問一句:這該交給誰。

怎麼讀這個模組:每個工具都用四格框架——定位它在工作流裡扮演什麼角色、關鍵功能真正值得學的那一兩招、主推用法三師爸示範的實戰場景、操作要點新手最容易卡住或弄錯的地方。建議先掃過全表,再回頭細讀你現在最用得到的那幾個。

Anthropic | 同一個大腦,六種身體

Claude 的六種型態

很多人以為 Claude 就是「那個聊天視窗」,其實同一個模型可以裝進六種不同的「身體」,能力由小到大、權限由淺到深。三師爸的核心提醒是:先搞清楚每種型態「能做什麼、不能做什麼」,再決定要不要往下一階走,而不是一開始就硬學最難的命令列。

型態 定位 關鍵功能 / 限制 三師爸主推用法
Chat 對話 雲端對話,入門首選 擅長文字處理與產出 Office 文件;無法操控本機檔案 日常問答、寫稿、整理資料、產 Word/Excel
Cowork 協作 桌面版,會動你的電腦檔案 分析檔案內容、辨識重複、自動分類與刪除;會真的刪檔 一句提示詞整理上千個亂檔,產出整理報告
Code 開發 桌面版/CLI,寫程式與自動化 桌面版有圖形介面與 Plan mode;CLI 權限最高、學習曲線最陡 串接 GitHub、Supabase/Firebase,自然語言開發網站
Skills 技能 把固定流程封裝成可重用 SOP 分對話型(雲端)與檔案型(本地、可跑 Python/出 PDF,較強) 用 Skill Creator 做「備課技能」「出題技能」,一句話跑整輪
Design 設計 幫現有網頁做視覺美化 貼網址+截圖描述就能改版;可「Hand off to Claude Code」回寫程式 把自己做的小工具/遊戲一鍵升級成專業外觀
Dispatch 派遣 用手機遠端操控桌面 Claude 手機下指令、電腦端執行並回傳;它無法自動登入,帳號要先登好 人不在電腦前也能叫電腦生考卷、查資料、管留言
常見誤區:以為「越高階越好」就一步登天去學 CLI。三師爸的建議路徑是 Chat → Code 桌面版 →(真有需要再)CLI,而且「我做這些是為了解決我自己的問題」才是重點,不是為了炫技。另一個雷:Cowork 是會真的刪檔案的,按下執行前一定要看清楚它要刪哪些。
「你必須要先知道他能做什麼、不能做什麼……你真正要問自己的是,你要用這些工具要做什麼。」

OpenAI | 省錢開發 × 平價生圖

ChatGPT、Codex CLI、GPT-Image 2

OpenAI 這一邊,三師爸主推兩件事:把 Codex 當「Claude Code 的省錢替身」,以及把 GPT-Image 2 直接「裝進 Claude」變成最便宜的生圖引擎。觀念上他強調——工具本身不重要,重要的是工作流的邏輯不變,哪家便宜好用就換哪家。

01

ChatGPT

通用對話助理。在三師爸的工作流裡多半作為內容生成與發想的一環,與 Gemini、NotebookLM 搭配使用。生圖部分若直接訂閱網頁版較貴,因此他改走 API(見右)。

02

Codex CLI

「便宜版的開發代理」。能力與 Claude Code 接近但成本低很多。靠 AGENTS.md 記專案進度、用「收工」指令一次 commit+部署+寫回紀錄;新對話讀 AGENTS.md 就接得回來。

03

GPT-Image 2

用 API 接進 Claude 的生圖引擎,每張約台幣 0.3 元(1024×1024)。比訂閱網頁版划算,最低品質就很堪用。是其他技能的「燃料」——考卷、簡報、遊戲素材都能配圖。

  1. Step 01

    Codex 安裝後先把「核准政策」設成 on request、沙盒設成 Workspace write,關掉「完整存取權」降低風險。

  2. Step 02

    一次把完整指令交給它(分析→萃取→產出全寫在同一段提示詞),這是最省 Token 的做法;別一步一步餵。

  3. Step 03

    流程穩定後叫它「打包成技能」,存進 Codex/Skills;要生圖就接 GPT-Image 2,先去 OpenAI 儲值並關閉自動儲值

安全要點(務必記住):OpenAI API Key 一旦離開建立視窗就再也看不到——複製後要立刻存好,遺失就刪掉重建。一定要關閉 Auto Recharge,否則 Key 外洩會被人「用爆」自動扣款。Codex 的「自動審核」雖然能讓 AI 不中斷地連續工作,但用量會跑很快,沒紀律很容易把額度用光。
「生圖不是終點,是其他技能的燃料。」

Google | 搜尋、生圖、知識庫、代理平台

Gemini 生態系全覽

Google 這一塊最龐大,從找資料、生圖、做有聲書、無程式自動化,到代理 AI 平台都有。先掌握一條主線——三師爸最常講的工作流是「搜索 → 檢索 → 生成」:用 Gemini Deep Research 找最新資料,丟進 NotebookLM 做精準檢索,最後再生成成品。三者用錯地方(例如拿生成工具去做搜尋)就很危險。

G1

Gemini 本體

Deep Research 會擬研究計畫、可背景跑、附引用來源;Canvas 用自然語言寫文章/簡報/網頁(vibe coding);Gem 把單一重複任務做成自訂機器人;排定動作讓它每天定時做事(如早報天氣+行程)。

G2

Nano Banana Pro

Gemini 的生圖模型。中文字渲染特別強、支援 4K。關鍵操作:圖含繁中或資訊圖表時,務必選「思考型」模型避免亂碼。資訊圖表單張文字建議控制在 50 字內。

G3

Storybook

一句需求就生成「有聲繪本」——圖片+朗讀語音。可全螢幕觀看、分享含語音的公開連結,或下載成無語音 PDF。適合快速產教學或娛樂故事。

G4

OPAL

no-code 工作流平台。當任務是「多模態或多步驟整合」、單一 Gem 做不來時用它。用「輸入→生成→輸出」三段描述需求,進階編輯器還能替每個步驟挑不同模型。

G5

NotebookLM

來源式問答的核心。只用你給的資料、不用預訓練資料,所以精準、少幻覺。能產 Audio Overview、簡報、資訊圖表、資料表;附引用來源可回查。

G6

AntiGravity 2.0

agent-first 的開發平台。內建 Agent Manager 可同時管理多個代理並行作業,是 Google 把「代理 AI」推上檯面的主力平台。

NotebookLM 五大教學場景

三師爸特別強調:教學要「精準對焦、不超範圍」時,NotebookLM 遠勝 Gemini,因為它被系統提示詞鎖死只能用你提供的來源。

場景 怎麼用
精準教案設計把備課用書當來源,生出緊扣學習目標、不離題的內容
一致性評分放入評分量表+樣卷,每次批改標準一致;可配試算表潤飾評語
法規查詢餵入校規或教育法規,避免 AI 擅自補充編造
知識過濾分析丟入科展作品/小論文,分析精髓與得獎原因
封閉式測驗放歷屆試題/特定文章,出題保證不超出範圍
選 Gemini 還是 NotebookLM?要創意、要發想、要混合既有知識 → Gemini;要精準、要依資料回答、要避免幻覺 → NotebookLM。把學生個資丟進雲端工具前務必去識別化(只留座號),這是三師爸反覆提醒的紅線。
「最好的 AI 工作流,是你先上網搜尋最新資料,提供檢索資料,最後再用 AI 生成你最終想要的成品。」

開源陣營 | 多模型分工

OpenCode:免費開源的 Agent CLI

如果說 Codex 是「便宜」,OpenCode 走的是「免費+開源+多模型」這條路。它最大的特色是讓不同模型各司其職——用聰明的模型負責「規劃」,再交給便宜甚至免費的模型「出工」執行,把成本壓到最低。

定位

免費開源 Agent CLI

與 Claude Code、Codex 同屬「會操作檔案、能執行程式」的 AI 代理,但開源且可自由接各家模型,沒有單一廠商綁定。

玩法

聰明規劃 × 便宜執行

把任務拆成「思考」與「動手」兩層:高階模型做架構與規劃,低階/免費模型做重複勞動。延續了「工具不重要、工作流邏輯不變」的觀念,哪家划算就換哪家。

觀念連結:Claude Code、Codex、OpenCode 其實是同一種「代理」的不同品牌。只要你的 Obsidian 筆記、GitHub、資料庫是跟 Agent 解耦的,換哪家代理都能接續同一個專案——這正是三師爸要大家建立的「Agent 無關工作流」心態。

課堂專用 | 教學三件套

給老師的互動工具組

除了通用 AI,還有三個專為「課堂互動」設計的工具,門檻低、學生友善,是把 AI 變成課堂能量的捷徑。

T1

Edcafe.ai

課堂 Chatbot + 評語機器人。能在課堂上佈署專屬對話機器人輔助學生,也能批次協助產生學生評語,把重複的文字工作交給 AI。

T2

Padlet Arcade

AI 生成互動遊戲。上傳 PDF 或打字描述,自動生成配對卡、排序、填空、記憶圖塊等題型;學生免註冊,掃 QR/輸入名字就能玩,還有排行榜。

T3

Canva Code

中文一句話生互動小程式。不用會寫程式,描述需求就能做出可互動的網頁小工具或教具,再嵌進簡報或白板。

選用要點:Padlet Arcade 在自家平台內嵌支援度最高,嵌到 Canva/PowerPoint 通常要點連結才能開;MyViewBoard 等數位白板可直接內嵌即時玩。三件套的共同優勢都是降低學生參與門檻——不必登入、操作直覺。

時效提醒 | 工具會改名換代

注意:Gemini CLI 即將被取代

⏰ 2026-06-18 起,Gemini CLI 將對免費用戶停用,改由 AntiGravity CLI(指令 agy 接手。

這正好呼應整個模組的核心心態:工具會改名、會換代,但「工作流邏輯」不變。只要你把筆記、程式倉庫、資料庫與代理工具解耦,工具一換,你只要學新的指令名稱,原本的做事方法照樣搬得過去。看到工具更新別慌——先問它取代了誰、新指令叫什麼,其餘照舊。

帶走這一頁 拿到任務先對照地圖:要找最新資料找 Deep Research、要依文件精準回答找 NotebookLM、要動本機檔案找 Cowork、要寫程式找 Code/Codex/OpenCode、要美化網頁找 Design、人不在電腦前找 Dispatch、課堂互動找教學三件套。對的工具,是讓 AI 替你工作的第一步。

模組導覽

← 上一模組:心態與全景 | 下一模組:實戰工作流 →