起點檢測

你現在在哪裡?

照鏡子

這一站不是課，是照鏡子。把整份 HTML 貼進聊天視窗、改完再整段複製回檔案、來回十幾次、月中就把訂閱額度燒完——你不孤單，大多數人都停在這一站。你浪費的不只是額度，是你自己的時間。

這一站解鎖

誠實面對自己現在的用法
算出你每個月浪費在「複製、貼上、找貼錯的地方」的時間
知道同一件事在後面的站只要十分之一的時間

技能點詳解

每個技能點先給重點（讀這個就夠用）；想深入的話，展開看完整說明與實作步驟。

AI 其實在做什麼：一個字一個字猜下去

AI 不是去資料庫查答案，它是根據你前面的話，猜下一個最可能出現的字，一個字一個字接下去。這個機制讓它講話很順、什麼風格都寫得出來——但也讓它會很流暢地講出「聽起來對、其實是錯」的話。搞懂這一件事，後面所有現象都解釋得通。

它是超強版的「輸入法選字」，不是搜尋引擎：它沒在查資料，是在猜最順的下一個字。
順 ≠ 對：它天生追求「讀起來最像對的」，不是「查證過是對的」——這兩者常常一致，但不保證。
錯最容易出在「很具體」的地方：人名、日期、數字、法條、網址、引述——愈精確的宣稱，愈要查。
它很有自信地講錯，叫做「幻覺」：不是故意騙你，是它在把空白補成「看起來最合理」的樣子。
同一個問題問兩次，答案可能不一樣：因為它每次是「抽」下一個字，不是背標準答案。

深入研讀 · 實作步驟收合

影片來源：Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

先破一個最常見的誤會：很多人以為 AI 像 Google，你問問題、它去某個大資料庫把答案「查」出來給你。不是這樣。今天講的這種 AI（會幫你寫信、寫文案、寫程式的生成式 AI）比較像你手機輸入法的「選字」功能，只是強大了幾百萬倍。你打「今天天氣真」，輸入法會跳出「好」；AI 做的是同一件事的放大版——看你前面所有的字，算出「下一個最可能是什麼字」，選一個接上去，然後把這個字也算進去、再猜下一個，就這樣一個字一個字把整段話「接」出來。它腦中沒有一格一格存好的答案，它是在「續寫」。

這個機制解釋了 AI 為什麼這麼強：因為它讀過海量的文章，什麼句子後面通常接什麼，它抓得非常準，所以講出來的話很順、很自然，你要它換成正式公文、輕鬆貼文、條列摘要，它都接得漂亮。上方影片會示範這個「自動接龍」的過程。但同一個機制也埋了一個陷阱：它追求的是「接起來最像對的」，不是「查證過確實是對的」。大部分時候這兩者剛好一樣，所以它看起來很可靠；可是一旦遇到它沒把握的地方，它不會停下來說「我不知道」，而是照樣補一段「聽起來最合理」的內容給你——這就是所謂的幻覺（hallucination）：一本正經地講一件不存在的事。

關鍵是要知道錯誤會集中在哪裡。愈是「具體、精確」的東西，愈是幻覺的重災區：某某人的頭銜、某條法規的編號、某個統計數字、一段「原文引述」、一個網址。因為這些東西只有一個正確答案，而它是用「猜最順」的方式生出來的，猜錯的機率就高。反過來，像「幫我把這封信改客氣一點」「解釋一下什麼是毛利率」這種常見、不依賴單一精確事實的任務，它就非常穩。所以你要記住一句鐵律：AI 講得多有自信，跟它對不對，是兩回事。流暢的文筆可以包住一個瞎猜的數字，而你完全看不出來。

還有一個很多人覺得「怪」的現象也是這樣來的：同一個問題，你問兩次、或換個對話再問一次，答案可能不完全一樣。這不是它壞掉，而是它每一步是從「幾個可能的下一個字」裡抽一個出來，帶點隨機，不是在背一份固定的標準答案。理解了這點，你就不會再期待它像計算機一樣每次吐出一模一樣的東西，而會把它當成一個「每次都重新幫你寫一遍」的寫手。

實作步驟

先改掉「它在查資料」的心智模型 每次用它之前，心裡換成一句話：它是在猜最順的下一句，不是在查證的資料庫。光是這個念頭轉過來，你就會自動對它的答案多留一分戒心。
把任務分成「求順」還是「求準」 要它改寫、摘要、發想、解釋常識（求通順）→ 放心用。要它給精確事實：數字、法條、日期、出處（求準確）→ 預設要查。
對「很具體的宣稱」自動亮紅燈 看到它給出人名、頭銜、統計數字、法規條號、網址、原文引述——這些就是幻覺最愛出現的地方，別直接採信，尤其是要送客戶或牽涉金錢法規的。
用「你會的領域」測一次它 拿一個你自己是行家的主題，叫它講五個具體事實（數字、出處都要），逐一查證。你會親眼看到它哪裡準、哪裡開始編——這種體感比看十篇文章都有用。
重要的事，逼它附出處或開搜尋 關鍵內容叫它標明來源、或打開網路搜尋再回答，讓答案有現實依據；你自己再獨立查一次最關鍵的那幾個數字。

例子：同一個 AI，一個能放心、一個要查

這樣寫

幫我查一下《勞基法》第幾條規定特休可以遞延，順便給我確切條文和最新修法日期

改成這樣

（求順的活它很穩）幫我把這段給員工的特休說明改得更白話、更親切，三段以內。（求準的活自己把關）法條條號和修法日期我不直接信 AI，改去勞動部網站查證，或叫它開網路搜尋並附上官方連結再核對一次。

常見踩雷

把它當 Google 用，看到答案講得頭頭是道就直接貼給客戶——最像真的的那一句，往往就是它編的。
在自己不懂的領域問它精確事實，然後沒能力查證就照用——你根本不會發現它在唬爛。
看到它兩次答案不一樣就以為「壞了」或「這次比較準」，其實只是它每次都重猜，該查的還是要查。

深入來源：AI Capabilities and Limitations・Next Token Prediction

它知道什麼、不知道什麼

AI 的知識全部來自「訓練時讀過的資料」，而且到某個日期就停住了（知識截止點）。所以：它不知道上週的新聞、不知道你公司內部的事、冷門或地方性的主題容易亂掰。搞清楚它「肚子裡有什麼」，你就知道什麼可以直接問、什麼得自己餵資料或另外查。

它有「知識截止點」：訓練資料收到某個日期為止，之後發生的事它天生不知道。
它完全不知道你公司的事：你的報價、客戶、內規、上週的會議——沒餵給它，它只能猜。
主流的事很強、冷門的事容易掰：常見、被寫很多的主題它很準；小眾、地方、剛改的規定就靠不住。
它會「舊資訊當現在講」：法規、工具、價格改過了，它可能還用舊的講得很篤定。
它記不得「在哪讀到的」：說得出內容、卻說不清出處——所以「它說有這規定」不能當證據。

深入研讀 · 實作步驟收合

影片來源：Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

接著上一個技能點：既然 AI 是靠「讀過的東西」在猜下一個字，那它到底讀過什麼、就決定了它「懂什麼」。可以想成它在上線之前，被關進一間超大圖書館狂讀了好幾年，讀完就把門關上、開始上工。從此之後有三件事你一定要記得：第一，圖書館的門是有關門時間的——這叫「知識截止點」。關門之後世界上發生的事，它讀不到，所以你問它上週的新聞、今年最新的補助方案，它要嘛老實說不知道，要嘛（更常見）拿關門前的舊資訊、用很篤定的語氣講給你聽。上方影片會解釋這個「讀到某天為止」是怎麼回事。

第二，也是中小企業最容易忽略的：那間圖書館裡沒有任何一本是關於你公司的書。你的報價策略、客戶名單、內部流程、老闆昨天交代的方向、上個月那場會議的結論——這些從來不在它的訓練資料裡。所以你直接問「我們公司這種案子通常報多少」，它只能拿「一般行情」來猜，猜得再順也跟你的實際狀況無關。這不是它笨，是它根本沒這份資料。解法很簡單也很關鍵：把相關背景貼給它、當場餵給它（你的報價表、品牌語氣範例、這個客戶的往來紀錄），它就能用「你的現實」來幫你，而不是用「網路平均值」。

第三，它懂的深淺非常不平均。一個主題如果在網路上被寫過千百遍（常見的行銷觀念、通用的 Excel 用法、主流程式語言），它就懂得又深又準；但如果是小眾、地方性、剛改沒多久的東西——某個公會的最新規定、某縣市特有的補助、某個冷門工具上週發布的新功能——它讀到的資料本來就少，就很容易「用零星印象硬拼一個聽起來合理的答案」。台灣的在地法規、健保申報細則、地方稅務這類，尤其要小心：它可能講得很順，卻是錯的或過時的。

最後補兩個它「知識」上的毛病。一是舊當新講：某條規定去年改了、某個軟體介面換了、某個價格漲了，它腦中可能還是舊版，卻不會提醒你「這可能過時」。二是記不得出處：它能告訴你「有這麼一條規定」，但通常說不清是哪部法、哪一條、哪個官方文件——就像有人跟你說「我好像在哪看過」，那不能當證據。所以務實的做法是：凡是會過時、會因地不同、或牽涉法規金錢的，把它當「給你方向的助手」，最終數字和條文自己去官方來源查證，或叫它開網路搜尋、把資料餵給它。

實作步驟

問之前先判斷：這它可能知道嗎？ 心裡過一遍：這是常見、穩定、寫很多的主題（它多半懂），還是最新、冷門、地方性、或我公司內部的事（它多半不知道或會過時）？
公司內部的事，一律先餵資料 牽涉你的報價、客戶、流程、品牌語氣——別指望它通靈。把相關文件、範例、背景貼進對話當場給它，它才能用你的現實而不是網路平均值來答。
時效性問題，開網路搜尋 問新聞、最新法規、今年補助、價格這類會變的東西，打開網路搜尋功能再問，繞過它的知識截止點；沒搜尋就別信它給的「最新」。
在地與冷門主題，加倍查證 台灣特有法規、健保申報、地方稅務、小眾工具的細節——它最容易在這裡編。關鍵條文和數字，一律回官方來源核對。
要它報出處，你再抽查 重要答案叫它附上來源連結；別全信，挑最關鍵的一兩項自己點進去看是不是真的、是不是最新的。

例子：同一題，餵資料前後差很多

這樣寫

我們這種社群代操的案子，通常報價多少比較合理？

改成這樣

（先餵它你的現實）「這是我們過去一年 12 個社群代操案的報價和成交結果〔貼上〕，也附上我們的成本結構〔貼上〕。根據這些，幫我分析這個新客戶（月預算約 8 萬、要求每週 5 篇貼文）合理的報價區間，並點出可能的風險。」——它用你的真實資料算，才有意義；問「一般行情」只會得到跟你無關的網路平均。

常見踩雷

問它公司內部或客戶專屬的事、卻沒餵任何背景資料，然後嫌它「答得很空」——它本來就沒這份資料。
問今年最新的法規、補助、價格，忘了開網路搜尋，結果拿到它關門前的舊資訊還當成最新的用。
在台灣在地法規、健保、稅務這類冷門又常改的主題上直接採信它，沒回官方查證——這是最容易出包的地雷區。

深入來源：AI Capabilities and Limitations・Knowledge

它會忘：對話的「工作記憶」有上限

AI 在一個對話裡能「同時記住」的內容有一個固定上限，叫做脈絡視窗（context window）。就像一張有限大小的桌子——東西擺得下就都看得到，一旦超過，前面的就被擠掉，而且它不會提醒你。這解釋了為什麼一個對話講太久它會開始忘東忘西、答非所問。學會適時重開，是省時間的關鍵習慣。

一個對話的記憶有上限：不是無限大，塞太多、講太久，前面的內容會被擠出去。
它會「無聲地」忘記：超過上限不會跳警告，它只是默默看不到前面，答案開始走鐘。
換一個新對話＝失憶重來：這個對話教它的事、給它的背景，開新對話它一概不記得。
你的糾正不會「學進去」：它只對「現在這張桌上還看得到的東西」有反應，關掉就沒了。
重要的事放最前面、講最清楚：埋在一長串中間的關鍵指令，它最容易漏看。

深入研讀 · 實作步驟收合

影片來源：Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

前面兩個技能點講的是它「肚子裡有什麼」（訓練知識）。這一個講的是完全不同的東西：它「現在這一刻，眼睛正盯著什麼」。你在一個對話裡打的字、貼的文件、它自己的回覆，全部要擠進一個固定大小的空間，這個空間叫脈絡視窗。最好懂的比喻是一張桌子：桌面就這麼大，你把資料一張張攤上去，只要擺得下，它一眼全看得到、用得上；可是桌子會滿，當你不斷加東西、對話愈拉愈長，最早放上去的那幾張就會被擠到桌子邊、掉到地上——它就再也看不到了。上方影片會把這個「有限桌面」講清楚。

這個限制有一個跟前面很不一樣的性質：它是「懸崖式」的，不是「慢慢變差」的。知識不足是漸進的（愈冷門愈不準），但記憶爆掉是突然的——前一刻還好好的，多貼一份長文件、多聊幾十輪，它忽然就開始忘記你一開始的設定、重複問你已經講過的事、或給出跟前文兜不起來的答案。最麻煩的是它不會跳出來說「我記不下了」，它只是默默地看不到前面，然後一樣很有自信地繼續答。很多人遇到「這 AI 怎麼愈聊愈笨」，其實就是撞上了這道牆而不自知。

由此帶出兩個常被誤會的重點。第一，換新對話等於全新的它。這個對話裡你花半小時教它的公司規矩、餵它的背景、糾正它的地方——只要你開一個新對話，它完全不記得，一切從零開始。它不像同事會把你上次講的記在腦子裡；它的「記憶」只活在「當前這張桌子」上，桌子一收（關掉或開新對話），就清空了。第二，你的糾正沒有「教會」它。你在對話裡說「不對，我們公司不這樣」，它會在這個對話裡照做，但這不是它「學到」了——換個對話它又會犯同樣的錯。真正要它「長期記得」，得靠後面會學的專案/長期記憶功能（R4 會深入），不是靠一直在對話裡重講。

知道這些，實務上就有明確對策。其一，重要的東西放最前面、講最清楚。把關鍵指令、背景、規矩擺在對話開頭一次講足，別零零散散埋在一長串中間——桌子中央的東西它最容易漏看（這現象叫「lost in the middle」，中間的最不受注意）。其二，一個對話別扛太多任務。一件事告一段落、或你發現它開始忘東忘西、答非所問，就是該開新對話的訊號；把「現在才想清楚的完整需求」在新對話裡一次講好，通常比在舊對話裡硬救更快、更乾淨。這也呼應後面 R4 會教的 context 管理——「什麼時候該清空重來」是一個會愈練愈準的手感。

實作步驟

把關鍵設定放在開頭一次講足 公司背景、語氣要求、格式規矩、最重要的指令——在對話一開始就講清楚，別分散埋在後面一長串裡，中間的東西它最容易漏。
一個對話只做一件事 別把「寫貼文＋算報表＋改合約」全塞進同一個對話。換任務就換對話，桌面乾淨，它才不會被無關的舊內容干擾。
看到這些訊號就準備重開 它開始重複問你已經講過的事、忘記一開始的設定、答案前後兜不起來——這就是記憶爆了。別再硬拗，開新對話。
重開時，把需求一次重述清楚 開新對話別假設它記得舊的。把你現在想清楚的完整需求＋必要背景重新一次講好，通常比在亂掉的舊對話裡繼續補救更快。
要它長期記得，用專案而不是重講 如果某些背景（公司簡介、品牌語氣）每次都要用，別每個對話重貼——用專案／長期記憶功能存起來（R4 會教），一勞永逸。

例子：一個對話撐太久 vs. 適時重開

這樣寫

在同一個對話裡連續聊了三小時：先寫五篇貼文、又貼了一份 30 頁報告要它摘要、再叫它改合約、最後回頭問「幫我照我們公司語氣再修那五篇貼文」——結果它把品牌語氣的設定忘光了，改得四不像。

改成這樣

發現它開始忘東忘西，就開一個新對話：「你是絲萬萬社群小編，品牌語氣是〔貼上語氣範例〕。以下五篇貼文請照這個語氣修〔貼上五篇〕。」桌面乾淨、指令在最前面，一次就到位。長期會用到的語氣範例，另外存進專案，之後不必再貼。

常見踩雷

把一個對話當成無底洞，什麼任務都往裡塞，聊到它開始鬼打牆還不換——愈聊愈笨其實是記憶爆了。
以為在對話裡糾正過、它就「學會」了，結果開新對話它照樣犯同樣的錯——它不會跨對話記住。
把最重要的指令埋在一長串貼文的中間，然後怪它沒照做——中間的內容它最容易漏看。

深入來源：AI Capabilities and Limitations・Working Memory

什麼能交給它、什麼要盯著

把前面三件事（它在猜字、知識有邊界、記憶有上限）合起來，就能判斷一件工作到底該放心交、盯著點、還是根本別交。真實世界的出包，多半是兩個弱點同時發作——比如「猜字＋知識不足」湊出一個超逼真的假數據。認得出是哪兩個在作怪，你就知道該用哪一招補。這一站給你一張隨手可用的判斷準則。

三分法：能放心交／要盯著覆核／別交給它——動手前先把任務歸到其中一格。
出包常是「兩個弱點相撞」：例如猜字＋知識不足＝很逼真的假事實；記憶爆＋你沒重講＝聊到後面走鐘。
能放心交：改寫、摘要、發想、翻譯、解釋常識、換格式——通順型、你也能一眼驗收的。
要盯著覆核：牽涉具體數字、法條、報價、對外文件——它做草稿，你查證後才算數。
別交給它：需要公司內部真實資料它沒有的、需要你獨門判斷或負責任的決定（議價、要不要接案、對客戶的承諾）。

深入研讀 · 實作步驟收合

影片來源：Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

前面三個技能點各講了一個弱點，這一站把它們裝回同一個腦袋裡，變成一張能用的判斷表。因為在真實工作中，AI 出包很少是「單一弱點」乾淨地發作，多半是兩個湊在一起，而且湊起來特別像真的、特別難抓。上方影片就是在講這種「弱點相撞」。認得出是哪兩個在作怪，你就不會亂槍打鳥，而是直接對症下藥。

最常見的相撞一：猜字（愛講具體的）＋知識不足（這塊它不熟）。結果就是它生出一個超逼真的假東西——一條不存在的法規、一個沒發生過的統計數字、一篇查無此人的「引述」。因為它一方面天生會把空白補成「最像對的」，另一方面這個主題它資料又少，兩個一疊，就是最經典的「假到你信」。對策：凡是具體事實（數字、法條、出處、日期）＋又是冷門或在地主題，一律當草稿、自己查證或開搜尋。最常見的相撞二：記憶爆（聊太久忘了）＋你沒重講（以為它記得）。結果是一個長對話聊到後面愈來愈走鐘，它忘了你最初的設定、開始答非所問。對策：重開新對話、把需求重講一次，別在爛攤子上硬修。

把這些收攏成一張三格判斷表，動手前先把手上的任務丟進其中一格。第一格「能放心交」：改寫潤稿、摘要長文、發想點子、翻譯、解釋通用常識、換個格式排版——這些是「通順型」任務，正中它的強項，而且成果你自己一眼就能驗收，錯了也看得出來。這格的東西大膽交，能幫你省最多時間。第二格「要盯著覆核」：任何牽涉具體數字、法條、報價、對外要送出去的正式文件——它可以幫你打草稿、加速，但「它做完 ≠ 可以用」，一定要你查證關鍵事實、確認語氣責任之後才算數。第三格「別交給它」：兩種情況——一是需要「它根本沒有的資料」才能做對的事（你公司內部真實狀況，你若不餵它就別問）；二是需要你的獨門判斷與責任的決定：跟客戶議價、要不要接一個案子、對客戶承諾成效、對外道歉的最終定調。這些 AI 可以陪你想，但拍板必須是人。

要提醒一句：這三格不是固定死的，會隨「你補了什麼」而移動。同一件事，你什麼都不給，它落在「別交」；你把公司資料、範例、背景餵齊，可能就升到「要盯著」甚至「能放心交」。你打開網路搜尋、要它附出處，「查證」這關就輕鬆很多。所以判斷表真正的用法不是把任務判死刑，而是問自己：「要把這件事往『能放心交』那一格推，我還缺補哪一塊？」——是缺背景（餵資料）、缺時效（開搜尋）、還是缺人的判斷（那就人來拍板）。這正是後面 R1「4D 協作思維」要展開的功夫；R0 先讓你把這條線畫出來。

實作步驟

動手前先把任務丟進三格 問自己：這是通順型、我一眼能驗收的（能放心交）？牽涉具體事實或對外文件（要盯著覆核）？還是需要公司內部資料或我的判斷責任（別交）？
「能放心交」的，大膽交、快速用 改寫、摘要、發想、翻譯、換格式——放手讓它做，你省下的時間拿去做只有你能做的事。驗收一眼帶過即可。
「要盯著」的，它做草稿、你查證才算數 牽涉數字、法條、報價、正式對外文件：讓它加速打底，但關鍵事實一律自己查證或開搜尋，語氣與責任你把最後一關。
「別交」的，人來拍板 議價、接不接案、對客戶的承諾、道歉定調——AI 可以幫你列選項、想利弊，但決定和責任是你的，別把工具當成卸責的對象。
出包時，先問「是哪兩個弱點相撞」 假事實 → 多半是猜字＋知識不足，查證＋開搜尋；聊到走鐘 → 多半是記憶爆＋沒重講，重開對話重述需求。認出組合，就知道用哪招。
想把任務往左推，就補那塊缺的 缺公司背景 → 餵資料；缺時效 → 開網路搜尋；缺人的判斷 → 人來定案。三格會隨你補的東西移動，不是判死刑。

判斷準則：一件「幫客戶做提案」拆進三格

這樣寫

（一股腦全丟）幫我做一份給這個客戶的完整提案，包含報價、案例、成效保證，做完我直接寄出去

改成這樣

拆開來分格處理——【能放心交】提案的文案潤飾、結構排版、把賣點寫順：交給它。【要盯著覆核】案例數據、報價金額：先餵它我們真實的成本與過往報價，它算完我逐項查證。【別交給它】要不要對這客戶「保證成效」、最終報多少、寄不寄——這是我的判斷和責任，AI 只幫我列利弊，我拍板。這樣一份提案，該快的地方快、該把關的地方沒漏。

常見踩雷

把整件複雜任務「一股腦全丟」，不分格——結果該查的沒查、該自己決定的也讓 AI 決定了。
出包了只會怪「AI 爛」，卻沒去分辨是哪個弱點在作怪——不對症，下次還是同一個坑。
把三格當成鐵板判死刑，忘了「餵資料、開搜尋、人拍板」可以把任務往『能放心交』推——白白少用了它很多本來能幫上忙的地方。

深入來源：AI Capabilities and Limitations・When Properties Collide

出站條件

用頁面上方的「自我定位」對照三種描述，找到自己的位置。

改編來源： Claude Code Best Practices（常見失敗模式）