← 回到學習地圖
R0

起點檢測

你現在在哪裡?

照鏡子

這一站不是課,是照鏡子。把整份 HTML 貼進聊天視窗、改完再整段複製回檔案、來回十幾次、月中就把訂閱額度燒完——你不孤單,大多數人都停在這一站。你浪費的不只是額度,是你自己的時間。

這一站解鎖

技能點詳解

每個技能點先給重點(讀這個就夠用);想深入的話,展開看完整說明與實作步驟

01

AI 其實在做什麼:一個字一個字猜下去

AI 不是去資料庫查答案,它是根據你前面的話,猜下一個最可能出現的字,一個字一個字接下去。這個機制讓它講話很順、什麼風格都寫得出來——但也讓它會很流暢地講出「聽起來對、其實是錯」的話。搞懂這一件事,後面所有現象都解釋得通。

  • 它是超強版的「輸入法選字」,不是搜尋引擎:它沒在查資料,是在猜最順的下一個字。
  • 順 ≠ 對:它天生追求「讀起來最像對的」,不是「查證過是對的」——這兩者常常一致,但不保證。
  • 錯最容易出在「很具體」的地方:人名、日期、數字、法條、網址、引述——愈精確的宣稱,愈要查。
  • 它很有自信地講錯,叫做「幻覺」:不是故意騙你,是它在把空白補成「看起來最合理」的樣子。
  • 同一個問題問兩次,答案可能不一樣:因為它每次是「抽」下一個字,不是背標準答案。
深入研讀 · 實作步驟 收合

影片來源:Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

先破一個最常見的誤會:很多人以為 AI 像 Google,你問問題、它去某個大資料庫把答案「查」出來給你。不是這樣。今天講的這種 AI(會幫你寫信、寫文案、寫程式的生成式 AI)比較像你手機輸入法的「選字」功能,只是強大了幾百萬倍。你打「今天天氣真」,輸入法會跳出「好」;AI 做的是同一件事的放大版——看你前面所有的字,算出「下一個最可能是什麼字」,選一個接上去,然後把這個字也算進去、再猜下一個,就這樣一個字一個字把整段話「接」出來。它腦中沒有一格一格存好的答案,它是在「續寫」。

這個機制解釋了 AI 為什麼這麼強:因為它讀過海量的文章,什麼句子後面通常接什麼,它抓得非常準,所以講出來的話很順、很自然,你要它換成正式公文、輕鬆貼文、條列摘要,它都接得漂亮。上方影片會示範這個「自動接龍」的過程。但同一個機制也埋了一個陷阱:它追求的是「接起來最像對的」,不是「查證過確實是對的」。大部分時候這兩者剛好一樣,所以它看起來很可靠;可是一旦遇到它沒把握的地方,它不會停下來說「我不知道」,而是照樣補一段「聽起來最合理」的內容給你——這就是所謂的幻覺(hallucination):一本正經地講一件不存在的事。

關鍵是要知道錯誤會集中在哪裡。愈是「具體、精確」的東西,愈是幻覺的重災區:某某人的頭銜、某條法規的編號、某個統計數字、一段「原文引述」、一個網址。因為這些東西只有一個正確答案,而它是用「猜最順」的方式生出來的,猜錯的機率就高。反過來,像「幫我把這封信改客氣一點」「解釋一下什麼是毛利率」這種常見、不依賴單一精確事實的任務,它就非常穩。所以你要記住一句鐵律:AI 講得多有自信,跟它對不對,是兩回事。流暢的文筆可以包住一個瞎猜的數字,而你完全看不出來。

還有一個很多人覺得「怪」的現象也是這樣來的:同一個問題,你問兩次、或換個對話再問一次,答案可能不完全一樣。這不是它壞掉,而是它每一步是從「幾個可能的下一個字」裡一個出來,帶點隨機,不是在背一份固定的標準答案。理解了這點,你就不會再期待它像計算機一樣每次吐出一模一樣的東西,而會把它當成一個「每次都重新幫你寫一遍」的寫手。

實作步驟

  1. 先改掉「它在查資料」的心智模型 每次用它之前,心裡換成一句話:它是在猜最順的下一句,不是在查證的資料庫。光是這個念頭轉過來,你就會自動對它的答案多留一分戒心。
  2. 把任務分成「求順」還是「求準」 要它改寫、摘要、發想、解釋常識(求通順)→ 放心用。要它給精確事實:數字、法條、日期、出處(求準確)→ 預設要查。
  3. 對「很具體的宣稱」自動亮紅燈 看到它給出人名、頭銜、統計數字、法規條號、網址、原文引述——這些就是幻覺最愛出現的地方,別直接採信,尤其是要送客戶或牽涉金錢法規的。
  4. 用「你會的領域」測一次它 拿一個你自己是行家的主題,叫它講五個具體事實(數字、出處都要),逐一查證。你會親眼看到它哪裡準、哪裡開始編——這種體感比看十篇文章都有用。
  5. 重要的事,逼它附出處或開搜尋 關鍵內容叫它標明來源、或打開網路搜尋再回答,讓答案有現實依據;你自己再獨立查一次最關鍵的那幾個數字。

例子:同一個 AI,一個能放心、一個要查

這樣寫

幫我查一下《勞基法》第幾條規定特休可以遞延,順便給我確切條文和最新修法日期

改成這樣

(求順的活它很穩)幫我把這段給員工的特休說明改得更白話、更親切,三段以內。(求準的活自己把關)法條條號和修法日期我不直接信 AI,改去勞動部網站查證,或叫它開網路搜尋並附上官方連結再核對一次。

常見踩雷

  • 把它當 Google 用,看到答案講得頭頭是道就直接貼給客戶——最像真的的那一句,往往就是它編的。
  • 在自己不懂的領域問它精確事實,然後沒能力查證就照用——你根本不會發現它在唬爛。
  • 看到它兩次答案不一樣就以為「壞了」或「這次比較準」,其實只是它每次都重猜,該查的還是要查。

深入來源:AI Capabilities and Limitations・Next Token Prediction

02

它知道什麼、不知道什麼

AI 的知識全部來自「訓練時讀過的資料」,而且到某個日期就停住了(知識截止點)。所以:它不知道上週的新聞、不知道你公司內部的事、冷門或地方性的主題容易亂掰。搞清楚它「肚子裡有什麼」,你就知道什麼可以直接問、什麼得自己餵資料或另外查。

  • 它有「知識截止點」:訓練資料收到某個日期為止,之後發生的事它天生不知道。
  • 它完全不知道你公司的事:你的報價、客戶、內規、上週的會議——沒餵給它,它只能猜。
  • 主流的事很強、冷門的事容易掰:常見、被寫很多的主題它很準;小眾、地方、剛改的規定就靠不住。
  • 它會「舊資訊當現在講」:法規、工具、價格改過了,它可能還用舊的講得很篤定。
  • 它記不得「在哪讀到的」:說得出內容、卻說不清出處——所以「它說有這規定」不能當證據。
深入研讀 · 實作步驟 收合

影片來源:Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

接著上一個技能點:既然 AI 是靠「讀過的東西」在猜下一個字,那它到底讀過什麼、就決定了它「懂什麼」。可以想成它在上線之前,被關進一間超大圖書館狂讀了好幾年,讀完就把門關上、開始上工。從此之後有三件事你一定要記得:第一,圖書館的門是有關門時間的——這叫「知識截止點」。關門之後世界上發生的事,它讀不到,所以你問它上週的新聞、今年最新的補助方案,它要嘛老實說不知道,要嘛(更常見)拿關門前的舊資訊、用很篤定的語氣講給你聽。上方影片會解釋這個「讀到某天為止」是怎麼回事。

第二,也是中小企業最容易忽略的:那間圖書館裡沒有任何一本是關於你公司的書。你的報價策略、客戶名單、內部流程、老闆昨天交代的方向、上個月那場會議的結論——這些從來不在它的訓練資料裡。所以你直接問「我們公司這種案子通常報多少」,它只能拿「一般行情」來猜,猜得再順也跟你的實際狀況無關。這不是它笨,是它根本沒這份資料。解法很簡單也很關鍵:把相關背景貼給它、當場餵給它(你的報價表、品牌語氣範例、這個客戶的往來紀錄),它就能用「你的現實」來幫你,而不是用「網路平均值」。

第三,它懂的深淺非常不平均。一個主題如果在網路上被寫過千百遍(常見的行銷觀念、通用的 Excel 用法、主流程式語言),它就懂得又深又準;但如果是小眾、地方性、剛改沒多久的東西——某個公會的最新規定、某縣市特有的補助、某個冷門工具上週發布的新功能——它讀到的資料本來就少,就很容易「用零星印象硬拼一個聽起來合理的答案」。台灣的在地法規、健保申報細則、地方稅務這類,尤其要小心:它可能講得很順,卻是錯的或過時的。

最後補兩個它「知識」上的毛病。一是舊當新講:某條規定去年改了、某個軟體介面換了、某個價格漲了,它腦中可能還是舊版,卻不會提醒你「這可能過時」。二是記不得出處:它能告訴你「有這麼一條規定」,但通常說不清是哪部法、哪一條、哪個官方文件——就像有人跟你說「我好像在哪看過」,那不能當證據。所以務實的做法是:凡是會過時、會因地不同、或牽涉法規金錢的,把它當「給你方向的助手」,最終數字和條文自己去官方來源查證,或叫它開網路搜尋、把資料餵給它。

實作步驟

  1. 問之前先判斷:這它可能知道嗎? 心裡過一遍:這是常見、穩定、寫很多的主題(它多半懂),還是最新、冷門、地方性、或我公司內部的事(它多半不知道或會過時)?
  2. 公司內部的事,一律先餵資料 牽涉你的報價、客戶、流程、品牌語氣——別指望它通靈。把相關文件、範例、背景貼進對話當場給它,它才能用你的現實而不是網路平均值來答。
  3. 時效性問題,開網路搜尋 問新聞、最新法規、今年補助、價格這類會變的東西,打開網路搜尋功能再問,繞過它的知識截止點;沒搜尋就別信它給的「最新」。
  4. 在地與冷門主題,加倍查證 台灣特有法規、健保申報、地方稅務、小眾工具的細節——它最容易在這裡編。關鍵條文和數字,一律回官方來源核對。
  5. 要它報出處,你再抽查 重要答案叫它附上來源連結;別全信,挑最關鍵的一兩項自己點進去看是不是真的、是不是最新的。

例子:同一題,餵資料前後差很多

這樣寫

我們這種社群代操的案子,通常報價多少比較合理?

改成這樣

(先餵它你的現實)「這是我們過去一年 12 個社群代操案的報價和成交結果〔貼上〕,也附上我們的成本結構〔貼上〕。根據這些,幫我分析這個新客戶(月預算約 8 萬、要求每週 5 篇貼文)合理的報價區間,並點出可能的風險。」——它用你的真實資料算,才有意義;問「一般行情」只會得到跟你無關的網路平均。

常見踩雷

  • 問它公司內部或客戶專屬的事、卻沒餵任何背景資料,然後嫌它「答得很空」——它本來就沒這份資料。
  • 問今年最新的法規、補助、價格,忘了開網路搜尋,結果拿到它關門前的舊資訊還當成最新的用。
  • 在台灣在地法規、健保、稅務這類冷門又常改的主題上直接採信它,沒回官方查證——這是最容易出包的地雷區。

深入來源:AI Capabilities and Limitations・Knowledge

03

它會忘:對話的「工作記憶」有上限

AI 在一個對話裡能「同時記住」的內容有一個固定上限,叫做脈絡視窗(context window)。就像一張有限大小的桌子——東西擺得下就都看得到,一旦超過,前面的就被擠掉,而且它不會提醒你。這解釋了為什麼一個對話講太久它會開始忘東忘西、答非所問。學會適時重開,是省時間的關鍵習慣。

  • 一個對話的記憶有上限:不是無限大,塞太多、講太久,前面的內容會被擠出去。
  • 它會「無聲地」忘記:超過上限不會跳警告,它只是默默看不到前面,答案開始走鐘。
  • 換一個新對話=失憶重來:這個對話教它的事、給它的背景,開新對話它一概不記得。
  • 你的糾正不會「學進去」:它只對「現在這張桌上還看得到的東西」有反應,關掉就沒了。
  • 重要的事放最前面、講最清楚:埋在一長串中間的關鍵指令,它最容易漏看。
深入研讀 · 實作步驟 收合

影片來源:Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

前面兩個技能點講的是它「肚子裡有什麼」(訓練知識)。這一個講的是完全不同的東西:它「現在這一刻,眼睛正盯著什麼」。你在一個對話裡打的字、貼的文件、它自己的回覆,全部要擠進一個固定大小的空間,這個空間叫脈絡視窗。最好懂的比喻是一張桌子:桌面就這麼大,你把資料一張張攤上去,只要擺得下,它一眼全看得到、用得上;可是桌子會滿,當你不斷加東西、對話愈拉愈長,最早放上去的那幾張就會被擠到桌子邊、掉到地上——它就再也看不到了。上方影片會把這個「有限桌面」講清楚。

這個限制有一個跟前面很不一樣的性質:它是「懸崖式」的,不是「慢慢變差」的。知識不足是漸進的(愈冷門愈不準),但記憶爆掉是突然的——前一刻還好好的,多貼一份長文件、多聊幾十輪,它忽然就開始忘記你一開始的設定、重複問你已經講過的事、或給出跟前文兜不起來的答案。最麻煩的是它不會跳出來說「我記不下了」,它只是默默地看不到前面,然後一樣很有自信地繼續答。很多人遇到「這 AI 怎麼愈聊愈笨」,其實就是撞上了這道牆而不自知。

由此帶出兩個常被誤會的重點。第一,換新對話等於全新的它。這個對話裡你花半小時教它的公司規矩、餵它的背景、糾正它的地方——只要你開一個新對話,它完全不記得,一切從零開始。它不像同事會把你上次講的記在腦子裡;它的「記憶」只活在「當前這張桌子」上,桌子一收(關掉或開新對話),就清空了。第二,你的糾正沒有「教會」它。你在對話裡說「不對,我們公司不這樣」,它會在這個對話裡照做,但這不是它「學到」了——換個對話它又會犯同樣的錯。真正要它「長期記得」,得靠後面會學的專案/長期記憶功能(R4 會深入),不是靠一直在對話裡重講。

知道這些,實務上就有明確對策。其一,重要的東西放最前面、講最清楚。把關鍵指令、背景、規矩擺在對話開頭一次講足,別零零散散埋在一長串中間——桌子中央的東西它最容易漏看(這現象叫「lost in the middle」,中間的最不受注意)。其二,一個對話別扛太多任務。一件事告一段落、或你發現它開始忘東忘西、答非所問,就是該開新對話的訊號;把「現在才想清楚的完整需求」在新對話裡一次講好,通常比在舊對話裡硬救更快、更乾淨。這也呼應後面 R4 會教的 context 管理——「什麼時候該清空重來」是一個會愈練愈準的手感。

實作步驟

  1. 把關鍵設定放在開頭一次講足 公司背景、語氣要求、格式規矩、最重要的指令——在對話一開始就講清楚,別分散埋在後面一長串裡,中間的東西它最容易漏。
  2. 一個對話只做一件事 別把「寫貼文+算報表+改合約」全塞進同一個對話。換任務就換對話,桌面乾淨,它才不會被無關的舊內容干擾。
  3. 看到這些訊號就準備重開 它開始重複問你已經講過的事、忘記一開始的設定、答案前後兜不起來——這就是記憶爆了。別再硬拗,開新對話。
  4. 重開時,把需求一次重述清楚 開新對話別假設它記得舊的。把你現在想清楚的完整需求+必要背景重新一次講好,通常比在亂掉的舊對話裡繼續補救更快。
  5. 要它長期記得,用專案而不是重講 如果某些背景(公司簡介、品牌語氣)每次都要用,別每個對話重貼——用專案/長期記憶功能存起來(R4 會教),一勞永逸。

例子:一個對話撐太久 vs. 適時重開

這樣寫

在同一個對話裡連續聊了三小時:先寫五篇貼文、又貼了一份 30 頁報告要它摘要、再叫它改合約、最後回頭問「幫我照我們公司語氣再修那五篇貼文」——結果它把品牌語氣的設定忘光了,改得四不像。

改成這樣

發現它開始忘東忘西,就開一個新對話:「你是絲萬萬社群小編,品牌語氣是〔貼上語氣範例〕。以下五篇貼文請照這個語氣修〔貼上五篇〕。」桌面乾淨、指令在最前面,一次就到位。長期會用到的語氣範例,另外存進專案,之後不必再貼。

常見踩雷

  • 把一個對話當成無底洞,什麼任務都往裡塞,聊到它開始鬼打牆還不換——愈聊愈笨其實是記憶爆了。
  • 以為在對話裡糾正過、它就「學會」了,結果開新對話它照樣犯同樣的錯——它不會跨對話記住。
  • 把最重要的指令埋在一長串貼文的中間,然後怪它沒照做——中間的內容它最容易漏看。

深入來源:AI Capabilities and Limitations・Working Memory

04

什麼能交給它、什麼要盯著

把前面三件事(它在猜字、知識有邊界、記憶有上限)合起來,就能判斷一件工作到底該放心交、盯著點、還是根本別交。真實世界的出包,多半是兩個弱點同時發作——比如「猜字+知識不足」湊出一個超逼真的假數據。認得出是哪兩個在作怪,你就知道該用哪一招補。這一站給你一張隨手可用的判斷準則。

  • 三分法:能放心交/要盯著覆核/別交給它——動手前先把任務歸到其中一格。
  • 出包常是「兩個弱點相撞」:例如猜字+知識不足=很逼真的假事實;記憶爆+你沒重講=聊到後面走鐘。
  • 能放心交:改寫、摘要、發想、翻譯、解釋常識、換格式——通順型、你也能一眼驗收的。
  • 要盯著覆核:牽涉具體數字、法條、報價、對外文件——它做草稿,你查證後才算數。
  • 別交給它:需要公司內部真實資料它沒有的、需要你獨門判斷或負責任的決定(議價、要不要接案、對客戶的承諾)。
深入研讀 · 實作步驟 收合

影片來源:Anthropic《AI Capabilities and Limitations》· 在 YouTube 觀看原片

前面三個技能點各講了一個弱點,這一站把它們裝回同一個腦袋裡,變成一張能用的判斷表。因為在真實工作中,AI 出包很少是「單一弱點」乾淨地發作,多半是兩個湊在一起,而且湊起來特別像真的、特別難抓。上方影片就是在講這種「弱點相撞」。認得出是哪兩個在作怪,你就不會亂槍打鳥,而是直接對症下藥。

最常見的相撞一:猜字(愛講具體的)+知識不足(這塊它不熟)。結果就是它生出一個超逼真的假東西——一條不存在的法規、一個沒發生過的統計數字、一篇查無此人的「引述」。因為它一方面天生會把空白補成「最像對的」,另一方面這個主題它資料又少,兩個一疊,就是最經典的「假到你信」。對策:凡是具體事實(數字、法條、出處、日期)+又是冷門或在地主題,一律當草稿、自己查證或開搜尋最常見的相撞二:記憶爆(聊太久忘了)+你沒重講(以為它記得)。結果是一個長對話聊到後面愈來愈走鐘,它忘了你最初的設定、開始答非所問。對策:重開新對話、把需求重講一次,別在爛攤子上硬修。

把這些收攏成一張三格判斷表,動手前先把手上的任務丟進其中一格。第一格「能放心交」:改寫潤稿、摘要長文、發想點子、翻譯、解釋通用常識、換個格式排版——這些是「通順型」任務,正中它的強項,而且成果你自己一眼就能驗收,錯了也看得出來。這格的東西大膽交,能幫你省最多時間。第二格「要盯著覆核」:任何牽涉具體數字、法條、報價、對外要送出去的正式文件——它可以幫你打草稿、加速,但「它做完 ≠ 可以用」,一定要你查證關鍵事實、確認語氣責任之後才算數。第三格「別交給它」:兩種情況——一是需要「它根本沒有的資料」才能做對的事(你公司內部真實狀況,你若不餵它就別問);二是需要你的獨門判斷與責任的決定:跟客戶議價、要不要接一個案子、對客戶承諾成效、對外道歉的最終定調。這些 AI 可以陪你想,但拍板必須是人。

要提醒一句:這三格不是固定死的,會隨「你補了什麼」而移動。同一件事,你什麼都不給,它落在「別交」;你把公司資料、範例、背景餵齊,可能就升到「要盯著」甚至「能放心交」。你打開網路搜尋、要它附出處,「查證」這關就輕鬆很多。所以判斷表真正的用法不是把任務判死刑,而是問自己:「要把這件事往『能放心交』那一格推,我還缺補哪一塊?」——是缺背景(餵資料)、缺時效(開搜尋)、還是缺人的判斷(那就人來拍板)。這正是後面 R1「4D 協作思維」要展開的功夫;R0 先讓你把這條線畫出來。

實作步驟

  1. 動手前先把任務丟進三格 問自己:這是通順型、我一眼能驗收的(能放心交)?牽涉具體事實或對外文件(要盯著覆核)?還是需要公司內部資料或我的判斷責任(別交)?
  2. 「能放心交」的,大膽交、快速用 改寫、摘要、發想、翻譯、換格式——放手讓它做,你省下的時間拿去做只有你能做的事。驗收一眼帶過即可。
  3. 「要盯著」的,它做草稿、你查證才算數 牽涉數字、法條、報價、正式對外文件:讓它加速打底,但關鍵事實一律自己查證或開搜尋,語氣與責任你把最後一關。
  4. 「別交」的,人來拍板 議價、接不接案、對客戶的承諾、道歉定調——AI 可以幫你列選項、想利弊,但決定和責任是你的,別把工具當成卸責的對象。
  5. 出包時,先問「是哪兩個弱點相撞」 假事實 → 多半是猜字+知識不足,查證+開搜尋;聊到走鐘 → 多半是記憶爆+沒重講,重開對話重述需求。認出組合,就知道用哪招。
  6. 想把任務往左推,就補那塊缺的 缺公司背景 → 餵資料;缺時效 → 開網路搜尋;缺人的判斷 → 人來定案。三格會隨你補的東西移動,不是判死刑。

判斷準則:一件「幫客戶做提案」拆進三格

這樣寫

(一股腦全丟)幫我做一份給這個客戶的完整提案,包含報價、案例、成效保證,做完我直接寄出去

改成這樣

拆開來分格處理——【能放心交】提案的文案潤飾、結構排版、把賣點寫順:交給它。【要盯著覆核】案例數據、報價金額:先餵它我們真實的成本與過往報價,它算完我逐項查證。【別交給它】要不要對這客戶「保證成效」、最終報多少、寄不寄——這是我的判斷和責任,AI 只幫我列利弊,我拍板。這樣一份提案,該快的地方快、該把關的地方沒漏。

常見踩雷

  • 把整件複雜任務「一股腦全丟」,不分格——結果該查的沒查、該自己決定的也讓 AI 決定了。
  • 出包了只會怪「AI 爛」,卻沒去分辨是哪個弱點在作怪——不對症,下次還是同一個坑。
  • 把三格當成鐵板判死刑,忘了「餵資料、開搜尋、人拍板」可以把任務往『能放心交』推——白白少用了它很多本來能幫上忙的地方。

深入來源:AI Capabilities and Limitations・When Properties Collide

出站條件

用頁面上方的「自我定位」對照三種描述,找到自己的位置。

改編來源: Claude Code Best Practices(常見失敗模式)