一份報告看起來很專業:標題完整、段落漂亮、引用排得整齊,甚至還有大型機構的案例。你可能會以為,接下來只要修語氣、補圖表、送主管確認就好。
但如果引用本身是錯的,漂亮文字反而會讓錯誤更容易被相信。
2026 年 6 月,KPMG 撤下先前發布的 AI 採用報告《Redefining excellence in the age of agentic AI》。多家媒體引述 GPTZero 的調查指出,報告中大量引用與案例無法正確對上來源;TechCrunch 也報導,UBS、英國 NHS、瑞士聯邦鐵路與 Transport for London 等機構都表示,報告對它們 AI 使用情況的描述不正確或具誤導性。KPMG 回應時表示,已移除報告並展開調查,也強調負責任使用 AI 需要人工監督、驗證內容與確認獨立來源。
這件事不是「顧問公司也會犯錯」而已。對一般工作者更實用的提醒是:只要 AI 協助寫出的內容會變成報告、簡報、白皮書、提案或對外文章,審稿重點就不能只看語氣順不順,而要先確認引用、案例與責任是否能被追回原始資料。
AI 報告最危險的錯,不一定藏在正文
很多人檢查 AI 產出的文件時,會先看三件事:有沒有錯字、邏輯順不順、語氣像不像公司。這些都重要,但它們不是最容易造成信任損失的地方。
真正麻煩的是「看起來像有根據」的錯誤。例如:
- 引用的文章或研究真的存在,但標題、作者、年份或結論被改寫到失真。
- 案例中的公司真的存在,但它沒有做過報告說的那件事。
- 數字看起來合理,但找不到原始表格、調查方法或發布日期。
- 腳註很多,卻沒有任何人點開確認它是否支撐前面的句子。
GPTZero 把這類現象稱為類似「憑感覺引用」的問題:引用看起來像引用,實際上卻可能把真來源、假標題、錯作者與過度推論混在一起。對讀者來說,這比完全沒有引用更難發現,因為文件表面上已經像完成了查證。
所以,AI 參與報告流程後,不能只問「它寫得像不像」。更應該問:「這份文件裡哪些句子,別人會因為看到引用或案例而相信?」
先把報告拆成三種可查證材料
如果整份報告從頭讀到尾,很容易被流暢文字帶著走。比較安全的做法,是先把需要查證的材料拆出來。
| 材料類型 | 你要查什麼 | 常見風險 |
|---|---|---|
| 引用來源 | 文章、研究、報告、法規或官方文件是否真的存在,是否支撐前一句話 | 來源存在,但結論被 AI 改得太遠;引用格式像真的,細節卻錯 |
| 具名案例 | 公司、政府機關、客戶或產品是否真的做了文中描述的事 | 把試點說成正式導入,把單一功能說成整套流程 |
| 數字與時間 | 百分比、金額、使用人數、發布日期、版本名稱是否能追到原始資料 | 舊數字被當成最新狀態,或不同市場的資料被混用 |
這張表的目的不是讓每個人都變成研究員,而是讓報告在送出前先停下來。只要一段文字會影響預算、採購、合約、客戶信任或公開聲譽,就不能只靠 AI 的「看起來合理」。
一個簡單做法是:請負責這件事的人把所有引用、公司名稱與數字複製到一張查證表。每一列至少要有四欄:原句、來源連結、來源中的對應句、查證狀態。沒有對應句,就不要把那句話留在正式文件裡。
用三層判斷:修字、退回,還是不能發布
不是每個錯誤都一樣嚴重。把風險分層,才不會把時間花在無關緊要的小修,卻放過真正會出事的段落。
| 層級 | 例子 | 下一步 |
|---|---|---|
| 可修正 | 引用格式不完整、日期格式錯、來源連結需要補上 | 修正後重新點開確認,不必整份退回 |
| 必須退回重做 | 案例描述找不到原始來源,或來源只支持一小部分說法 | 退回作者或 AI 產出流程,重新寫成來源能支撐的版本 |
| 不能發布 | 具名機構否認、數字影響商業判斷、醫療/法律/財務/資安結論無法證明 | 暫停發布,請負責人決定是否移除、重做、告知相關方或留下更正紀錄 |
這裡的「負責人」不是名義上的文件擁有人,而是能決定文件是否對外、是否通知客戶、是否承擔修正成本的人。AI 可以幫忙整理材料,但不能替公司承擔錯誤引用造成的信任損失。
如果你在團隊裡負責最後整理報告,可以把一句話寫進流程:凡是 AI 協助產生的對外文件,沒有來源對應句的引用與案例,不進正式版。 這句話比「請大家注意 AI 幻覺」更可執行。
哪些情境不適合讓 AI 直接寫到最後一版
有些文件可以讓 AI 先整理初稿,再由人快速調整。例如內部會議摘要、草擬問卷題目、整理訪談重點。只要原始資料還在、讀者知道它是草稿,風險相對可控。
但下面幾種情境,不適合讓 AI 從初稿一路滑到最後一版:
- 對外白皮書、研究報告、顧問提案或新聞稿。
- 會列出客戶、合作夥伴、政府機關或競爭對手名稱的文件。
- 用來支持採購、投資、預算、裁撤或合規決策的簡報。
- 會被媒體、客戶、主管或法務再次引用的數字與結論。
這些文件可以用 AI 幫忙做第一輪整理,但中間一定要有「來源確認」和「責任確認」兩個關卡。來源確認是看每個關鍵句能不能回到原始資料;責任確認是確認誰有權決定這句話可以對外講。
如果時間不夠,寧可縮小報告範圍,也不要保留一堆沒查證的漂亮案例。沒有案例的誠實報告,通常比充滿錯誤案例的完整報告安全。
下一次交付 AI 報告前,先加一張查證頁
最實用的改變,不是要求每個人「更小心」,而是在文件交付包裡加一頁查證頁。這頁不用很複雜,只要讓每個關鍵說法都留下五個訊號:
- 關鍵句:會被引用、轉述或拿去做決策的句子。
- 原始來源:官方文件、研究、新聞、合約、內部資料或訪談紀錄。
- 對應證據:來源中真正支持這句話的段落、頁碼或截圖位置。
- 查證人:實際點開來源並確認的人。
- 發布判斷:保留、改寫、刪除、退回重做或暫停發布。
這份查證頁會讓 AI 報告的審稿從「看起來順不順」變成「能不能站得住」。它也讓責任更清楚:AI 不是作者、審稿者或發布者;它只是協助整理的人。最後把內容交出去的,仍然是團隊。
KPMG 這次事件提醒我們,AI 幻覺不只會出現在聊天視窗裡,也會被包裝成報告、腳註與案例,進入真正的商業決策。下一次你看到一份 AI 幫忙做出的漂亮文件,先不要急著稱讚它有效率。先問一個更重要的問題:這些引用和案例,真的查得到嗎?
用日常來理解

- 一開始,團隊拿到一份排版漂亮、引用很多的 AI 協助報告,準備直接送出。
- 送出前,有人先把引用、具名案例與數字全部拉成查證表。
- 團隊把找不到來源對應句的段落退回改寫,並請負責人確認可對外的內容。
- 最後,報告不只文筆順,而是每個關鍵說法都能回到原始資料。
AI 整理卡
依這篇情境,請 AI 幫你整理
複製到你自己的 AI 聊天工具,讓它把這篇微課轉成你的個人版檢查清單。BMC 不會看到你貼給 AI 的內容。
參考來源
- TechCrunch:KPMG pulls report on AI usage due to apparent hallucinations — https://techcrunch.com/2026/06/13/kpmg-pulls-report-on-ai-usage-due-to-apparent-hallucinations/
- GPTZero:Chasing the Hallucinations: KPMG’s AI-Powered Attempt at “Redefining Excellence” — https://gptzero.me/news/investigations-kpmg/
- The Register:KPMG’s AI report becomes an accidental demo of AI hallucinations — https://www.theregister.com/ai-and-ml/2026/06/12/kpmgs-ai-report-turns-into-a-demo-of-ai-hallucinations/5255029
- Finance Monthly:KPMG Pulls AI Report After UBS, NHS and Transport for London Case Studies Found to Contain Hallucinations — https://www.finance-monthly.com/kpmg-ai-report-hallucinations-ubs-nhs-transport-for-london/
