阻擋 AI 訓練之後還能被 ChatGPT 引用嗎?

可以。擋 GPTBot 只阻止內容被納入訓練,但 ChatGPT Search 用 OAI-SearchBot 即時抓取仍可引用。ClaudeBot vs Claude Search、Google-Extended vs Googlebot 同理。

這是 GEO 領域最常被誤解的設定。AI 廠商刻意把訓練與搜尋拆成兩個 user-agent,就是為了讓網站擁有「我不想被當訓練資料、但我想被 AI 引用」的中間選項。

OpenAI 官方文件明確說明:擋 GPTBot 僅影響「未來訓練資料集」,不影響 ChatGPT Search、ChatGPT 內 Browsing 工具的即時抓取。要完整阻擋 ChatGPT 全面接觸,需同時擋 `GPTBot` + `OAI-SearchBot` + `ChatGPT-User`。Anthropic、Google、Perplexity 採類似分層架構。

戰略建議:多數品牌應「擋訓練、開搜尋」——避免內容被免費當訓練語料,但保留即時 AI 引用機會。內容已存在於 Common Crawl 等公開資料集的網站擋訓練爬蟲意義不大,反而開放讓 AI 持續抓最新內容更有利。

重點

相關內容