怎麼阻擋 AI 訓練我的內容？

Question

怎麼阻擋 AI 訓練我的內容？

Accepted Answer

阻擋 AI 訓練只需在 robots.txt 對 GPTBot、ClaudeBot、Google-Extended、PerplexityBot 加 Disallow。訓練爬蟲與搜尋爬蟲是兩套，擋訓練不影響搜尋引用。 AI 廠商把「訓練爬蟲」與「搜尋爬蟲」分為不同 user-agent，方便網站獨立管理。例如 OpenAI 的 `GPTBot`（訓練）vs `OAI-SearchBot`（ChatGPT Search）；Google 的 `Googlebot`（搜尋索引）vs `Google-Extended`（Gemini 訓練）；Perplexity 的 `PerplexityBot`（訓練）vs `Perplexity-User`（即時搜尋代理）。 若想擋訓練但保留搜尋（即「不希望被當訓練資料但希望被 AI 引用」），robots.txt 範例： ```
User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: PerplexityBot
Disallow: /
```
注意：上述配置仍允許 ChatGPT Search、Gemini in Search、Perplexity 即時搜尋抓取你的網站。完整阻擋所有 AI 接觸請另外擋搜尋型爬蟲。

怎麼阻擋 AI 訓練我的內容？

重點

相關內容