怎麼阻擋 AI 訓練我的內容?

阻擋 AI 訓練只需在 robots.txt 對 GPTBot、ClaudeBot、Google-Extended、PerplexityBot 加 Disallow。訓練爬蟲與搜尋爬蟲是兩套,擋訓練不影響搜尋引用。

AI 廠商把「訓練爬蟲」與「搜尋爬蟲」分為不同 user-agent,方便網站獨立管理。例如 OpenAI 的 `GPTBot`(訓練)vs `OAI-SearchBot`(ChatGPT Search);Google 的 `Googlebot`(搜尋索引)vs `Google-Extended`(Gemini 訓練);Perplexity 的 `PerplexityBot`(訓練)vs `Perplexity-User`(即時搜尋代理)。

若想擋訓練但保留搜尋(即「不希望被當訓練資料但希望被 AI 引用」),robots.txt 範例:

``` User-agent: GPTBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: Google-Extended Disallow: / User-agent: PerplexityBot Disallow: / ``` 注意:上述配置仍允許 ChatGPT Search、Gemini in Search、Perplexity 即時搜尋抓取你的網站。完整阻擋所有 AI 接觸請另外擋搜尋型爬蟲。

重點

相關內容