如何健診網站的生成式搜尋引擎優化現況:8 步驟自我檢測

健診網站 GEO 現況 8 步:檢查 robots.txt 是否開放 AI 爬蟲、用 curl 模擬 GPTBot 取得 HTML、驗證 Schema 覆蓋率、檢視 Answer-First 結構、確認 llms.txt 存在、查 Person/Organization Schema、檢查更新頻率、實測 5 個品牌相關 prompt。

在投入生成式搜尋引擎優化(GEO)資源前,必須先知道網站現況。本教學提供 8 步驟自我健診流程,30–60 分鐘可完成全面 GEO 體檢,幫助品牌判斷投資優先序與預期成效週期。

步驟

  1. 檢查 robots.txt 是否開放 AI 爬蟲:在瀏覽器訪問 https://yourdomain.com/robots.txt,確認以下 user-agent 都是 Allow(非 Disallow):GPTBot、ClaudeBot、PerplexityBot、Google-Extended、OAI-SearchBot、Applebot-Extended。Cloudflare 預設可能會擋 AI 爬蟲,需到後台關閉。(若用 Cloudflare:登入 → Security → Bots → 確認 AI Scrapers 未被「Block」。)
  2. 用 curl 模擬 GPTBot 抓取首頁:終端機執行 curl -A 'GPTBot/1.0' https://yourdomain.com/ > debug.html,打開 debug.html 確認能看到完整內容。若是純 SPA 會看到空白 <div id='root'></div>,代表 GEO 完全失效。(若 debug.html 是空殼,立即優先導入 SSR 或 prerender,否則所有 GEO 投資都會打水漂。)
  3. 驗證 Schema 覆蓋率:用 Google Rich Results Test 測試首頁、產品頁、FAQ 頁,確認偵測到 Organization、Person、Article、FAQPage、Product 等 schema,每個應有 0 errors 0 warnings。
  4. 檢視 Answer-First 結構:隨機抽 10 頁內容檢查:H1 是否為問題式標題、首段前 40–80 字是否為直接答案、後段是否用 H2 + bullet 結構展開。Princeton 研究:Answer-First 結構 AI 引用率提升 28–41%。
  5. 確認 llms.txt 存在且結構正確:訪問 https://yourdomain.com/llms.txt 確認 HTTP 200 且 Content-Type: text/plain。內容應含 H1 品牌名、blockquote 一句話定位、## 區塊列出核心 URL 與描述。(比對 https://geomkt.app/llms.txt 作為標準範本參考。)
  6. 查 Person / Organization Schema 完整度:在首頁 view-source 搜尋 "@type": "Person" 與 "@type": "Organization",確認 Organization 含 sameAs、address、taxID(統編)。
  7. 檢查更新頻率與 dateModified:view-source 搜尋 dateModified,確認核心頁面有此欄位且日期合理(≤ 90 天)。若大量頁面 dateModified 集中在同一日,會造成 AI recency 信號同步衰退。
  8. 實測 5 個品牌相關 prompt:到 ChatGPT、Perplexity、Gemini 各問 5 個與品牌主題相關的 prompt(不直接點名品牌)。紀錄 AI 是否提及品牌、提及次數、引用來源是否為自家網站。(若 5/5 都未被引用,代表內容權威信號不足。)

相關內容