初始化平台
目前載入進度 0%
AI SEO 評分說明

robots.txt 合規說明

了解 robots.txt 如何影響網站的搜尋發現度、頁面渲染完整性、內容開放策略, 以及 AI 系統對網站內容的理解方式。

主題:搜尋發現度 焦點:抓取規則 語言:繁體中文
robots.txt 與網站發現度

robots.txt 為什麼重要

溝通規則必須先被建立

對 GEO Scorecard 而言,robots.txt 不是一個附屬技術檔案,而是網站對搜尋引擎、 AI crawler 與外部代理公開說明抓取邊界的第一層入口。它會影響網站能不能被抓、能不能被完整渲染、 以及外部系統是否能穩定理解你的內容開放方式。

為什麼這是評分依據

我們將 robots.txt 納入評分,不是因為「有檔案就加分」,而是因為它會直接影響三件事情: 網站是否能被正常抓取、搜尋引擎是否能取得渲染頁面所需的關鍵資源,以及網站是否清楚表達自己對不同類型 bot 的開放邊界。

換句話說,這不是一個只屬於 SEO 顧問或工程師的技術細節,而是網站對外部系統的第一份規則說明書。 如果這裡缺失、混亂或衝突,後面的 HTML、JSON-LD、Meta Tag 即使做得不差,也可能因為入口規則寫錯而無法正常發揮。

對搜尋引擎的意義

它決定 crawler 能不能進站、哪些路徑能讀、哪些資源可渲染,直接影響內容發現度與索引效率。

對 AI 系統的意義

它影響 AI 搜尋、引用型產品與訓練型 crawler 對內容的取用邊界,會影響理解、引用與收錄方式。

什麼是 robots.txt

robots.txt 是放在網站根目錄的純文字檔案,用來告訴 crawler 哪些路徑可以抓、哪些路徑不建議抓。 它是 Robots Exclusion Protocol 的實作入口,Google 會先抓取並解析這份檔案,再決定後續抓取方式;RFC 9309 也已將這套協議標準化。

一份最基本的寫法通常包含下列欄位:

  • User-agent:規則對哪一類 crawler 生效。
  • Allow:允許抓取的路徑。
  • Disallow:不允許抓取的路徑。
  • Sitemap:提供 sitemap 的完整位置。
User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

上面的意思很簡單:對所有 crawler 沒有額外封鎖,並且主動提供 sitemap 位置。對陌生網站來說, 這是一種可預測的公開姿態。你不是要外部系統自己猜網站結構,而是主動把抓取邊界講清楚。

如果網站沒有這份檔案,部分 crawler 仍可能按照預設方式抓取公開內容,但你就失去了主動定義規則的機會。 對商業網站而言,這通常不是最理想的做法,因為它讓抓取政策回到「默認狀態」,而不是你的明確策略。

robots.txt 能做什麼,不能做什麼

它能做的事

  • 管理抓取範圍: 指定哪些目錄或檔案不希望被自動化 crawler 讀取。
  • 提供 sitemap 入口: 讓 crawler 更快掌握站內 URL 範圍與更新結構。
  • 分 bot 寫規則: 對不同 user-agent 指定不同的開放方式。
  • 表達內容開放策略: 對搜尋用途、訓練用途與特定產品 bot 做不同邊界設定。

它不能保證的事

  • 不是安全機制: 它不能保護敏感資料,也不能取代登入驗證或權限控管。
  • 不等於 noindex: 抓取與索引是不同問題,不能直接混為一談。
  • 不保證所有爬蟲都遵守: 惡意或低品質爬蟲不一定會理會你的規則。
  • 不適合拿來隱藏敏感路徑: 因為這份檔案本身就是公開的。

這也是為什麼很多團隊會誤用 robots.txt。只要把某個資料夾寫進 Disallow, 並不代表任何人都看不到它;那只表示遵守協議的 crawler 會尊重這個請求。對權限與安全問題,正確工具永遠是後端授權與存取控制。

Google 官方也特別提醒,如果某頁本身已被 robots.txt 封鎖,crawler 可能連頁面上的 meta robots 設定都讀不到。也就是說,想達到「可抓但不收錄」時,很多情況應考慮 noindex, 而不是先把頁面整個擋住。

為什麼錯誤設定會直接傷害搜尋與 AI 理解

robots.txt 最常見的問題不是沒有,而是「看起來有寫,實際上寫錯」。 一旦入口規則出現錯誤,會讓搜尋與 AI 系統拿到扭曲、殘缺或不一致的網站版本。

1. 封鎖整站

若對 User-agent: * 設定 Disallow: /,等於告訴多數 crawler 不要抓整個網站。 這常見於測試環境上線忘記解除的情況。站長自己打開網站一切正常,但自然搜尋、內容更新與 AI 搜尋引用卻幾乎停擺。

2. 封鎖 CSS 或 JavaScript

現代網站的內容不再只靠靜態 HTML 呈現。若 CSS、JavaScript、字型、圖片或框架關鍵輸出路徑被封鎖, 搜尋引擎與 AI 系統就可能看不到完整頁面。對 Next.js、React、Vue、SPA 或混合渲染網站尤其明顯。

人看到的頁面與機器看到的頁面差太多,會直接影響內容理解、摘要生成、引用品質與搜尋表現。

3. Sitemap 宣告錯誤或失效

robots.txt 裡提供 Sitemap 是加速 crawler 理解網站結構的好做法, 但前提是這個 URL 必須是真的、可連線、回傳正確內容。若你主動提供了一份錯誤導覽,效果往往比沒提供更差。

4. 規則衝突與萬用字元濫用

規則越複雜,不同 crawler 的解讀落差就越大。團隊最終常不是輸在 parser,而是輸在自己也說不清楚每條規則的目的。 一份高品質的 robots.txt 通常不是最花的那份,而是最容易預測、最容易維護的那份。

在 AI 時代,robots.txt 的角色比以前更重要

過去多數網站只會問一個問題:要不要讓搜尋引擎來抓?現在則需要面對更多層次: 我要不要被 AI 搜尋引用?我要不要讓內容進入訓練用途?我要不要接受使用者觸發型代理讀取頁面?

這些問題沒有單一標準答案,但有一個共同前提:你需要有地方把規則講清楚,而 robots.txt 正是目前最被主流平台理解的入口之一。

Google

Google-Extended 可用來表達內容是否可被用於 Gemini 模型訓練與部分 grounding 用途。

OpenAI

OAI-SearchBotGPTBot 分別對應搜尋曝光與模型訓練兩種不同用途。

Anthropic

官方文件已明確說明 ClaudeBot 會尊重 robots.txt 規則。

Perplexity

PerplexityBot 也提供對 robots.txt 的官方說明與使用方式。

這意味著現在的重點不是單純「更開放」或「更封閉」,而是「更清楚」。 你可以選擇保守,也可以選擇積極;真正重要的是,你是否用一致、可理解且符合主流規範的方式表達你的內容開放策略。

我們如何解讀 robots.txt 分數

在 GEO Scorecard 中,robots.txt 分數不是單看檔案是否存在,而是綜合評估它是否達到 「可讀、可抓、可渲染、規則清楚」四個層次。

一、可讀

  • 檔案存在且位於根目錄。
  • HTTP 可正常取得。
  • 語法基本可解析。
  • 檔案大小在合理範圍內。

二、可抓

  • 沒有錯誤封鎖整站。
  • 具備合理的 User-agent 群組。
  • 規則沒有明顯衝突。
  • 優先序可被穩定解析。

三、可渲染

  • 沒有封鎖 CSS、JavaScript、圖片與字型等重要資源。
  • 沒有錯誤封鎖 /api//_next//static//build/ 等關鍵路徑。
  • 機器看到的頁面版本,能盡量接近真人看到的內容。

四、規則清楚

  • Sitemap 宣告。
  • Sitemap 是合法絕對網址、可存取且內容型態正確。
  • 能清楚表達對主要搜尋引擎與主要 AI crawler 的授權態度。

高分不代表所有 bot 都必須全面開放,而是代表你的規則清楚、邊界一致、限制合理, 並且不會誤傷本來應該被外部系統讀到的內容。

一份高品質 robots.txt 應該長什麼樣子

高品質不等於複雜。對大多數網站來說,好的做法往往是「簡單、明確、少例外」。

User-agent: *
Disallow: /admin/
Disallow: /internal/

Sitemap: https://example.com/sitemap.xml

如果你想對 AI 產品採取更細緻的開放策略設定,也可以再加入特定群組:

User-agent: OAI-SearchBot
Allow: /

User-agent: GPTBot
Disallow: /

這類配置背後的策略意圖很清楚:搜尋發現度保留,但訓練用途另行限制。是否採用, 應依品牌策略、授權政策、流量目標與內容風險承擔來決定,而不是盲目套版。

這項分數代表什麼

robots.txt 分數要傳達的核心訊息,不是「你的網站有沒有一個文字檔」, 而是下列這些更實際的問題:

  • 你的網站是否容易被搜尋引擎讀懂。
  • 你的前端內容是否真的能被機器完整看到。
  • 你的站點結構是否有清楚的抓取邊界。
  • 你是否對 AI 搜尋、AI 訓練與代理抓取有明確的開放策略。

因此,當一個網站在這個面向得分偏低,通常代表的不是單一技術細節出錯,而是整體可取用性與機器可理解性存在規則缺口。 對產品頁面來說,這樣的解釋也比較容易讓使用者理解分數的意義與風險。

官方規範與參考連結

下列來源可作為這個評分面向的外部依據。這些連結讓使用者理解:這不是主觀評論,而是建立在正式規範、 搜尋引擎文件與 AI 平台官方文件上的整理。

AI SEO 評分說明

sitemap.xml 完整度說明

了解 sitemap.xml 如何影響網站的搜尋發現度、內容發現效率、公開頁面清單品質, 以及搜尋引擎與 AI 系統對整站內容的理解方式。

主題:搜尋發現度 焦點:內容清單 語言:繁體中文
sitemap.xml 與內容發現度

sitemap.xml 為什麼重要

目錄建好有助效率提升

對 GEO Scorecard 而言,sitemap.xml 不只是技術清單,而是網站對搜尋引擎與 AI 系統提交的正式公開頁面目錄。 它會影響內容發現效率、更新訊號可信度,以及外部系統能否快速掌握整站內容範圍。

什麼是 sitemap.xml

sitemap.xml 是一種 XML 格式的網站地圖檔案,用來列出網站希望搜尋引擎理解與抓取的 URL。 它通常位於網站根目錄,最常見的路徑包含 /sitemap.xml/sitemap_index.xml、 與 /sitemap-index.xml

依照 sitemap protocol 的標準格式, 一筆基本項目至少會包含 <loc><lastmod>

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/about</loc>
    <lastmod>2026-04-16</lastmod>
  </url>
</urlset>

如果網站規模較大,也可以使用 sitemap index 來分拆多份 sitemap,讓頁面、文章、商品或多語內容分別管理。 從產品角度看,這份檔案就是網站的公開頁面目錄,讓搜尋引擎與 AI 系統不需要只靠首頁與內部連結慢慢摸索整站結構。

為什麼 sitemap.xml 會成為評分依據

很多人會把 sitemap 想成「有做就加分」的技術項目,但真正重要的不是有沒有這個檔案,而是它裡面的內容是否可信、 是否健康、是否有助於搜尋系統理解網站。

一份高品質的 sitemap 至少應該回答這些問題:

  • 網站有哪些正式公開頁面。
  • 哪些是核心內容,哪些只是低價值或不應被索引的頁面。
  • 這些 URL 是否真實存在,而不是錯誤、過期或異常清單。
  • 這些頁面是否真的可訪問。
  • 更新日期是否可信,而不是亂填一堆 lastmod
  • 這些 URL 是否屬於同一網站主體,而不是混進非正式版本。
對搜尋引擎的意義

它是一份經整理的內容清單,能幫助搜尋系統更有效率地發現、抓取與更新網站頁面。

對 AI 系統的意義

它提供整站內容盤點入口,讓 AI 搜尋、RAG 與引用型系統更容易快速掌握正式公開內容範圍。

sitemap.xml 能帶來什麼價值

1. 提高內容被發現的效率

Google 官方指出,sitemap 特別適合大型網站、彼此未充分互連的頁面、新頁面很多的網站, 以及包含圖片、影片、新聞或多語內容的網站。這表示 sitemap 的價值不是裝飾,而是幫助搜尋引擎更快掌握內容清單。

2. 幫助搜尋引擎理解內容庫範圍

搜尋引擎看到的不是只有首頁,而是一整個內容集合。sitemap.xml 能直接把這個集合整理成可處理格式, 讓搜尋系統更快知道站內大約有多少頁面、哪些值得列入抓取隊列、哪些最近有變動。

3. 降低站內內容訊號混亂

如果 sitemap 裡混入大量參數頁、測試頁、重複頁、追蹤頁、錯誤頁或 noindex 頁,搜尋引擎收到的就不是高品質內容清單, 而是一份噪音很高的資料集。因此,好的 sitemap 並不是越大越好,而是越準越好。

4. 對大型站點與多語站更重要

Google 在 crawl budget 官方說明中提到,網站應該管理自己的 URL inventory,並只把值得抓取的內容交給搜尋系統。 對大型內容站、電商站、文件站、媒體站與多國多語網站來說,這尤其重要。

sitemap.xml 不能做什麼

它不是排名保證

提交 sitemap 並不保證頁面一定會被收錄,也不保證排名會因此上升。它能做的是幫助搜尋引擎理解與發現內容,不是排名按鈕。

它不是內容品質替代品

如果 sitemap 裡列出很多低品質內容,Google 不會因為你把它們寫進 sitemap 就自動提高抓取意願。高品質內容仍然是前提。

它不是結構問題的遮羞布

sitemap 可以幫助搜尋系統理解網站,但不能取代良好的資訊架構、內部連結、canonical、noindex 與 hreflang。

它不是所有 URL 都該放進去的垃圾桶

如果把不重要的 URL 全塞進 sitemap,只會讓整份清單失去可信度。高品質 sitemap 的前提不是「什麼都放」,而是「只放值得被看見的內容」。

為什麼壞的 sitemap 反而會傷害網站

有 sitemap 並不一定比沒有 sitemap 好。當 sitemap 品質差到一定程度,它反而會對搜尋與 AI 系統產生反效果。

1. URL 格式錯誤

<loc> 不是合法 URL,或混入 undefinednulljavascript:mailto: 等異常值,代表 sitemap 生成流程本身就不可靠。

2. 重複 URL 太多

同一個 URL 重複出現很多次,通常代表輸出流程混亂或 canonical 整理不乾淨。對搜尋引擎來說,這是一種低品質訊號。

3. 放入無效連結或異常頁面

若 sitemap 裡很多 URL 點開後是 404、500、無限跳轉、登入牆或其他非預期狀態,等於你主動提交了一份錯誤導覽。

4. 放入 noindex 頁面

這會製造訊號衝突。一方面在 sitemap 裡說「請關注這些頁面」,另一方面又在頁面層說「不要索引它們」。

5. 放入跨網域或非正式版本

混入測試環境、CDN 非正式頁面、舊版網域或不屬於主體的子網域,會讓整體站點邊界變得不清楚。

6. lastmod 上次更新時間失真

如果每頁都寫同一天、同一秒,或乾脆使用未來時間、無效日期,lastmod 就會失去可信度。 這會讓更新訊號不再有參考價值。

在 AI 時代,為什麼 sitemap.xml 比以前更有價值

當網站逐漸不只面對傳統搜尋引擎,也同時面對 AI 搜尋、RAG 系統、內容引用型代理與知識抽取流程時, 內容清單的重要性會再往上升一層。

因為這些系統在接觸網站時,通常需要先回答幾個問題:

  • 網站的正式內容有哪些。
  • 哪些頁面應該被優先理解。
  • 哪些 URL 是正式公開版本。
  • 哪些內容屬於多語、圖片、影片或延伸資產。
內容庫清單

sitemap 是整站內容盤點,不像 JSON-LD 專注單頁語意,也不像 Meta Tags 偏重單頁摘要。

內容入口

若網站內容多而 sitemap 結構差,AI 系統很難快速掌握整站範圍;反之,健康的 sitemap 會提高整站理解效率。

我們如何解讀 sitemap.xml 分數

在 GEO Scorecard 中,sitemap.xml 不是只看有沒有,而是從「有沒有、準不準、健不健康、值不值得信任」四個方向來看。

一、是否存在與可取得

  • sitemap 入口是否存在。
  • 入口 URL 是否可連線。
  • 回應是否為可解析的 XML sitemap。

二、格式與結構是否健康

  • <loc> 是否為合法 URL。
  • XML 是否可解析。
  • 是否存在異常 URL。
  • 是否有大量重複 URL。

三、URL 品質是否值得信任

  • 列出的 URL 是否真的可訪問。
  • 是否屬於同一主網域或同品牌合理範圍。
  • 是否包含太多 noindex 頁面。
  • 是否有足夠的 URL 覆蓋,而不是過小或過度抽樣。

四、更新訊號與內容管理是否可信

  • lastmod 是否存在且合理。
  • 最近更新頁面比例是否健康。
  • 日期分布是否自然,而不是整批灌同一天。

高分不代表站點只是「有一份 XML 檔」,而是代表公開頁面清單比較乾淨、結構清楚、更新訊號可信, 而且更容易讓搜尋引擎與 AI 系統理解整站內容範圍。

高分的 sitemap.xml 通常長什麼樣子

高分 sitemap 不一定很複雜,但通常有幾個共同特徵:

  • 站點有明確 sitemap 入口,而且 robots.txt 會主動宣告 sitemap URL。
  • URL 清單乾淨,放的是正式公開頁面,而不是測試頁、參數頁、重複頁或 noindex 頁。
  • 若網站內容很多,會使用 sitemap index 分拆頁面、文章、商品、多語與媒體內容。
  • lastmod 反映真實更新,而不是每頁一律同一天亂寫。
  • 對多語或媒體型網站,會視需求提供 Google 支援的延伸標記。
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-pages.xml</loc>
    <lastmod>2026-04-16</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-blog.xml</loc>
    <lastmod>2026-04-16</lastmod>
  </sitemap>
</sitemapindex>

常見錯誤與風險

  • 把所有頁面一股腦塞進 sitemap: 混入搜尋結果頁、參數頁、過期活動頁、登入後頁面與重複內容頁。
  • sitemap 有,但根本不可讀: 表面上有 /sitemap.xml,實際卻回傳 HTML、錯誤頁或空檔。
  • 寫了 lastmod,但毫無可信度: 整站所有頁面每天都顯示今天更新。
  • 有大量 noindex URL: sitemap 與頁面層訊號互相打架。
  • 主網域不一致: 混入測試網域、暫存環境或不同品牌子站 URL。
  • 多語網站沒有對應邏輯: sitemap 沒有反映 hreflang 或 localized versions 結構。

這項分數代表什麼

sitemap.xml 分數真正想告訴你的,不是網站有沒有一份 XML 檔,而是網站有沒有把正式公開內容整理好、 搜尋引擎是不是容易找到真正重要的頁面、低品質或不該索引的頁面是否混進主要清單、更新訊號是否可信, 以及整站結構是否足夠清楚。

因此,當一個網站在這個面向得分偏低,常見含義不是「少了一個 SEO 檔案」,而是內容盤點混亂、公開頁面清單不乾淨、 抓取效率可能被浪費,搜尋與 AI 系統也較難建立穩定整站理解。

官方規範與參考連結

下列來源可作為這個評分面向的外部依據。這些連結讓使用者理解:這不是主觀評論,而是建立在正式規範、 搜尋引擎文件與內容發現最佳實務上的整理。

AI SEO 評分說明

JSON-LD 結構化資料說明

了解 JSON-LD 如何影響頁面類型辨識、品牌與內容實體關係、Breadcrumb、FAQ 與 Article schema, 以及搜尋引擎與 AI 系統對頁面語意的理解方式。

主題:語意資料 焦點:頁型與實體 語言:繁體中文
JSON-LD 與語意清晰度

JSON-LD 為什麼重要

搜尋品質好壞的關鍵

對 GEO Scorecard 而言,JSON-LD 不只是多一層標記,而是網站主動把頁面類型、實體、發布資訊與站內關係整理成 外部系統可直接解析的格式。這會直接影響搜尋引擎與 AI 系統的頁型判讀與語意理解品質。

什麼是 JSON-LD

JSON-LD 是一種用 JSON 表示 Linked Data 的格式,常用來描述頁面類型、品牌、作者、Breadcrumb、FAQ、文章欄位與其他可結構化資訊。 Google 在 structured data 文件中明確建議,若網站環境允許,應優先使用 JSON-LD。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "AI 驅動的網站 SEO 健檢",
  "author": {
    "@type": "Organization",
    "name": "GEO Scorecard"
  },
  "datePublished": "2026-04-16"
}
</script>

若用更產品化的方式來說,JSON-LD 就像是網站提供給搜尋與 AI 系統的一張結構化說明卡: 正文仍然很重要,但重要語意會被整理成更容易直接處理的欄位。

為什麼這會成為評分依據

JSON-LD 會被納入評分,不是因為掛上一個 <script type="application/ld+json"> 就值得加分, 而是因為它反映網站是否具備把內容「結構化表達」的能力。

一份品質良好的 JSON-LD,至少應該回答這些問題:

  • 這頁是文章、FAQ、品牌頁、網站首頁,還是其他頁型。
  • 這頁對應的是哪個實體。
  • 作者、品牌、日期、路徑與其他關鍵欄位是否清楚。
  • 這些欄位是否與頁面可見內容一致。
對搜尋引擎的意義

它能幫助頁面類型辨識與部分rich result理解,讓單頁內容不只是文字,而是有類型與欄位的資料單位。

對 AI 系統的意義

它能降低頁型、實體與關係判讀成本,讓外部系統更快建立頁面框架與站點身份。

JSON-LD 能做什麼,不能做什麼

它能做的事

  • 描述頁面類型: 例如 ArticleFAQPageBreadcrumbListOrganizationWebSite
  • 提供關鍵欄位: 例如作者、日期、品牌、站點名稱、問答關係與導覽路徑。
  • 提高語意清晰度: 讓頁面從單純文字,變成有欄位、有關係的內容單位。
  • 支撐部分搜尋呈現: 讓外部系統更容易建立rich result或更準確的頁型理解。

它不能保證的事

  • 不能保證 rich results 一定出現: schema 不等於rich result保證。
  • 不能保證排名提升: 它不是排名捷徑,而是語意清晰度訊號。
  • 不能取代正文內容: 若頁面本身內容薄弱,JSON-LD 也無法補救。
  • 不能憑空編故事: 若欄位與頁面可見內容不一致,反而會降低可信度。

為什麼錯誤的 JSON-LD 反而會降低可信度

1. 型別選錯

如果一篇純說明頁硬套成 Product,或明明沒有 FAQ 區塊卻標成 FAQPage, 外部系統就會對頁面產生錯誤預期。型別錯了,後面的完整欄位也失去意義。

2. 欄位與可見內容不一致

例如頁面沒有作者資訊卻填了作者、可見標題與 headline 不一致、FAQ 不存在卻輸出問答結構, 都會使結構化資料看起來像另一個頁面版本。

3. 欄位殘缺或亂填

常見狀況包括:@type 正確但關鍵欄位空白、圖片 URL 不存在、日期格式錯誤、Breadcrumb 順序與實際導覽不一致。 這些問題不一定讓頁面壞掉,但會讓 JSON-LD 從加分訊號變成低信任訊號。

4. 重複、衝突、版本混亂

若同一頁同時輸出多份互相衝突的 OrganizationArticleWebSite, 外部系統就得自行猜哪一份才是真的。這種情況在 CMS、外掛與自製腳本混用時很常見。

在 AI SEO 時代,JSON-LD 更像「語意說明層」

若說 Meta Tags 是頁面的摘要層,那 JSON-LD 更像是頁面的語意說明層。它直接把「這是什麼、有哪些欄位、彼此如何關聯」 整理成外部系統較容易消化的格式。

頁型辨識

有明確類型的頁面,比沒有類型的頁面更容易被正確歸類。

實體關係

品牌、作者、文章、Breadcrumb 等欄位被整理後,外部系統較容易建立頁面框架。

語意穩定度

當類型與欄位都與可見內容一致,頁面就更容易被視為可信的結構化來源。

我們如何解讀 JSON-LD 分數

在 GEO Scorecard 中,JSON-LD 分數不是看「有沒有 schema」,而是從「有沒有、合不合理、準不準、能不能支撐語意理解」四個方向看。

一、是否存在可解析的結構化資料

  • 頁面是否有 JSON-LD。
  • JSON 是否可解析。
  • @context@type 是否存在。
  • 基本格式是否正確。

二、型別選擇是否合理

  • 長文內容是否使用 Article 或相近類型。
  • FAQ 區塊是否真的使用 FAQPage
  • 導覽路徑是否有 BreadcrumbList
  • 品牌資訊是否有 OrganizationWebSite

三、欄位是否與頁面內容一致

  • headline 是否與主標接近。
  • 日期、作者、圖片等欄位是否可信。
  • Breadcrumb 是否與實際導覽一致。
  • FAQ 問答是否真的存在於頁面上。

四、是否有助於外部系統穩定理解

  • 是否提供清楚的頁面類型訊號。
  • 是否把重要實體與關係整理出來。
  • 是否減少頁型判讀的猜測成本。
  • 是否讓頁面身份與站點身份更穩定。

高分的 JSON-LD 通常長什麼樣子

高分頁面的共同特徵通常包括:

  • 型別選得對,不濫用。
  • 欄位完整但不硬塞。
  • 與頁面可見內容高度一致。
  • 重要頁型有對應 schema。
  • 不重複、不衝突、不混亂。
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "JSON-LD 結構化資料說明",
  "publisher": {
    "@type": "Organization",
    "name": "GEO Scorecard"
  }
}

對長文說明頁來說,常見健康組合通常會是 ArticleBreadcrumbListOrganization。 若頁面本身就是 FAQ 聚合頁,才適合再補上 FAQPage

這項分數代表什麼

JSON-LD 分數真正代表的,不是你會不會寫 schema,而是你的網站有沒有把頁面類型、重要欄位與站內關係講清楚。 它反映的是內容是否不只可讀,還可被結構化理解。

因此,當一個網站在這個面向得分偏低,通常代表頁型描述不清、欄位與內容不一致、或站點語意框架不夠穩定, 使搜尋引擎與 AI 系統需要花更多成本自行推測頁面的真實身份。

官方規範與參考連結

下列來源可作為這個評分面向的外部依據。這些連結讓使用者理解:這不是主觀評論,而是建立在搜尋引擎文件、Schema.org 與 JSON-LD 規範上的整理。

Google 官方

Schema.org 與 JSON-LD

AI SEO 評分說明

Meta Tags 標籤品質說明

了解 titledescriptionrobotscanonical 與 Open Graph 如何影響頁面主題、摘要、版本判斷,以及搜尋引擎與 AI 系統對內容的第一層理解。

主題:頁面訊號 焦點:摘要與版本 語言:繁體中文
Meta Tags 與頁面理解

Meta Tags 為什麼重要

關鍵的溝通橋樑

對 GEO Scorecard 而言,Meta Tags 不是一組附帶欄位,而是頁面對搜尋引擎、分享平台與 AI 系統主動提供的第一層說明。 它會影響頁面主題怎麼被辨識、摘要怎麼被生成、正式版本如何被判定,以及外部系統是否容易得到一致訊號。

什麼是 Meta Tags

Meta Tags 是放在 HTML <head> 區域中的頁面描述資訊。它們不一定直接出現在畫面上, 但會被搜尋引擎、瀏覽器、社群平台、分享預覽服務與其他外部系統讀取。

從 AI SEO 的角度來看,真正有決策價值的通常是以下訊號:

  • <title>:頁面的主標題訊號。
  • <meta name="description">:頁面的摘要描述。
  • <meta name="robots">:索引與摘要控制規則。
  • <link rel="canonical">:正式版本 URL 宣告。
  • og:titleog:descriptionog:image:分享與預覽常用訊號。
<head>
  <title>AI 驅動的網站 SEO 健檢 | GEO Scorecard</title>
  <meta name="description" content="六大面向自動檢查,產出可量化的評分報告與改善建議。" />
  <meta name="robots" content="index,follow,max-snippet:-1,max-image-preview:large" />
  <link rel="canonical" href="https://example.com/ai-seo-scorecard" />
  <meta property="og:title" content="AI 驅動的網站 SEO 健檢" />
</head>

這些欄位個別都不大,但合在一起,已足以讓外部系統先知道頁面主題、對外摘要、索引策略與代表網址。

為什麼這會成為評分依據

Meta Tags 之所以被納入評分,是因為它反映網站是否具備「頁面層級的表達能力」。 搜尋引擎與 AI 系統在處理頁面時,不會只讀正文,也會參考標題、描述、索引規則與版本訊號。

一組品質良好的 Meta Tags,至少應該回答這些問題:

  • 這頁最應該被理解成什麼主題。
  • 這頁對外應如何被摘要。
  • 這頁是否允許被索引與顯示摘要。
  • 這頁的正式版本 URL 是哪一個。
  • 當頁面被分享時,預覽內容是否穩定。
對搜尋引擎的意義

它會影響 title links、搜尋摘要、索引邊界與 canonical 版本判定。

對 AI 系統的意義

它能降低主題判讀與摘要生成的猜測成本,讓外部系統更快掌握頁面第一層重點。

Meta Tags 能做什麼,不能做什麼

它能做的事

  • 提供頁面主題訊號: 幫助搜尋引擎與 AI 系統快速建立主題框架。
  • 提供摘要線索: 讓搜尋與分享系統更容易拿到頁面濃縮資訊。
  • 控制索引與摘要邊界: 例如 noindex、snippet 限制與圖片預覽設定。
  • 宣告正式版本: 透過 canonical 降低重複內容版本混亂。
  • 提供分享預覽: 讓社群與外部工具能穩定呈現頁面卡片。

它不能保證的事

  • 不能保證完全照抄: Google 仍可能依可見內容重寫 title 或摘要。
  • 不能取代內容品質: 欄位再完整,也無法補救空洞頁面。
  • 不能保證所有平台一致遵守: 不同系統仍有不同解讀與呈現方式。
  • 不能取代資訊架構: canonical、robots 只是訊號,不能獨自解決站內混亂。

為什麼錯誤的 Meta Tags 會直接拉低理解品質

1. title 與頁面主題不一致

<title> 寫的是口號或過度空泛的行銷句,可見主標卻在講別的事,搜尋系統就得自行猜哪個才是主題。 這會提高標題被改寫的機率,也會讓 AI 摘要對頁面主題的理解較不穩定。

2. description 空泛或大量重複

很多網站把同一段品牌文案複製到大量頁面,導致每一頁的摘要辨識度都很低。這種寫法不會幫助系統理解頁面差異, 反而會讓重要內容被稀釋。

3. robots 設定與頁面目標衝突

明明希望曝光的頁面卻帶 noindex,或過度限制 snippet 與圖片預覽,等於主動削弱頁面對外可見性。 反過來說,本來就不應曝光的低價值頁如果沒有明確規則,也會讓整站公開邊界模糊。

4. canonical 指錯或互相衝突

canonical 問題不一定會在畫面上爆炸,但會慢慢影響索引與版本判斷。當 canonical 指向首頁、錯頁、參數版或多套方法彼此不一致時, 會使外部系統更難判定真正的代表 URL。

5. 社群預覽與搜尋訊號脫鉤

og:titleog:description 與搜尋主題完全不同,頁面在不同入口看起來就像兩個身份。 這會削弱內容在搜尋、分享與 AI 引用時的主題穩定度。

在 AI SEO 時代,Meta Tags 的角色更像「頁面摘要層」

過去 Meta Tags 常被理解成傳統搜尋的基本設定,但現在更適合把它看成頁面的摘要層與規則層。 因為搜尋引擎與 AI 系統都在做同一件事:快速判斷某頁值不值得理解,以及應該如何對外呈現。

主題穩定度

title、可見主標與 og:title 越一致,頁面主題越容易被穩定辨識。

摘要穩定度

description 與正文重點越接近,搜尋摘要與 AI 摘要越不需要額外重組。

引用邊界

robotsdata-nosnippet 可進一步控制哪些內容適合被對外摘錄。

我們如何解讀 Meta Tags 分數

在 GEO Scorecard 中,Meta Tags 分數不只看欄位存不存在,而是從「有沒有、準不準、一不一致、能不能支撐外部理解」四個方向來看。

一、是否存在基本標籤

  • 是否有 <title>
  • 是否有 meta description
  • 是否有合理的 robots 設定。
  • 是否有 canonical。
  • 是否有基本 Open Graph 預覽欄位。

二、內容是否準確

  • title 是否真的代表頁面內容。
  • description 是否真的在摘要核心資訊。
  • canonical 是否指向正確版本。
  • robots 是否符合頁面對外目標。

三、訊號是否一致

  • title、可見主標、og:title 是否彼此支援。
  • description 與頁面首段、主要摘要是否一致。
  • canonical 與實際頁面導向是否一致。
  • 搜尋與分享預覽是否至少在主題上同方向。

四、是否有助於摘要與引用

  • 頁面是否提供足夠清楚的主題線索。
  • 頁面是否提供可用的摘要線索。
  • 是否過度限制 snippet,導致可見性過低。
  • 是否把重要內容與可見敘事對齊。

高分的 Meta Tags 通常長什麼樣子

高分頁面的共同特徵,通常不是標籤很多,而是少量但重要的訊號彼此協調:

  • 標題具體,不空泛。
  • Description 真的在摘要,不只是品牌口號。
  • Canonical 清楚且可信。
  • Robots 設定符合頁面目標。
  • OG 預覽與搜尋主題一致。
  • 每個欄位都在描述同一頁,而不是各說各話。
<title>Meta Tags 標籤品質說明 | GEO Scorecard</title>
<meta name="description" content="說明 title、description、canonical 與 robots 如何影響頁面主題與摘要品質。" />
<meta name="robots" content="index,follow,max-snippet:-1,max-image-preview:large" />
<link rel="canonical" href="https://example.com/descriptions/meta-tags-zh" />
<meta property="og:title" content="Meta Tags 標籤品質說明" />

這項分數代表什麼

Meta Tags 分數真正代表的,不是你有沒有把 <head> 填滿,而是你的頁面有沒有把自己講清楚。 它反映的是主題是否聚焦、摘要是否可信、版本是否清楚,以及搜尋、分享與 AI 理解時能否維持一致身份。

因此,當一個網站在這個面向得分偏低,常見含義不是「少幾個欄位」而已,而是頁面主題、摘要與版本訊號不夠穩定, 使外部系統需要花更多成本自行重組理解。

官方規範與參考連結

下列來源可作為這個評分面向的外部依據。這些連結讓使用者理解:這不是主觀評論,而是建立在搜尋引擎文件與正式規範上的整理。

AI SEO 評分說明

HTML 結構語意說明

了解主標、主內容區、語意區塊、列表表格與可抓取連結,如何影響搜尋引擎與 AI 系統辨識頁面骨架, 並成為 AI SEO 評分中的重要加分訊號。

主題:內容骨架 焦點:主內容與語意 語言:繁體中文
HTML 結構與內容骨架

HTML 結構為什麼重要

AI 搜尋引擎理解與信任內容的基礎

對 GEO Scorecard 而言,HTML 結構不是在評前端寫法漂不漂亮,而是在看內容是否被整理成 對人可讀、對搜尋引擎與 AI 系統也可推論的骨架。

什麼是 HTML 結構

HTML 結構指的是頁面如何用標記語言把內容組織起來。這不只是有沒有標籤,而是主標、章節、主內容區、導覽、側欄、列表、表格、圖說與連結是否用合理方式表達。

這個面向最關鍵的不是畫面效果,而是下列問題:

  • 標題是否有層級。
  • 內容是否切成合理區塊。
  • 主內容區是否清楚。
  • 導覽與補充資訊是否有自己的位置。
  • 列表、表格、圖片與連結是否用對元素。

若頁面視覺上很完整,但底層 HTML 幾乎沒有語意,外部系統在理解時就得花更多成本猜測什麼是主題、什麼是主內容、什麼只是模板。

為什麼這會成為評分依據

HTML 結構會成為評分依據,是因為搜尋引擎與 AI 系統在理解網頁時,不是只讀一串文字,而是讀一個有主次、區塊與層級關係的文件。

一個品質良好的 HTML 結構,至少應該回答這些問題:

  • 這頁的主標題是什麼。
  • 主要內容在哪裡。
  • 哪些是導覽,哪些是正文,哪些是補充資訊。
  • 區塊與區塊之間的關係是否清楚。
  • 重要內容是否被正確標示,而不是只靠 CSS 做出視覺效果。
對搜尋引擎的意義

它會影響頁面主標、內部連結、主內容區與內容型態如何被辨識。

對 AI 系統的意義

它會影響主內容抽取、段落切分、重點歸納與頁面主次判斷的穩定度。

HTML 結構能做什麼,不能做什麼

它能做的事

  • 幫助辨識主標與章節層級: 讓頁面主命題與子題更容易被拆解。
  • 幫助辨識主內容區: 讓正文與導覽、側欄、補充資訊更容易區分。
  • 支撐資料型態理解: 讓列表、表格、圖說、時間等內容更容易被正確解讀。
  • 強化站內關聯: 讓標準 <a href> 連結更容易被抓取與建立頁面關係。
  • 降低猜測成本: 讓外部系統更快知道哪裡是主內容、哪裡是模板內容。

它不能保證的事

  • 不能保證排名一定變好: 結構清楚不是排名保證,而是理解加分項。
  • 不能取代內容品質: 骨架再清楚,也不能把空洞內容變成高品質頁面。
  • 不能取代其他訊號: 它不能代替 Meta Tags、JSON-LD、robots、sitemap 等面向。
  • 不能補救混亂策略: 若整體內容策略與站內架構很亂,語意 HTML 也無法單獨解決。

為什麼結構不清楚會直接拉低 AI SEO 表現

1. 主標與章節層級不清楚

如果頁面上有很多看起來像大標題的文字,卻沒有清楚的主標與章節關係,外部系統就更容易誤判什麼是主命題、什麼只是裝飾字。

2. 主內容與模板內容混在一起

如果推薦文章、CTA、側欄、重複導航與正文混成一片,搜尋與 AI 系統就更難穩定抽出主要內容。

3. 連結不可抓或不可解析

若站內導覽主要依賴沒有 href 的假連結、純 JavaScript 點擊事件或非標準元素,Google 不一定能穩定提取 URL, 這會削弱站內關聯圖譜。

4. 列表、表格、圖說只靠視覺做出來

當流程、比較、問答或規格只是靠任意 div 排出視覺樣子,外部系統會較難穩定推斷其資料型態。

5. 初始 HTML 幾乎沒有主內容骨架

若重要資訊都要靠後續客端渲染才出現,系統就必須先渲染、再等待、再解析。這對搜尋與 AI 系統都不是最穩定的理解方式。

在 AI SEO 時代,HTML 結構更像「內容骨架訊號」

Meta Tags 提供頁面摘要,JSON-LD 提供語意說明,而 HTML 結構提供的是內容骨架。 這層骨架決定外部系統是否容易抽取主內容、切出段落、辨識步驟比較與建立頁面主次關係。

主內容抽取

mainarticlesection 越清楚,主內容抽取越穩定。

段落拆解

heading 層級越清楚,內容越容易被拆成有意義的單位與回答片段。

站內關聯

標準 <a href> 連結越完整,頁面之間的關係越容易被理解。

我們如何解讀 HTML 結構分數

在 GEO Scorecard 中,HTML 結構分數不是看 DOM 有多漂亮,而是從「主題清不清楚、主內容明不明顯、結構可不可解析、站內關係好不好推論」四個方向看。

一、主題與標題層級是否清楚

  • 是否有清楚的頁面主標。
  • heading 層級是否自然。
  • 是否存在多個彼此競爭的主標。
  • 章節標題是否真的對應內容段落。

二、主要內容區是否明確

  • 是否有清楚的主內容區。
  • 正文與導覽、側欄、頁尾是否易於區分。
  • 是否過度被模板內容干擾。
  • 初始 HTML 是否已呈現主要內容骨架。

三、語意元素是否合理

  • 是否合理使用 mainarticlesectionnavheaderfooter
  • 列表、表格、圖說、時間等是否使用對應元素。
  • 是否不是所有內容都被扁平成沒有語意的 div

四、站內關聯是否容易理解

  • 重要連結是否為標準可抓取 <a href>
  • 站內路徑是否清楚。
  • 導覽與內容層級是否彼此支援。
  • 是否能形成穩定的頁面關聯。

對 AI SEO 特別有幫助的結構加分項

這一段不是在教你怎麼寫 HTML,而是在說明哪些結構訊號通常會對 AI SEO 評分有正向影響。

  • 單一且清楚的主題入口: 頁面有一個很明確的主標,正文開頭就進入主題。
  • 可拆解的章節骨架: 內容不是一整塊文字,而是能被標題與段落切成可理解單位。
  • 主內容與補充內容分層清楚: 側欄、CTA、推薦閱讀不會壓過正文主敘事。
  • 比較、步驟、清單有明確資料型態: 外部系統更容易正確抽取重點。
  • 站內關聯自然且可抓取: 相關內容與上層分類可透過標準連結被理解。
  • 初始 HTML 就有足夠可理解內容: 不把所有重要資訊都押在後續渲染。

這項分數代表什麼

HTML 結構分數真正代表的,不是工程師寫得夠不夠工整,而是你的頁面骨架是否清楚,主內容是否明確, 以及重要內容是否用外部系統可推論的方式表達出來。

因此,當一個網站在這個面向得分偏低,通常代表的不是單一標籤寫錯,而是頁面主次、內容層級與站內關聯不夠清楚, 讓搜尋引擎與 AI 系統需要花更多成本猜測「這頁到底哪裡最重要」。

官方規範與參考連結

下列來源可作為這個評分面向的外部依據。這些連結讓使用者理解:這不是前端潔癖,而是建立在搜尋引擎、W3C 與 MDN 文件上的內容骨架判讀。

AI SEO 評分說明

Agent 可行動性說明(OpenAPI)

了解 OpenAPI 為什麼不只是 API 文件,而是決定 AI Agent 能不能從「讀懂頁面」走到「實際呼叫服務」的行動層能力。

主題:行動能力 焦點:Agent 可行動性 語言:繁體中文
OpenAPI 與能力理解

OpenAPI 為什麼重要

成為AI生成回答的「資訊來源」

對 GEO Scorecard 而言,OpenAPI 不是只給工程師看的補充文件,而是網站是否有把服務能力、輸入輸出格式與高價值內容出口講清楚的能力訊號。

什麼是 OpenAPI 路徑

OpenAPI 是描述 HTTP API 的標準格式。它把 API 的版本、入口、路徑、參數、請求格式、回應格式、授權方式與共用資料模型整理成外部系統可直接解析的文件。

對這個評分面向來說,重點不只在文件內容,也在於它是否能被穩定找到。

  • /.well-known/openapi.json
  • /openapi.json
  • /swagger.json
  • /openapi.yaml / /openapi.yml
  • /docs/openapi.json
  • /api/openapi.json
  • /v3/api-docs

當網站把文件放在這些常見入口時,搜尋系統、文件工具、整合平台與 AI 助理就更容易辨識:這個網站除了有內容頁,也有可被理解與使用的服務能力。

為什麼這會成為評分依據

如果 \`robots.txt\` 在講抓取邊界、\`sitemap.xml\` 在講內容盤點、Meta Tags 在講頁面摘要,那 OpenAPI 講的就是網站的能力邊界。

一份品質良好的 OpenAPI 至少應該回答這些問題:

  • 這份 API 是什麼。
  • 在哪裡可以呼叫。
  • 有哪些操作與路徑。
  • 輸入輸出長什麼樣子。
  • 哪些能力需要授權。
對平台型網站的意義

它能把查詢、交易、預約、登入、訂單、報價等能力整理成可被整合的使用格式。

對一般網站的意義

它也能把 FAQ、活動、條款、隱私、價格與門市資訊整理成結構化內容出口。

OpenAPI 能做什麼,不能做什麼

它能做的事

  • 讓能力可被發現: 讓外部系統更快知道網站有沒有可呼叫的 API 或可讀取的結構化內容。
  • 讓輸入輸出可被理解: 以資料結構定義請求與回應格式,降低整合成本。
  • 讓授權邊界可被理解: 透過 securitySchemes 清楚說明 Bearer、OAuth2 或 API Key。
  • 讓內容可按需取用: 把 FAQ、活動、價格、條款等資訊變成可結構化查詢的出口。
  • 支撐 AI 與工具使用: 讓文件 UI、SDK 產生器、測試工具與 AI 助理更容易接上。

它不能保證的事

  • 不能保證排名一定提升: OpenAPI 不是傳統排名因子,但它會影響理解與整合成本。
  • 不能取代正式頁面: API 應該是結構化出口,不應取代原本的權威內容頁。
  • 不能掩蓋文件與實作不一致: 文件若和真實回應脫節,反而會傷害信任。
  • 不能取代安全設計: 有 OpenAPI 不代表權限與公開範圍就合理。

為什麼缺少可發現的 OpenAPI 會直接拉低這項分數

1. 有服務能力,但沒有標準入口

很多網站其實有 API,但能力只藏在前端請求、內部文件或工具介面裡。這代表能力存在,但沒有被清楚整理成外部可理解的入口。

2. 有檔案,但不是合法 OAS 3.x

若文件缺少 openapiinfopaths 或基本結構錯誤,工具鏈與 AI 系統就很難穩定解析。

3. 有路徑,但沒有足夠說明

只有 API 路徑名稱而沒有 summary、資料結構、範例與回應定義,會讓 API 退化成半人工猜測文件。

4. 文件與真實能力脫節

文件若寫的是一套、實際回應是另一套,對使用者與整合方來說,比沒有文件更糟。

5. 對外能力邊界不清楚

不是所有內部 API 都應該公開。高分關鍵不是暴露所有端點,而是把對外可用的能力與內容出口整理清楚。

一般網站也可以怎麼使用 OpenAPI

這一點很關鍵,因為它決定 OpenAPI 會不會被看成「只有平台型網站才需要」的項目。事實上,一般網站也可以把高頻資訊整理成結構化內容 API。

以下內容都很適合 API 化:

  • FAQ
  • Promotion / campaign 活動資訊
  • 價格方案
  • 門市與據點資訊
  • 客服與聯絡方式
  • 配送與退換貨規則
  • 服務條款與隱私聲明

一個一般品牌網站就可能整理出這樣的內容型接口:

GET /api/faq
GET /api/promotions
GET /api/promotions/{promotionId}
GET /api/terms/latest
GET /api/privacy/latest
GET /api/store-locations
GET /api/customer-support/channels
GET /api/pricing/plans

如果再把欄位講清楚,價值會更高:

  • FAQ API: questionanswercategorylocaleupdated_at
  • Promotion API: titlestart_atend_atstatuscanonical_url
  • Terms API: versioneffective_datesections[]locale
  • Store API: store_idaddressgeoopening_hourscontact_phone
合理做法

把內容拆成可按主題與欄位取用的資料,不要只是把整篇網頁全文塞進單一欄位。

產品原則

HTML 頁面仍是正式內容,OpenAPI 是結構化出口,兩者互相補強,而不是互相取代。

三種行動情境:從可讀到可行動

這是 OpenAPI 與一般 SEO 工具最容易被忽略的差異:網站不只要能被看見,還要能被 AI Agent 實際使用。

情境一:AI 只能讀你的頁面

只有 HTML 與 FAQ 時,AI 可能只能摘要內容,無法代表使用者執行查詢、下單或狀態查核。

情境二:AI 能理解你的 API

有基本 OpenAPI 文件後,AI 能知道有 API 存在,但若缺 servers、security 或 schema,仍難以穩定調用。

情境三:AI Agent 能實際呼叫你的服務

當 servers、security、request/response schema 與 examples 完整時,Agent 才能正確組請求並完成任務。

在 AI SEO 時代,OpenAPI 更像「能力說明層」

AI SEO 不只是在看頁面能不能被讀懂,也越來越在看網站的能力能不能被理解與調用。對 AI 來說,最有價值的不是模糊描述,而是可以按需取用的結構化答案。

內容取用說明

如果網站把 FAQ、活動、條款、隱私與價格整理成 API,OpenAPI 就不只是服務操作說明,也會是內容取用說明。

版本與適用性

effective_dateexpires_atlocalecanonical_url 這些欄位能幫助 AI 更穩定判讀內容是否適用。

能力邊界

serverspathssecuritySchemes 清楚時,外部系統比較不會誤會哪些能力能用、哪些不能用。

我們如何解讀 OpenAPI 分數

在 GEO Scorecard 中,OpenAPI 分數不是只看「有沒有 openapi.json」,而是一路往下看文件是否合法、資訊是否完整、路徑是否清楚、資料格式定義是否足夠,以及授權方式是否有被交代。

一、文件結構是否合法

  • 是否存在可讀取的 OpenAPI 文件。
  • openapi 欄位是否存在且為 OAS 3.x。
  • 是否符合基本 OpenAPI 文件結構。

二、基本身份是否清楚

  • info.titleinfo.versioninfo.description
  • servers 是否定義清楚。

三、操作清單是否足夠清楚

  • 是否存在 paths
  • 是否有一定數量的 API 路徑。
  • operation 是否有 summary / description 與成功回應。

四、輸入輸出是否可被穩定理解

  • 請求格式定義
  • 回應格式定義
  • 參數格式定義
  • 範例資料

五、資料模型與授權邊界是否清楚

  • components.schemas
  • components.securitySchemes
  • tags 分類

高分的 OpenAPI 通常長什麼樣子

高分文件通常不是特別長,而是把關鍵資訊整理清楚:

  • 有穩定且可預期的公開路徑。
  • 規格版本正確且結構合法。
  • infoserverspaths 清楚。
  • 請求與回應格式具體。
  • components.schemassecuritySchemes 與範例資料。
{
  "openapi": "3.1.0",
  "info": {
    "title": "Brand Content API",
    "version": "2026-04",
    "description": "FAQ、活動、條款與門市資訊的結構化內容出口"
  },
  "servers": [{ "url": "https://example.com" }],
  "paths": {
    "/api/faq": {},
    "/api/promotions": {},
    "/api/terms/latest": {}
  }
}

這樣的文件即使沒有複雜交易能力,也已經清楚表達網站願意把重要資訊整理成可被外部系統按需取用的形式。

這項分數代表什麼

OpenAPI 分數真正代表的,不是你有沒有用某個文件工具,而是你的網站有沒有把能力與高價值資訊整理成標準格式,讓外部理解與整合更穩定。

對服務型網站來說,它代表能力是否被講清楚;對一般網站來說,它也可以代表 FAQ、活動、條款、隱私、價格與門市資訊是否已被整理成結構化內容出口。

官方規範與參考連結

下列來源可作為這個評分面向的外部依據。這些連結讓使用者理解:這不是主觀評論,而是建立在 OpenAPI Initiative 正式規範與 learn 文件上的整理。

OpenAPI Initiative 官方

規範重點對應