AI 寫作指紋有哪些?目前有研究數據支持的 3 個特徵
直接回答
目前有研究數據支持的 AI 寫作指紋有三類:特定句型(「不只是X,而是Y」)、標點符號(em dash 濫用),以及 hedging 詞密集出現(「值得注意的是」「此外」每段開頭)。根據 Barron's 引用 AlphaSense 資料庫的分析,「It's not just X — it's Y」這個句型在企業文件中從 2023 年約 50 次增長到 2025 年超過 200 次,四年漲超過 4 倍。
讀到一個讓我停下來的數字:一個句型,兩年內在企業文件裡出現頻率增長超過 4 倍。
Barron’s 委託 AlphaSense 分析企業新聞稿和博客文章,追蹤「It’s not just X — it’s Y」這個句型。2023 年大約 50 次,2025 年超過 200 次。思科、埃森哲、Workday、麥肯錫、微軟都在裡面。
這個句型本身不複雜,就是一個強調遞進的結構,你在中文裡常見的版本是「不只是XXX,而是YYY」「不僅XXX,更YYY」。它太好用了,所以 AI 模型把它學進去,然後反覆輸出,直到它變成一個指紋。
—
同一份報告還提到 em dash(—)。這個標點符號在英文 AI 生成文字裡密度異常高。原因跟遞進句型一樣:訓練資料裡這個符號的使用頻率讓模型認為它是「好文章」的特徵,所以大量輸出。
中文寫作本來就幾乎不用 em dash,所以這個指紋在中文語境更明顯:一出現,就是 AI 在說話。
—
Northeastern University 另外做了一個更系統的研究,分析 ChatGPT 輸出和人類寫作的差異。他們確認了一批 hedging 詞(保留語氣的詞)在 AI 文字裡密度異常高:
「Furthermore」「Additionally」「Moreover」— 這三個詞在 AI 生成文字裡幾乎每段開頭都出現。中文對應是「此外」「再者」「更重要的是」反覆出現在段落前。
還有幾個開場句型:「It’s important to note」「It’s worth mentioning」「There are several factors to consider」。中文版是「值得注意的是」「值得一提的是」「有幾個面向需要考慮」。
這些詞彙本身不是問題,問題是密度。人類寫作裡這些詞偶爾出現,AI 寫作裡幾乎每段都有。
—
我自己在寫 Skool 和 Threads 貼文時,把這三類全部加進禁用清單裡。不是因為「感覺 AI」,是因為現在有數據支撐。
清單以外的那些「賦能」「顛覆性」「關鍵在於」,可能也是 AI 風格,但我目前沒找到對應的研究,所以不列進來。憑感覺說的和有數據說的,不是同一件事。