如何讓AI「準確」地給你的考試評分

2025年8月2日

我們經常看到的一件事是，人們把他們的寫作樣本上傳到像ChatGPT或Claude這樣的AI工具上，要求評估，然後抱怨評分不一致或不公平。我們不會在這篇文章中深入討論LLM的本質，但

a.) 你需要正確地提示工具以獲得更準確的結果

b.) LLM目前還沒有達到你應該完全依賴它們來準備考試的程度

讓我們以這個雅思樣題/回答為例：

問題：有些人認為應該教孩子在學校競爭，而另一些人認為應該教他們合作。討論這兩種觀點並給出你自己的意見。

回答：如今，關於孩子應該在學校學習競爭還是合作存在爭論。兩種方法都有優點，我將在這篇文章中討論它們...（完整的問題/答案在評論中）。

正確提示工具

如果你只是把這個複製貼上到ChatGPT中並要求給出你的雅思分數——你的提示方式是不正確的！你會得到高變異，而且可能是誇大的分數。你的提示應該看起來像這樣：

你是一位專業的雅思考官。閱讀這個附加的評分標準，然後準確公正地給以下雅思寫作任務評分：

[在這裡插入你的問題/答案對]」

你會看到更低的變異（你可以通過在多個LLM中以無痕模式打開多個聊天並給它們完全相同的提示來測試這一點）和更低的分數膨脹。

為什麼？通過使用評分標準進行提示，你迫使「虛擬考官」將你回答中的特定單詞和短語與評分標準中的指南進行匹配。這將給你一個更「準確」的結果。

LLM不是考官

我們總是把「準確」放在引號裡，因為LLM的工作方式。這些本質上是基於它們之前看到的內容的預測演算法。真正的人類考官已經參加過口頭、書面和虛擬培訓，其中專業的培訓師向評分標準添加了上下文。他們可以更容易、更一致地給新穎的問題/答案對評分。

雖然考官之間也存在差異，但數十年的培訓項目開發意味著讓專業考官審查你的結果可能會與你的考試日結果更加一致。

我們非常支持在達到某個點之前不在考試準備上花一分錢。PDF、免費線上測試、與朋友聊天、AI工具等應該首先用盡。然而，一旦你用盡了免費資源，是時候與專業考官閉環了。你可以在lottalingo.com找到一位。

祝學習順利！