テキサス州では、州が定める試験の採点を人間から人工知能(AI)に置き換えることで、年間1500万ドルから2000万ドルの節約を見込んでいます。この新しい「自動採点エンジン」は、自然言語処理技術を利用して開放型の質問を採点します。テキサス教育庁(TEA)は、2023年に必要だった6000人の採点者に対し、今年は2000人未満の採点者を雇用する計画です。
この採点システムは、State of Texas Assessments of Academic Readiness(STAAR)試験の採点に使用されます。STAAR試験は、第3学年から第8学年の生徒が受けるもので、昨年、選択式の問題が減少し、開放型の質問が最大7倍に増加しました。新しい採点システムは、既に2回の人間による採点を受けた3000の試験回答を使用して訓練されました。また、AIシステムが混乱する回答(俗語の使用や非英語の回答など)や、コンピュータによる採点結果の四分の一は人間によって再採点されるなどの安全策が導入されています。
一部の教育者は、このシステムの導入に懐疑的です。たとえば、Lewisville Independent School DistrictのスーパーインテンデントであるLori Rappは、2023年12月に自動採点システムが限定的に使用された際に、構成型の回答がゼロ点を受けるケースが「劇的に増加した」と述べています。
TEAは、この新しい採点エンジンが閉じたシステムであり、データをプログラミングさせる進化的な学習アルゴリズムを使用するコンピュータとしてのAIとは根本的に異なると強調しています。AIエッセイ採点エンジンは新しいものではありませんが、TEAは以前のものとは異なる評判を避けたいと考えています。
【ニュース解説】
テキサス州では、教育評価の一環として実施される州が定める試験の採点プロセスに大きな変化が起こっています。具体的には、人間の採点者に代わって、自然言語処理技術を活用した「自動採点エンジン」が導入されることになりました。この技術は、人間が書いたテキストを理解し、適切な評価を下すことができるとされています。この変更により、テキサス教育庁(TEA)は年間1500万ドルから2000万ドルのコスト削減を見込んでいます。
この新しい採点システムは、特に開放型の質問に対する採点に焦点を当てています。開放型の質問は、生徒が自由に回答を記述する形式で、これまでの選択式の問題よりも採点に時間がかかるという課題がありました。新システムの導入により、採点プロセスの効率化が期待されています。
しかし、このシステムの導入には懐疑的な声も存在します。一部の教育者は、自動採点システムが導入された際に、生徒の回答が適切に評価されない事例が増加したと報告しています。これは、AIが俗語や非英語の回答を正確に理解できない場合や、問題の意図を完全に把握できない場合に発生する可能性があります。
TEAは、この新しい採点エンジンがAIとは異なる「閉じたシステム」であると強調しています。これは、AIが一般に持つ自己学習能力やデータに基づくプログラミング能力とは異なり、特定のルールに基づいて設計されたシステムであることを意味します。この区別は、AIが学校の課題や宿題での不正行為に使われる事例が増えている中で、教育現場でのAI技術の適切な使用を促すためのものと考えられます。
この技術の導入は、教育評価の未来における大きな転換点となる可能性があります。効率化とコスト削減のメリットがある一方で、AIによる採点が生徒の学習成果を正確に反映できるか、教育の質を維持できるかという点については、今後も慎重な検討が必要です。また、この技術の導入が教育現場におけるAI技術の受容にどのような影響を与えるか、長期的な視点からも注目されています。
from Texas is replacing thousands of human exam graders with AI.