この秋、高校や大学に戻る教師は、学生の答案採点作業がこれまでに比べてはるかに楽になったことに気づきます。
カリフォルニア大学バークレー校の1人の教授と3人の元大学院生は、解答を分類して、一括して採点できるようにする人工知能技術の最終仕上げを行っています。
今秋の発表を控えて、現在ベータ・テストを終了しようとしているこの人工知能駆動型の機能は、Gradescopeのオンライン答案採点アプリケーションの最新機能です。チームは2年前に、カンニング防止を1つの目的とするこのアプリを会社として創設しました。答案の採点をデジタル記録にすることで、答案を改ざんしたり、採点が誤っていると主張したりすることが難しくなります。
様々な大学の講座で出題されるおよそ10万項目の質問に対する1,000万の解答サンプルを蓄積することで、Gradescopeは採点プロセスをすでに50%短縮しました。これは、使いやすいインターフェースと並行して答案採点を行う複数のティーチング・アシスタント機能のおかげです。
Gradescopeの共同創設者で、2014年にコンピュータ・サイエンス博士課程を修了したセルゲイ・カラーエフ氏(Sergey Karayev)は、人工知能を採用することで採点時間は最大90%削減される見込みだと述べています。共同創設者の1人であり、博士号を持つアルジュン・シング氏(Arjun Singh)は、GradescopeのCEOを務めています。
高い反復性
人工知能は、答案の採点に直接使われているわけではありません。人工知能は、解答を識別して分類し、バッチとして処理することを学習することにより、答案採点を自動化し、反復性の高いエクササイズに転換します。
教師はフォト・マネージャに似たインターフェースを使って、自動的に提示された解答群が正しいことを確認し、各解答に解説を添えて採点します。このようにユーザからのインプットが人工知能の将来の予測能力を継続的に向上させます。
カラーエフ氏は次のように述べています。「従来は、100人の学生に試験を行い、全員が正解を書いた場合、教員は100人の解答すべてに目を通して正解のマークを記入しなければなりませんでした。人工知能がサポートする採点では、1つの解答を採点すれば、それを100人の学生全員の解答に応用することができます。」
カラーエフ氏は人工知能の機能は3つの課題に対処することを目指していると述べています。1つは、多項選択式問題、空欄を埋める問題、記述式問題など、質問の種類を特定すること、2つ目は学生が多項式の選択肢を線で消して別の解答を選ぶときなど、記入したマークを識別すること、そして最後におそらく3つの中で最も難しいのは、手書きの記述を認識することです。
最後の課題は、カラーエフ氏が指摘するように「有効な手書き認識エンジンがない」ため、Tesla K40とGeForce GTX 980 Ti GPUを使って、画像を取り込み、単語を出力するよう教え込んだリカレント・ニューラル・ネットワークを必要としました。
時間節約を実現するチーム: Gradscopoeの創設者は教育者が称賛する機能を提供
GPUと人工知能の強力な組み合わせ
GPU駆動の人工知能アプローチは、最初の結果で高い有効性が実証されました。Gradescopeの共同創設者で、カルフォルニア大学バークレー校人工知能研究室の電気工学およびコンピュータ・サイエンス担当、ピーター・アビール(Pieter Abbeel)准教授は、同社サイトに6月に掲載したブログの中で、600人以上の学生に行ったコンピュータ・サイエンスの期末試験でGradescopeの人工知能駆動型答案採点機能の初期バージョンを使用したと述べています。この初期バージョンは採点時間を75%短縮しました。
このような時間の節約は、答案採点の負担に苦しむ教育者に歓迎されると思われます。
アビール准教授は次のように記しています。「答案採点は極めて重要ですが、残念ながら教育者にとって面白みのない責務の1つです。人工知能の助けを借りずに公平かつ一貫した採点を行うには非常に多くの時間が必要です。」
チームは今後、特に化学と工学の複雑な図形の分類と採点に、手書きの認識に使用されている機械学習のアプローチを応用しようと考えています。この機能は、全世界の研究者がGPUを使って写真の中の人、動物、その他のモノの識別をモデルに教え込む様々な研究をもとに構築されます。
カラーエフ氏はこう述べています。「ダルメシアンの画像を認識し、それをビーグル犬の画像と識別できるネットワークがあります。これは人が描く図形に対する場合と同じ種類の機能です。」
以下のビデオでGradescopeの実際の機能をご覧になり、コメント欄にご意見をお寄せください。