精準教、高效學,“AI+教育”助力新東方“慧學”升級

2024年12月,全國碩士研究生招生考試前夕,給學生們上完培訓課後,新東方大學生學習與發展中心考研英語教師李衍葳打開“慧學系統”,開始批改作業。在AI的幫助下,一篇英語作文的批改時間從10分鐘縮短到了2分鐘,大大提升了她的工作效率。

2024年被業界視爲“AI+教育”的變革之年,人工智能與教育的深度融合達到前所未有的高度,企業紛紛加大投入,將AI大模型廣泛應用於教育服務,推動教育內容、教學方法、學習體驗全面升級。也有不少企業瞄準教師需求,針對特定場景研發推出相應產品及服務,幫助教師工作提質減負增效。

緊跟教育變革的步伐,2024年初,新東方對其考研智能學習系統“慧學系統”AI輔助批改功能進行了升級與模型調試,幫助教師提高批改效率,實現更加智能的教學。

2024年12月31日,新京報教育事業部聯合千龍智庫輿情風險評估治理中心推出《2024AI大模型賦能教師生態共建分析報告》,並基於多維度評估結果,推選出六個品牌爲“AI大模型賦能教師生態共建夥伴”,新東方考研智能學習系統“慧學系統”是其中之一。

用上萬篇英語作文訓練AI大模型

爲了提升學生學習體驗和備考效果,新東方大學生學習與發展中心於2022年在“新東方在線”APP端研發上線了考研智能學習系統“慧學系統”。2024年,“慧學系統”全新升級,在AI自生產題目和AI輔助批改等方面進行了進一步的進化迭代。

在考研備考的過程中,練習是非常重要的一環,而考研真題量少是考生備考的一個痛點。新東方建立了豐富的數字題庫,並結合歷年真題大數據及人工校驗,研發了AI大模型賦能的自生產題目系統,可以根據學科核心知識點和考查難度自動生成模擬題,爲學生練習鞏固提供更多優質資源。

AI輔助批改則是“慧學系統”的又一亮點。紙上作業經拍照後上傳至系統,先由系統進行自動批改,再經老師校準後作出反饋。教師可以有更多時間專注在試題的解析上。目前,該應用支持考研全部科目客觀題以及考研英語主觀題批改,並即將實現考研政治和考研數學的主觀題批改。

AI大模型能夠多大程度地幫助到教師教學?期間經歷哪些不斷完善、不斷進化的過程?

具體到考研英語作文AI輔助批改功能,在調試模型的過程中,新東方的研發團隊需要“喂”給模型大量的考研英語作文真題和學生寫的文章,並由20位寫作培訓師牽頭,幾百位英語老師一起,把作文的評分標準和教學中學生常犯的錯誤進行梳理,讓大模型去學習。在功能正式推廣之前,AI大模型至少經歷了上萬篇作文的訓練。在功能上線之後,教研團隊也會和研發團隊緊密配合,隨時對發現的問題進行反饋升級。“所以在最開始訓練模型的時候,就是許多一線教學老師一起參與的。”李衍葳說道。

AI大模型並非在剛出生時就完全“智能”。李衍葳介紹,“AI批改模型的語言習慣、訓練材料和國內考試教學會有一些區別。比如在考研寫作中,很多考生喜歡寫強調句。但在英語表達習慣中,強調句的使用語境較少。我們在複覈AI批改的作文時,發現學生如果寫了強調句,大模型會把它判斷爲語法錯誤,並把它改成一個比較常規的句子。這其實是一個表達習慣的問題。”

發現問題後,老師們會第一時間跟技術溝通,給AI“打上補丁”。李衍葳介紹,教研團隊和技術團隊有專門的對接羣,所有老師反饋的問題會以周爲維度進行收集。技術側響應的速度也非常快,對大模型進行快速的迭代升級。“老師們意見被重視,也會更加願意去使用大模型來輔助自己的教學。”

AI大模型助力教師減負增效

剛開始接觸AI大模型時,李衍葳只是在備課時把AI作爲信息收集整理的工具。“在新東方上線AI輔助批改功能之前,我也在市面上看到過一些能批改作文的網址,但說實話準確率都不是特別高。”

2024年初,得知要參與到新東方的AI大模型調試時,部分老師抱着半信半疑的態度。彼時,2024年研考剛剛結束,老師們手中有大量學生寫過的作文。一些老師抱着試一試的心態,把學生作文給到大模型進行批改,驚喜地發現“AI找得真的很細”。

李衍葳介紹,對於作文批改來說,大模型要做的是兩件事。第一步是識別學生手寫的作文,有些學生的字寫得不太工整,“在這個部分AI就已經給我們驚喜了,它識別的準確度相當高。”

第二步是要把錯誤都挑出來。AI的好處是它不會感到疲憊,不會走神。“當AI把作文反饋回來的時候,我們發現它不僅速度很快,而且作文裡的錯誤也都能找到。並且在進行更多的訓練和迭代之後,批改的正確率越來越高。”

不過,任何人接觸新事物都需要一個過程。AI大模型也並非在上線之初就受到所有教師的歡迎,相當一部教師仍然保留着批改紙質作業的慣性。李衍葳說,2024年春季,上述功能剛上線開放使用的時候,使用的教師相對不是那麼多。但到暑假,情況發生了明顯變化。隨着學生開始大量進行寫作練習,越來越多的教師開始嘗試用AI大模型輔助教學。

AI大模型,不僅幫助教師提升了工作效率,減輕了工作負擔,也爲他們進一步優化教學提供了量化依據。

首先,整個教學批改的過程能夠留痕。對於學生來說,學習過程變得可視化,學生可以看到自己每一次作文中那些重複出現的問題,也能看到自己寫得越來越熟練,分數越來越高。

對於老師來說,在整個系統中,老師不僅能看到自己學生寫的文章,也能看到全國各個地區學生的作文情況,有利於教師收集信息和改進教研。“當把所有的數據都做了電子化的留存後,就可以進行平行比較,瞭解學生在全國範圍內處於什麼樣的水平。”李衍葳提到。

聚焦教育場景的具體問題,讓AI大模型賦能更多教師

下一步,AI大模型能否賦能更多的教師?

李衍葳對此很有信心。“在前期研發調試的時候,我們就梳理好了規則,確保教師團隊和研發團隊的高效配合。如果需要訓練更多的學科,比如我們正在研發的考研政治和考研數學的主觀題,可能常見錯誤和難點不同,但是訓練的流程和規則是一樣的。”

新東方大學生學習與發展中心產品研發高級總監袁榮表示,目前,新東方在對於AI大模型的開發中,主攻的方向是在一個比較穩定可靠的基礎模型下,把新東方的教研教學體系和一些混合技術嫁接在模型上,來解決所要面對的教育場景的具體問題。其內核是去復刻老師教學教研的行爲,把它儘量用機器表達出來。

對於新東方即將上線的考研數學主觀題的AI輔助批改功能,袁榮表示,考研數學主觀題批改,對於目前市面上提供基礎AI服務的大模型來說是很難做到的。但是新東方在基礎AI能力的基礎上,“嫁接”教學教研體系和混合技術,基本上能保證準確率達到97%的水平,經人工校準後可實現接近100%準確率。對於學生來說,就可以實現藉助少量的老師干預得到迅速的反饋。

與此同時,新東方也着重強調,即使在“教育+AI”方面取得了顯著進步,新東方依然將提升教育內容和教師水平作爲核心追求。

在2024年12月31日,新京報教育事業部聯合千龍智庫輿情風險評估治理中心推出《2024 AI大模型賦能教師生態共建分析報告》中,中國教育技術協會學術委員會副主任劉雍潛強調,生成式人工智能是一種輔助教師教學、學生學習的方法,但不是唯一的方法,不能神化,也不要排斥,它是工具的一種,不能取代現在廣泛應用的其他智能工具。報告還指出,對於大模型生成的內容要有批判精神,學會鑑別判斷,保持學術嚴謹,加強人工審覈,以免出現大量AI生成的錯誤信源。

“系統只是工具和手段,它的作用不是替代老師,而是去幫助老師。在AI加持下,系統可以提升人的產能和時效短板,而人則可以校準系統失誤,同時有更多時間對學生提供針對性的詳盡指導。人與系統緊密協作,能夠在提升反饋時效的同時提升服務質量,幫助學生最大化提升學習效率和效果。”新東方大學生學習與發展中心在線國內事業部總經理洪喆強調。

文/徐彥琳

編輯 繆晨霞

校對 柳寶慶