在線教育題庫系統的設計心得

一、前言

題庫對於在線教育從業者來說都不陌生,可以說題庫是在線教育的核心,各大教育公司對於題庫的重視不言而喻。

但是題庫的後臺設計對於很多人又很頭疼,沒有現成的系統可以借鑑,題庫的各個層級關係梳理不清,試題試卷入庫和維護,試題數據結構等都是題庫設計中的重點問題。

本文將從題庫的各個層級展開介紹這些問題的解決方案和個人看法。

二、題庫的架構

題庫的三層架構:基礎屬性層,基礎資源層和資源業務層。不僅僅是題庫,如果把資源類型進行擴充,這樣的架構同樣也適用於其它資源類型。

梳理清楚這三層結構可以對題庫整體有一定的感知,就像人體的骨骼一樣,結構清晰且方便掌握各個功能的設計方向。

資源業務層的上一層還可以加上資源應用層,指的是資源需要應用到哪些終端,比如APP、小程序、web等,這樣的設計思路其實是參照中臺思想將題庫打造成成內容中臺的規劃。

三、基礎屬性層

基礎屬性包含了資源的所有的屬性,比如學科、章節、知識點和難易度等。屬性的管理維護是否要做到窮盡?對於通用性且有拓展性需求的屬性,是需要進行屬性管理,但是當某些資源的屬性並不具備上述兩種特性時,對屬性進行單獨管理維護性價比就不高了。

知識點對於題庫來說是核心中的核心。各種類型的資源之間是以知識點進行關聯的,資源關聯上知識點之後便可以進行基於知識點的推薦邏輯,現在市面上各種AI智能推薦都是以知識點爲基礎進行的。

屬性的維護以知識點和章節的關聯爲重點(我之前從事的是初中階段的在線教育,教材同步是當時的強需求,應用端推薦的內容不能超過教師的教學進度,這就需要資源具有知識點和章節兩個屬性)。

在章節和知識點的關聯這個問題上,我之前也走過一些彎路,具體的思路是每個資源都打上知識點和章節的標籤,教研老師每錄一道題或者上傳一節課都需要打上知識點和章節的標籤,針對初中階段一道試題可能會涉及很多版本教材的章節,那麼章節的人工關聯工作量是可想而知的,這樣的方式效率低,還容易出錯。

其實針對數理化這類理科學科來說,教材的章節與知識點是有着強一對一關聯關係的,可以提前在題庫系統中將這些學科的章節與知識點進行關聯,上傳的每個資源只需要打上知識點標籤後,系統便會自動關聯上章節屬性。針對英語,語文等文科性質的學科,章節和知識點沒有強關聯關係,目前的打標籤方式還是兩者都需要進行。

至於智能打標籤,也有一些頭部的教育公司在嘗試,但是效果都不太好。在這裡還是希望行業內的從業人員們可以在這方面進行技術突破,這也將是整個教育行業的福報。

四、基礎資源層 1. 試題入庫

資源層的重難點其實就是試題入庫,如何高效的將試題錄入題庫是關鍵。試題入庫的方式分爲:人工錄入和系統識別,而系統識別目前最多的是Excel和Word識別。

人工錄入其實就是將試題複製粘貼到題庫系統,試題自身也是有結構的,它包括題幹、選項、小題、答案、解析等,如果要錄入一道英語完型填空的試題,僅錄入花費的時間就很長。

Excel的系統識別其實本質還是人工錄入的邏輯,只是它可以做到批量,但是理科的公式問題無法解決,錄題效率仍不高。

Word識別的方式目前已經有部分公司在嘗試研究,它是通過在Word中添加特徵的方式進行規則識別,既可以解決公式錄入的問題,也極大的提高了錄題的效率。

Word自動識別包括了格式轉換,XML解析,公式解析並轉換成LaTeX,這塊後面會專門出一篇文章詳細說明。

2. 數據格式

試題入庫之後接下來就是如何維護,數據應該以什麼格式進行存儲,什麼樣的格式更便於前端的顯示。針對文科這些無公式的學科,其實直接以HTML格式存儲就可以了。但是數學等有大量公式的學科,由於HTML對於公式其實兼容性很差,以LaTeX格式儲存是個好方法。

LaTeX是一種基於TEX的排版系統,對於生成複雜表格和數學公式方面兼容性很好。寫過科技類的論文的同學們應該都接觸過LaTeX,對於複雜公式和表格的處理應該深有體會。在這裡就不多做更多的介紹了。

將Word文件進行文檔格式轉換成XML並進行特徵解析,公式識別則調用第三方軟件Mathpix(一款公式識別神器),解析完成後將數據轉換成LaTeX格式並進行儲存。

同時也可以基於LaTeX格式再轉換HTML格式進行儲存,這樣的處理是提前在庫裡準備好HTML格式可以直接在前端展示(LaTeX不可以直接在前端展示),防止用戶請求的時候再進行轉換,響應時間過長。

3. 題型類型

不同學段所包含的題型可能不盡相同,不同題型的試題在後臺的維護和前端的展示也不相同。

以初中學段來說,初中所涉及的學科多且全國各地市的教材版本也不相同,目前已知的題型就有100多種。題庫的設計不可能對這100多種題型出100多種題目錄入模板(開發量大,無擴展性),所以要針對這麼多題型進行歸類,把相同結構的題型歸爲一類。

這樣處理的好處是,不論是否有新的題型對於系統來說只要把它歸爲已有的類型中就可以兼容。在這裡我們將題型分爲:選擇型,簡答型和綜合型。

五、結語

題庫的設計一定是建立在對業務和用戶足夠熟悉的基礎上的,如果不熟悉業務,設計就會變得層級混亂,結構不清晰,看見什麼就做成什麼樣子。

只有熟悉業務,熟悉教研,才能反推系統應該如何設計,如何能夠做到高擴展性和複用性。題庫的用戶其實就是教研老師,多和老師們溝通,多瞭解他們工作的業務流程,最好能夠親身感受下他們的工作,這樣就可以很快掌握到題庫的優化方向。

以上就是我在題庫設計中總結的幾點心得,希望能夠給到更多題庫設計者們一點啓發,也希望大家能夠指出問題,給出建議!

本文由 @一條酸奶中的 原創發佈於人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議