每週更新一次敏感關鍵字
受此消息影響,港股AI概念股18日走低,百度跌2.40%,報89.45元港幣(下同);商湯跌2.24%,報1.31元;阿里巴巴跌1.71%,報77.04元。
綜合外媒報導,據多名涉及審查過程的人士表示,審查內容涉及批量測試大型語言模型對一系列問題的答案,其中許多問題與大陸政治敏感性,以及和習近平有關。審查還包括語言模型的訓練數據及其他安全流程。相關審查工作由大陸網信辦在全大陸各地機構進行。
杭州一間AI公司的員工表示,網信辦有一支專門團隊負責審查工作,他們進辦公室後,會坐在會議室開始審查,「我們公司的大型語言模型第一次審查不通過,原因不太清楚,公司花了幾個月時間作出調整,第二次審查才通過」。
另外,一名北京AI初創公司員工指出,該公司的基礎模型在回答問題時「十分不受約束」,所以進行安全過濾極爲重要,一開始要從用來訓練的數據中剔除有問題的資訊,並建立敏感關鍵字資料庫。大陸今年2月發佈的人工智慧企業營運指南稱,AI企業需要蒐集數千個違反「社會主義核心價值」的敏感關鍵字和問題,例如「煽動顛覆國家政權」或「破壞國家統一」。敏感關鍵字須每週更新一次。
報導稱,經審查的結果是,大多數大陸聊天機械人都會拒絕回答一些敏感話題,例如1989年6月4日發生過什麼事;另有業內人士指出,月之暗面的聊天機械人Kimi會拒絕回答大多數與習近平有關的問題。