新算法讓衆多申請人獲公平候選名單

康奈爾大學的研究人員研發出了一種更爲公平的辦法,以便在信息匱乏致使難以抉擇的情形下,從衆多申請人當中選出頂尖的候選人。

儘管人類依舊做出衆多高風險的決策,比如誰能獲得工作、被大學錄取或者獲得臨牀試驗的名額,但是人工智能(AI)模型正越來越多地被用於把申請人縮減到便於管理的候選名單裡。

傳統方法常常給這些候選人較低的名次,並非由於算法認定他們不合格,而僅僅是由於缺少信息。此問題被稱作“不同的不確定性”。

“不同的不確定性現象相當常見,也是不公平的一個源頭,尤其是在排名方面,”計算機科學領域的博士生裡查·拉斯托吉(Richa Rastogi)說道。

要是這個其他組的人甚至都未進入候選名單,那麼人類決策者就沒法意識到他們是合格的。

拉斯特吉於 10 月 29 日在墨西哥聖路易斯波託西舉行的算法、機制和優化中的公平性與獲取 ACM 會議(EAAMO'24)上展示了此項工作。該論文發表在arXiv預印本服務器上。

在新論文中,拉斯特吉和資深作者托爾斯滕·約阿希姆斯(Thorsten Joachims),計算機科學和信息科學的雅各布·古爾德·舒爾曼教授,想出了一種用以量化排名算法在忽略低信息組中的合格人員時所產生的不公平程度的方法。與信息豐富組相比,這些人承擔了大部分不公平的負擔,因爲信息豐富組的成員更有可能進入候選名單。

在各組之間平衡負擔的一種辦法是從所有申請人中隨機選取——本質上就是把這個過程變成抽獎。但拉斯特吉說,對於從大量申請人中選擇合格候選人,隨機抽獎效率不高。

相反,她開發了一種名爲平等機會排名(EOR)的排名算法,該算法能讓不公平的負擔在兩組之間更均勻地分散,同時仍能成功選擇合格的個人。EOR 是通過從兩組中篩選出同等比例的合格候選人來運作的。

“我們發現,EOR 算法能把合格的候選人推到頂端,同時這相當於在所有組的合格候選人當中進行抽獎,”約阿希姆斯說。“令人驚訝的是,儘管 EOR 不能確切知曉誰是合格的,可它還是能做到這一點。”

通過使用不同的真實世界數據集,拉斯托吉指出,在不確定性存在差異的情況下,EOR 比現有的排名算法更公平。

在一個示例中,她模擬了尋找可能有資格獲取某種福利的候選人這一問題。

藉助來自超過 125,000 人的美國人口普查信息,EOR 能夠依據人口統計和就業數據挑選出特定收入水平的個人,這種方式比其他排名方法更爲公平,不過潛在的人工智能模型對某些種族羣體存有偏見。

EOR 還有另一項應用:審覈搜索結果的公平性。拉斯托吉藉助它來評估亞馬遜是否有可能在其搜索結果中,把自己的品牌產品排在其他賣家排名更高的商品前面——這是調查記者此前提出的一項指控。

研究人員使用了由記者創建的亞馬遜購物搜索的公開可用數據集以及亞馬遜的一個樣本模型,該模型負責對網站上推薦的產品進行排名。他們發現,亞馬遜有時給自己產品的排名要高於使用 EOR 方法所得出的排名。

不過,他們提醒道,這並非能證明不公平的確鑿證據,因爲他們沒法獲取亞馬遜用來生成產品推薦的實際模型。