人工智慧影像辨識競賽 臺科大陳奕嘉在場景文字檢測奪冠

教育部辦理人工智慧競賽,臺科大學生陳奕嘉在場景文字檢測項目奪冠。(臺科大提供/林志成臺北傳真)

人工智慧的影像辨識的應用相當廣,臺科大資工所學生陳奕嘉在教育部全國大專院校人工智慧競賽中(2021 AI CUP)獲得兩項佳績,於繁體中文場景文字辨識競賽奪冠,也在水稻無人機全綵影像植株位置自動標註與應用競賽獲得亞軍,共得16萬獎金。

教育部全國大專校院人工智慧競賽 着重「標註暨競賽」,透過目標明確競賽題目,訓練學生解決明確目標的問題。今年特別以招牌繁體中文字辨識、水稻無人機全綵影像植株位置自動標註以及醫病決策預判與問答爲主題,讓學生有實際解決AI問題的經驗與能力。

現實生活中各式各樣的招牌、路牌、看板、標語與廣告等,其中包含的文字內容提供了許多場景重要資訊,若能自動地將場景畫面中的文字辨識出來,對場景理解、智慧城市、交通發展、機器人技術、自動駕駛、協助視障者或外來旅者等應用都能有所幫助。

獲獎的陳奕嘉表示,繁體中文場景文字辨識競賽,主辦單位提供幾千張訓練資料,涵蓋臺灣街頭各種景象,最困難的是場景和環境比較複雜,調整需要花較多時間,在這個比賽中,他試了許多不同方式,最後選擇使用了Box Discretization Network (BDN) 技術,也花了不少時間微調來成功增加電腦判斷的準確度,才成功將場景的文字辨識出來。

另一這競賽主題則是水稻無人機全綵影像植株位置自動標註與應用競賽,以無人機拍攝水稻田數個時期高解析度影像,來進行水稻植株位置辨識,像是以計算植株密度以進行水稻產量評估,也可推估作物生育期或產期,或未來可應用在無人機定點少量噴灑植物等,未來期望能以人工智慧建立水稻田植株辨識模組,以提升臺灣未來農業發展。

陳奕嘉說,水稻田並不是很清楚,直接從圖片找到點較爲困難,因此用顏色越亮的方式來標註水稻標記的位置,來增加準確度。相較於場景文字辨識競賽,有較多的先前的研究,比較容易從網路上找到資料,水稻辨識則是相對冷門很多的問題,得自己想方法從頭開始訓練。