Google 釋出新的機器學習API,開放識別影片中的圖像
在以往的應用當中,使用者僅能夠過在網站上輸入關鍵字,搜尋文字,這包括文章中的文字,或甚至是相關的圖片,而在未來這項應用,將擴大到影片的識別。未來人們可望透過第三方應用程式,用關鍵字直接搜尋影片當中的資訊。
就在稍早,Google 在舊金山舉辦的雲端應用大會「Cloud Next」當中,發表新的機器學習API(稱爲Google Cloud Video Intelligence API),讓開發者得以標記影片當中的場景變化,利用 TensorFlow 框架量身訂做機器學習模組的工具,藉此自動提取影片當中的實體影像,讓用戶可以在應用程式當中用關鍵字搜尋影片當中的資訊,而且搜尋結果會越來越準確。
舉例來說,未來只要在網站當中搜尋「臘腸犬」,那麼除了圖片跟文字,系統還會跳出內容有臘腸犬的相關影片出來。現場展示的是在搜尋引擎當中輸入棒球、海灘等關鍵字,那麼系統可以分別釋出影片當中有棒球、球賽,或是海灘的搜尋結果。
▲搜尋「棒球」,就會出現內有棒球、球棒、球等相關影像的影片搜尋結果。(圖/取自YouTube)
▲搜尋「海灘」,就會出現內有海灘影像的影片搜尋結果。(圖/取自YouTube)
當然,雖然這個 API 相當好用,然而所有的影片都必須要儲存在 Google Cloud 雲端儲存服務當中,若還不熟悉這個工具的開發者,可以到官網註冊私人測試版試用。
Google 公司也公開表示,他們希望公開機器學習技術,讓更多開發者得以開發出更方便的應用,除了Google Cloud Video Intelligence API,Vision API 是另一個例子。