☰

Google 釋出新的機器學習API，開放識別影片中的圖像

在以往的應用當中，使用者僅能夠過在網站上輸入關鍵字，搜尋文字，這包括文章中的文字，或甚至是相關的圖片，而在未來這項應用，將擴大到影片的識別。未來人們可望透過第三方應用程式，用關鍵字直接搜尋影片當中的資訊。

就在稍早，Google 在舊金山舉辦的雲端應用大會「Cloud Next」當中，發表新的機器學習API(稱爲Google Cloud Video Intelligence API)，讓開發者得以標記影片當中的場景變化，利用 TensorFlow 框架量身訂做機器學習模組的工具，藉此自動提取影片當中的實體影像，讓用戶可以在應用程式當中用關鍵字搜尋影片當中的資訊，而且搜尋結果會越來越準確。

舉例來說，未來只要在網站當中搜尋「臘腸犬」，那麼除了圖片跟文字，系統還會跳出內容有臘腸犬的相關影片出來。現場展示的是在搜尋引擎當中輸入棒球、海灘等關鍵字，那麼系統可以分別釋出影片當中有棒球、球賽，或是海灘的搜尋結果。

▲搜尋「棒球」，就會出現內有棒球、球棒、球等相關影像的影片搜尋結果。（圖／取自YouTube）

▲搜尋「海灘」，就會出現內有海灘影像的影片搜尋結果。（圖／取自YouTube）

當然，雖然這個 API 相當好用，然而所有的影片都必須要儲存在 Google Cloud 雲端儲存服務當中，若還不熟悉這個工具的開發者，可以到官網註冊私人測試版試用。

Google 公司也公開表示，他們希望公開機器學習技術，讓更多開發者得以開發出更方便的應用，除了Google Cloud Video Intelligence API，Vision API 是另一個例子。

相關資訊