百度申請文檔圖像還原及多模態大模型訓練方法和裝置專利,可編輯文件還原文檔內容

金融界2024年10月29日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“文檔圖像還原及多模態大模型訓練方法和裝置”的專利,公開號 CN 118823798 A,申請日期爲2024年6月。

專利摘要顯示,本公開提供了文檔圖像還原及多模態大模型訓練方法和裝置,涉及計算機視覺、深度學習以及大模型等人工智能領域。其中的方法可包括:獲取待處理的目標文檔圖像;將目標文檔圖像作爲多模態大模型的輸入,得到輸出的第一文件,第一文件爲符合預定表示格式的超文本標記語言文件;根據第一文件生成作爲還原結果的第二文件,第二文件爲可編輯的文件,且第二文件中包括目標文檔圖像中的文檔內容。

本文源自:金融界

作者:情報員