“沒有search就沒有research”?秘塔AI搜索收知網侵權告知函,AI搜索開始面臨細分後的煩惱

8月16日,上海秘塔網絡科技有限公司(以下簡稱秘塔AI)發佈聲明,稱收到《中國學術期刊(光盤版)》電子雜誌社有限公司(以下簡稱知網)28頁的侵權告知函。

秘塔AI表示,其“秘塔AI搜索”產品的“學術”板塊僅收錄了論文的文獻摘要和題錄,並未收錄文章內容本身,閱讀正文需通過來源鏈接跳轉至網站獲取。秘塔AI還表示,即日起,“秘塔AI搜索”將不再收錄知網文獻的題錄及摘要數據,轉而收錄其他中英文權威知識庫的文獻題錄及摘要數據。

16日下午,秘塔AI方面向《每日經濟新聞》記者表示,後續提供服務完全不受影響,已經有多家數據庫主動表示願意與其合作。

隨着AI搜索競爭打響,新入局玩家紛紛切入細分賽道尋求差異化競爭,學術搜索結果的展示此前一直是“秘塔AI搜索”的差異化競爭優勢,此番與知網的糾紛是否涉及侵權,或許將影響未來秘塔AI在學術搜索層面的佈局。

有業內人士在受訪時表示,在版權授權與合作方面,AI 搜索服務方可以結合未來的經營定位與規模,考慮與大型數據資源網站或內容版權方構建常態化合作關係,通過合作協議獲取完整的授權許可,以企業技術優勢獲得合作優惠,共享收益,從根源上更好地解決侵權問題。

業內:侵權與否要看這些因素

據秘塔AI發佈的文章,知網方面表示,發現秘塔AI通過“秘塔AI搜索”“秘塔AI搜索App”向用戶提供知網的學術文獻題錄及摘要數據,且數量巨大。知網方面認爲,此行爲未經知網許可,嚴重侵犯知網合法權益,並表示不希望中國知網被秘塔科技搜索到,要求秘塔AI立即斷開搜索結果到知網網站的鏈接。

秘塔AI則在聲明中表示,依照學術規範,文獻的摘要和題錄應具有獨立性和自明性,能夠使讀者不閱讀全文就能獲得必要的信息。“秘塔AI搜索”的“學術”版塊僅收錄了論文的文獻摘要和題錄,並未收錄文章內容本身,閱讀正文需通過來源鏈接跳轉至網站獲取。

“沒有search,就沒有research。‘知識發現’是知識傳播鏈路上的第一步。”秘塔AI稱,即日起,“秘塔AI搜索”將不再收錄知網文獻的題錄及摘要數據,轉而收錄其他中英文權威知識庫的文獻題錄及摘要數據。

8月16日,《每日經濟新聞》記者打開秘塔搜索發現,在“秘塔AI搜索”網頁端,增加了上述聲明的跳轉鏈接,記者使用“秘塔AI搜索”,發現其參考文獻中已未展示知網鏈接,大部分鏈接指向其他國內外網站。

16日下午,秘塔AI方面在微信上向《每日經濟新聞》記者回復表示,後續提供服務完全不受影響,已經有多家數據庫主動表示願意和秘塔合作。

對於秘塔AI是否構成侵權,北京瀛和律師事務所高級合夥人、國際數據管理協會DAMA中國專家成員陳雙在接受《每日經濟新聞》記者採訪時表示,知網主張的秘塔AI搜索侵犯行爲是否成立,首先要判斷知網對於其主張的數據資源是否享有權利、享有什麼權利以及秘塔AI對於數據資源的使用行爲是否具備不正當性從而構成侵權。

陳雙認爲,通常文獻摘要的版權屬於論文作者,如果知網通過版權協議實際上獲得了版權方的完整授權,即不僅有權收錄,還有權將文獻對外授權使用、代爲起訴維權等完整權利,類似“文獻管理人”角色,則AI搜索產品直接照搬展示給用戶的方式可能侵犯了信息網絡傳播權。而題錄數據通常包含題目、作者、文獻出處、文獻時間等,一般不構成作品。但如果知網能夠提出對其主張的文獻摘要和題錄數據庫的著作權登記憑證,或有證據證明其對這些數據整理、編排、生成過程中付出了獨創性勞動投入的證據,並非對各種要素的簡單堆砌、照單全收,則存在能夠向秘塔AI主張享有該數據資源財產性權益的可能性。

此外,陳雙還談道,通常AI搜索產品的底層主要還是採用爬蟲技術。對於AI搜索產品“爬取”數據行爲是否具備正當性,除了要判定爬取數據的來源、內容合規性外,還要結合其是否遵守了被爬網站的爬蟲協議、用戶協議、平臺規則,是否有采取突破或繞開網站反爬技術措施,使用和展示方式是否對被爬取網站構成實質性替代等實際情況來判定。同時,從公共利益的角度看,法院也會考慮數據權益保護邊界與學術資源共享流通間的平衡來綜合判定。

建議搜索服務提供者與大型數據資源網站等合作

據秘塔AI,公司成立於2018年4月,專注人工智能領域。

今年 3 月, “秘塔 AI 搜索”上線。8月初,有媒體報道稱,秘塔AI近期完成了超 1 億元人民幣的新一輪融資,由螞蟻集團領投、光速光合跟投,本輪投後估值達 1.5 億美元

近期,OpenAI官宣加入AI搜索領域,這讓本就擁擠的AI搜索賽道越發熱鬧。在國外,有微軟必應搜索(Bing)、谷歌AI Overviews這樣的老牌公司,以及Perplexity等新興AI搜索公司持續加碼AI搜索。在國內,秘塔AI、崑崙萬維等闖入搜索市場,傳統搜索巨頭百度和“搜索新人”夸克等也在各自產品中加入了AI功能。

隨着AI搜索市場的競爭日趨激烈,衆多玩家開始在細分賽道尋求差異化優勢。7月26日,用戶體驗專家、專欄作者杜昭在接受《每日經濟新聞》記者採訪時曾表示,搜索引擎在數據資源、模型能力、索引庫等方面的能力,新進入者很難突破,需要巨大成本。因此,不同AI搜索產品的差異化可能體現在細分領域,通用搜索比較難做差異化。

不過,隨着秘塔AI收到知網侵權告知函,未來AI搜索玩家也需要開始思考如何應對可能的侵權風險。

對此,陳雙表示,國內類似於秘塔AI的服務提供商在提供生成式檢索服務時,應滿足《生成式人工智能服務管理暫行辦法》的合規要求。根據《生成式人工智能服務管理暫行辦法》第七條規定,人工智能服務提供者“應當依法開展預訓練、優化訓練等訓練數據處理活動”,遵守“涉及知識產權的,不得侵害他人依法享有的知識產權”等規定。

陳雙建議,應當規範爬蟲技術手段與程序,遵守被爬取網站的爬蟲協議及規則,避免繞開任何網頁技術限制或違反網站robots協議爬取數據,事前評估對網絡服務的性能、功能可能帶來的影響,避免干擾被爬網站網絡服務的正常功能或妨礙計算機信息系統正常運行。針對大型資源平臺類似的數據訓練,構建內容審覈機制,制定“技術手段+人工輔助”的內部審覈流程,如審覈平臺用戶協議/平臺規則,確認被爬平臺對數據權利的狀態。

此外,陳雙還提到,平臺應當設置合理的使用限制。對於受版權保護的學術資源,平臺應在用戶協議中設置合理的使用限制,如禁止或限制用戶將相關搜索結果鏈接複製、分發或用於商業目的。在版權授權與合作方面,類似秘塔AI的服務提供者,可以結合未來的經營定位與規模,考慮與大型數據資源網站或內容版權方構建常態化合作關係,通過合作協議獲取完整的授權許可,以企業技術優勢獲得合作優惠,共享收益,從根源上更好地解決侵權問題。針對用戶或權利主體投訴事項實現快速審覈和響應處理,如確屬於侵權,及時下架相關侵權內容。