Manus的三個啓示
Manus成爲AI頂流,似乎只用了一個晚上,另加一場不那麼正式的發佈會。一個邀請碼在某魚已經炒到了5萬。不用想,現在最慌的有兩批人——投資人,以及大廠。
Manus神奇在何處,是虛火炒作,還是貨真價實?
01 它可以做什麼?
它可以全自主完成一個針對特斯拉的財報分析報告,也可以幫你生成一個完全可以正常交互的網站,甚至可以做一款可以直接上手玩的RPG遊戲——它可以搭建開發環境,自行寫代碼,自己debug,自行編譯。
如果你想做一個地區人口調研報告,Manus還可以自己訪問數據庫和自己搜索決定該用什麼數據來完成。
Manus幾乎可以通過一個prompt來完成一個複雜的分析項目。官網顯示,在AI agent的評測標準GAIA benchmark基準下,其表現更是高於OpenAI的 DeepSearch。
筆者分析了用戶在推特和國內社媒上發佈的使用案例,從執行過程來看,完全比肩DeepSearch,每個流程的執行代碼、產出文件都完全可見,分門別類整理好等待用戶檢閱。就特斯拉和英偉達的財報分析和估值結果來看,不遜色於雪球各種大V。
筆者覺得其中最爲驚豔之處是,Manus通過自己搭建的虛擬電腦來執行數據獲取、計算、開發環境搭建和測試等一系列硬核環節,這幾乎將用戶從複雜的基礎工作中解放出來,一個新人完全可以零幀起手進入工作。
02 背後的團隊
Manus引發如此大的聲量,除了其超高質量的產出,作爲土生土長的國內團隊作品也是引燃社媒聲量的一個引線。AI領域,國內團隊的步伐和美國集結了全球人才的夢之隊相比,似乎並沒有落後。
我們瞭解到,Manus是國內AI創業團隊Monica AI的另一產品。Monica AI是一款AI chatbot產品,不同於國外處於原生狀態的chatbot,Monica AI 並非僅僅提供一個模型使用入口,而是通過提供大量垂直向可以直接使用的API接口,用戶不需要擔心prompt調優,上手即可使用。
創始人肖宏在這樣一款模式簡單的chatbot產品上,已經意識到了大模型和用戶之間交互方式的侷限性。即,模型是優秀的和具備一定“超能力”,可以在一系列陰道調教下,完成一個複雜的項目。
但由於chatbot直接將用戶和大模型對接上,使得要完成某個任務的用戶,只能分批次將任務通過1v1對話讓模型分步驟產出。甚至,用戶可能都無法確認輸入給模型的token是否是這個任務最優的方案。
Manus讓人們繼續在對話框中,一步到位解決更復雜需要更高智能的任務了。站在這個角度考慮,Manus似乎更像是一個多個經過規劃後的AI 任務集合。
團隊刻意忽略顯示大模型神奇之處,轉而站在用戶角度,思考如何通過發揮模型的優勢來完成日常任務。這是務實又珍貴的探索。
Manus的故事。讓人們看到了連續創業者對用戶需求的精準把握能力和團隊的超強執行力。至於AI所需要的團隊技術實力如何,我們稍後再講。
03 產品的亮點
通過接近Manus團隊的自媒體《賽博禪心》的文章透露,單條任務的成本在2美金左右是Deep Search的1/10。基於Claude 3.7 Sonet和國內的Qwen模型基礎上,增加了自己的訓練過程,這點是毋庸置疑的,創始人在播客訪談中透露,即使在做Monica的時候,他們也並不是僅僅作爲prompt中轉站,直接將用戶的需求扔給模型,而是增加了產品調優過程的。
就像一個天賦異稟骨骼清奇的練武奇才,需要經過後天的努力才能成爲笑傲江湖。
Manus 任務自主規劃、思考和完成能力來自其混合模型的架構。基於claude 和Qwen,並非任務的某一個環節基於claude,另一個環節基於Qwen,manus打破了模型的“結界”,讓每個模型完成自己擅長的任務環節。
多個大模型混合+manus虛擬雲端執行環境,實現了讓用戶只需要一次性敲鍵盤就可以完成往常chatbot多輪對話都未必能完成的複雜需求。
關於Mmanus執行過程的猜測:
《賽博禪心》在其文章中提到的“工程驅動創新”一詞,猜測Manus的任務執行過程中,運用了大量工程手段加模型能力來完成任務。結合多個社媒的案例分享,我們對manus的運行機制做了簡單猜測。
通過大模型(這一步猜測是Qwen)對於輸入進行分析後,首先確定任務類型,manus內部對於輸入應該有一個類目劃分,如編程任務、多模態內容生成、任務規劃類、建議諮詢類等等。其次,如輸入語言是英文,猜測可能任務執行也以Claude爲主。
具體到任務執行層面,猜測過程如下:
1.接收到一個輸入後,大模型會首先進行任務分類,決定後續任務執行的模型選擇;
2.之後大模型將輸入拆解成多個帶有層級關係、優先級和執行順序的子任務;
3.按序執行以後,上級任務的輸出,成爲下個任務的輸入;
4.多個任務產出合併成一個最終分析結果。
對於每個子節點選擇什麼模型來執行,我們猜測,如果是編程任務後面執行以Claude爲主,如果是中文決策建議類就以Qwen爲主;根據子節點的任務複雜度,執行過程中單一任務甚至可能是Qwen和Claude混合,然後再用模型進行效果對比,最終選擇保留效果最佳的一個。
從上述的分析可見,初始需求的輸入質量決定了後續的任務類型判斷,以及子節點規劃和執行效率,所以manus對於輸入的質量要求很高,通常需要用戶詳細和完整的描述需求內容(越詳細越好)。
這可能會成爲Manus被詬病的一點,畢竟一個輸入的執行是漫長的,如果僅僅因爲描述不夠清晰詳細而導致時間和算力的浪費,會嚴重影響產品體驗,屬於產品的不成熟,相信未來團隊會改善這一點,畢竟一次任務執行就要花費一杯奶茶錢呢。
04 當前的問題
從2022年到2025年,經歷了三年多的大模型風口一輪輪的認知衝擊。人們對於大模型產品的使用體驗,已經基本走過了“AHA Moment”決定產品去留的階段。一個大模型產品,在效果驚人的基礎上,還必須要穩定、要快,才能長久抓住用戶。
效果穩定性
回頭看manus,鑑於我們的Manus賬號尚在wishlist,從推特和國內社媒的使用者反饋來看,略不同於DeepSeek的衆人交口稱讚,用戶對Mansu的產出穩定性很不樂觀,甚至有不少弄錯事實,讓人啼笑皆非的環節。
如果執行中一個任務的數據或者事實用錯了,就會導致最終產出變得不可信,從而浪費這2美元的成本。
算力
除了效果不穩定,單任務執行時間過長也是被詬病了另一個點,儘管Manus已經展示出了其任務執行邏輯和過程,但留給用戶的仍然有漫長的等待,一個用戶發推說,自己的任務執行了4-5個小時。
這背後是團隊對使用量的低谷,以及Manus本身架構無法產生的大量算力需求。除以意外,用戶已經被各大模型養刁了口味,習慣了分分鐘出結果的體驗,對於長達數小時的等待自然無法容忍。
其實,Manus如果能給用戶一個可預見的完成時間,也許可以減少等待的焦慮。畢竟對於一個複雜的分析任務,即使執行時間長達2-3個小時甚至半天的時間,恐怕也比現實中初級員工要快的多。
技術能力
如果說,算力可以通過加卡來完成,那麼團隊技術能力可能短時間很難補齊。且不去對比DeepSeek那樣的夢之隊,Manus的技術儲備可能更適合做一款日活百萬級左右的用戶端產品。連續創業者出身的團隊可能優勢更在於需求發現,並在短時間內手搓出一個可以上線使用的產品,但用戶量大了怎麼辦?需要技術升級是怎麼辦,這些都是需要長時間解決的問題。當前Mansu的用戶吐槽套殼和運行速度太慢,任務卡頓就是這個問題的外在體現(團隊的道歉信中我們也看到他們沒想到這款產品這麼出圈)。
Manus有了一個優秀的起步基礎,有善於發現和抓住用戶需求的創始團隊來把我研發方向,但還需要更多AI人才來讓manus成長的更快更穩定。畢竟目前的產品現狀,內行人使用幾次之後就能大概瞭解產品架構,被大廠拷貝一個出來是沒什麼難度的。
05 Manus初步證明AI Agent的另一條路
市面上的Agent產品有2個方向,通用型和垂直應用型。前者中知名度最高的2個產品,是來自2個大模型廠商OpenAI的"Operator"和Anthropic 推出的 “Computer Use”。這個方向可以說是通用型Agent的代表。
Anthropic的Agent軟件是通過一個特殊的API,開發者可以知道Claude 模型來完成各種計算機基本的輸入、打開文件等基本操作任務;OpenAI則是在此技術上擴大硬件調用範圍允許通過API接口,在個人電腦上完成編程、預定旅行和購物等操作。國內智譜的AutoGLM在運行模式上類似OpenAI的"Operator"。
垂直Agent,典型代表爲cursor和devin。這兩款agent產品在程序員中口碑很好,但遺憾的是應用領域窄很難推開來。Manus創始人肖宏在一則訪談中也表達了垂直和通用相比,顯然後者更具有普 世價值,但前者更快走入了應用。從實際情況看,我們周圍不少程序員朋友在用cursor編寫基礎代碼了。
Manus定位爲一款通用型AI agent。通過工程手段實現Agent架構創新,將複雜的工作流程封裝在一個雲環境上,融合多個大模型,通過任務規劃來自動完成子節點需求處理,產出的是一個往常需要經過多輪人機對話才能完成的複雜任務。
Manus達到了在部分任務上超越OpenAI DeepSearch的效果,代表了Agent的另一條可以選擇的路。
通用型agent產品,不可能依靠單一大模型實現,並且天然就是第三方開發者的使命。
畢竟OpenAI和Anthropic的agent,幾乎不太可能通過競對的模型來實現,這就決定了他們的產品研發進度和工程手段無法和第三方相比。
同時Manus的應用範圍相比通用型產品更加落地,相比垂直型有更廣闊的應用領域。通用型agent所宣傳的幫助用戶購票、規劃形成以及電商購物的一系列操作,用戶自己操作也毫無門檻。但完成一個特斯拉財報分析報告,就需要很高的門檻了。通常有門檻的產品,其商業價值就更高。
互聯網界一直將AI Agent和通用型AGI鎖定起來,但Manus的出現告訴人們,即使尚未達到AGI,但 who cares,對普通用戶來說能完成任務的同志纔是好同志。
06 三重啓示
一,有了AI助力,更需要獨立決策能力。
即使今天和不遠的明天Manus仍不能變成廣泛使用的agent產品,我們也能從不斷涌現的類似產品中明白看到一個核心問題,即獨立思考和創新能力未來會是一個人的核心能力。
AI的確能幫人們做很多事,幫你分析實驗結果、做實驗報告,幫你完成案頭材料撰寫等等,但AI不會幫你做實驗,AI不會幫你想一個分析該從哪個點切入才能讓結果看起來更有亮點。我們毫不懷疑在AI的介入下,人和人的差距會越來越大。
二、第一手消息更換了來源。
上個互聯網風口2010年前後,扮演攪動風雲角色的是各大科技媒體,除了四大傳統互聯網門戶網站外,垂直領域科技媒體也起了舉足輕重的作用。AI風口前,創業企業新的動向往往來自自媒體、而後經過社媒發酵,再被全民皆知。
“古典”時代,只要和記者保持溝通就不會錯過重要行業動態,但來到AI時代,投資人經常陷於被動,對突然冒出來的科技新秀一無所知。不少風投機構通過設立孵化器來自己培養創業企業,但概率不理想,也很少有爆品產生。如何在一個社媒發酵模式下,抓住潛在甚至冒尖的機會,是機構面臨的新課題。
三、大廠怎麼辦。
DeepSeek一枝獨秀的模型效果加開源殺手鐗,將字節、騰訊、百度等大廠從技術潮頭絀落。Manus又邁出了通用型agent走進現實的第一步,又領先了大廠。這裡我們都不敢將Manus的研發成本和大廠成本作對比,恐怕屆時將是對大廠的羞辱。Agent,跟還是不跟?