大模型時代,沒有超級應用,只有超級智能,爲什麼?
在繪畫、寫文章、創作視頻之後,AGI 應用的另一大場景是:編程。
曾經大家認爲編程有很高門檻,但在 AGI 時代,它在變成人人觸手可及的技術,越來越多的 AI 編程工具,讓不會代碼的普通人也能輕鬆製作 App。
我們如何擺脫基於移動互聯網時代的想象,展開大模型時代新的可能性?未來是不是人人都能成爲 AI 程序員,創造專屬於自己的「個性化應用」?
對於這些問題,AIGCode 創始人宿文在極客公園 IF2025 創新大會上,給出了自己的答案。
宿文認爲,在 AGI 的賦能下,AGI 代碼可以把應用帶入更有「個性化」的階段,讓每個用戶可以實現自己小衆但精準的需求,小團隊也可以降低成本,快速迭代。這是宿文眼中編程的終極場景。
在宿文看來:
以下是 AIGCode 創始人宿文在極客公園 IF2025 創新大會上的現場演講實錄,由極客公園整理。
宿文在極客公園 IF2025 創新大會上進行演講|圖片來源:極客公園
從 Copilot 到 Autopilot
即將過去的 2024 年,大模型賽道引發了許多討論,AI 編程是其中一個繞不開的話題。
大家都會說程序員被大模型改造得很深刻,全世界程序員羣體有七八千萬,佔世界人口 1% 左右。這麼厲害的軟件代碼改造技術,怎麼讓其他 99% 的人使用呢?
我們可以舉一個例子,今天中午極客公園鵬總突然說這個活動辦得很好,除了線上買票、線上收費,咱們線上直播行不行?會務組小夥伴崩潰了,去哪找直播管理平臺,去哪找 SaaS,如果自己定需求,自己去做開發,至少幾個周、幾個月時間。
爲了方便大家瞭解 AIGCode 的產品 AutoCoder,我們把這個平臺給大家看一下。
AIGcode 演示界面|圖源:AGIcode
這個產品完全面向不會編程的人羣。
另外很重要的點,相比大家現在拿到的類似產品,主要圍繞前端,但是 AIGCode 能夠把後端和數據庫一體化交付給大家,能交付出一個完整的軟件工程。
做這個事的源頭,跟我上一段創業有關係。我上段創業是做軟件,有一個比較大的痛點是效率,我們經常提出一個需求,程序員要做幾周甚至幾個月,我們看到很多很好的技術棧,字節、阿里用得很好,但我們程序員用不起來,而且程序員成本很貴。
所以做軟件,怎麼做得又快又好又便宜,這是每個行業都面臨的難題,不可能在一個維度上去解決。然而大模型來了,又好又快又便宜可以實現了。
當然實現過程中,目前主要有兩類解決方案:一類就是 Copilot,就像名字一樣的,幫程序員做輔助駕駛。另外就是我們想做的 Autopilot 這樣的產品。
Copilot,目前主要還是圍繞程序員工作場景在 IDE 裡面做代碼補齊,中國沒有 IDE,甚至全球最主要的 IDE 80%、90% 的市場都在微軟手裡,作爲初創公司很難在生態裡 PK,只能繞開這個很大的生態競爭。我們在 Web 端做 IDE Free 的產品,端到端去做。我們用戶會完全不一樣,我們把用戶羣體從 1% 放大到 10%、20% 都有可能。
目前大家所用到的模型和 Copilot 產品,主模型能夠用上最好的基模,不管海外還是國內,大家都在使用 Deepseek 這種水平的基模。要把代碼鏈條優化得足夠好,核心的技術都卡在模型上,所以自研模型不會套殼,不會用 Llama 去做,我們會有自己的模型架構解決這個問題。
還有很重要一點,傳統軟件架構跟生成式軟件架構不一樣,兩大支柱做了算法和軟件架構層面的創新,這是我們兩塊主要的工作。
右面是模型上的工作,核心解決兩個點:又大又準,大的是「大上下文」,而不是後半段做 4K 窗口的串聯。另外是新的網絡結構帶來的收益,還有一塊是在軟件結構的創新。
ChatGPT 的火爆正好兩年多,我們其實站在今天這個節點來看,我們很憧憬大模型可以解決很多問題。
今天可以解決的問題主要在寫字和畫畫兩個場景,很多理科生的的問題,比如數學、編程這樣的工作還沒有解決得很好,我們遇到了很多其他問題,比如訓練成本、資金、模型本身的泛化能力、訓練效率等等。
目前網絡結構在 Transformer 往前迭代,去年上半年提出的 MOE 這種架構也在改造整個大模型,在 MOE 之後還有 MMOE 等很多技術迭代。
我們率先使用 PLE 架構,核心是我們能夠在網絡結構層讓專家或大模型,更有結構化地深度學習人類高質量樣本。至於樣本不夠用的問題,其實不會出現,因爲我們有很多高質量的樣本,像論文、代碼這些樣本還沒有被徹底學到。
爲了讓整個模型可以支撐起完整的代碼生成,模型底層還要配套很強的算法,所以我們自己去做優化,包括不同的算力平臺的整合,一體化平臺上的算力加速,我們看到的技術卡點,都解決掉了。
我們自己的模型成果,也不會拿國內任何一個軟柿子去捏,去對比,我們還是拿全球頂尖的團隊的最新版本,最大參數量去做,我們在泛化指標上,是跟主流模型基本平齊的水平。
我們會在接下來三個季度把 13B 和 33B 也發佈出來,給有模型使用能力的團隊使用。
這句話是我們公司的願景,剛剛主要解釋了上半句,Auto-coding is AGI,我們看起來在解決代碼編程的問題,但是核心問題是:能不能把端到端代替程序員寫完代碼。
Autocoding 加速「個性化」
這問題由 AGI 模型本身決定,我們發現,無論解決上下文還是網絡結構、底層優化器、算力加速等等問題,都是目前 AGI 最大的痛點,這兩個問題幾乎是等價的,AGI 和 Auto-coding 基本上同一個時間點到來。
底層邏輯有兩個:一、代碼本身就是一種高質量語言,對於模型訓練非常重要。另外,我們覺得 AGI 本身從一個新技術的出現,到兩年前的 ChatGPT 進入大衆視野,我們對它有很多憧憬,但它解決很多行業問題還不成熟,所以很多行業專家或者用戶就會罵街,說這個工具不成熟,解決不了問題。
但是對於代碼這個賽道來說,比較幸福的是:我們算法工程師,95% 都是程序員出身,因此思路上閉環很快,自己做得好不好,我們自己心裡有數。
第二點是,這樣的 Auto-coding 準備好後,解決問題時,怎麼端到端,要打到哪些需求點?
用戶體驗上的核心之處:第一個點是準確,我們所有需求,怎麼達成底層產品鏈條裡的準確率?今天使用很多 Agent 類產品,第一個生成的版本很好,但細微的需求點沒有辦法實現。
第二個點是靈活性,在一個應用的生成過程中,最重要的是要實現各種各樣個性化的要求,比如一個搜索框,能不能實現得足夠靈活,能跟所有功能邏輯串通。
第三個點是完整度,這是軟件工程上的工作,要解決工程的安全問題、部署問題。在這些工作做完後,這套方案就會變成基礎設施,程序員的工作全部用推理算力成本就可以解決。我們想去做的 Personal App(個性化應用)就可以實現。
大家看到這個場景的時候可能會說:「我們手機裡裝的都是通用應用,我要一個 Personal App 做什麼呢?」也有很多人問我:「你們要 ToB 還是 ToC?」
其實一個新的生產力工具出現時,這些問題都不重要,舉兩個很有意思的例子:
上週我去雲南某城參加一個會議,會議組織方帶我們去景區,很多人排長隊在買票,但旁邊有好幾臺自動售票的機器,我走近一看都開着機,機內裝着 Windows 系統,這時候如果有一個管理人員可以提出一個售票系統的需求,都不需要在當地找程序員,用可以在 Windows 裡部署一套售票管理軟件,排長隊買票的問題就很好解決。
另外一個例子,我跟一個朋友討論播客,我們聽播客很多都依賴於小宇宙這種播客客戶端。在美國,很多主播會在 YouTube 上有視頻播客的頻道,國內很少用視頻的方式做播客,這個朋友說我們不太想露臉,如果有一個卡通形象體出鏡,去做視頻播客,主播就會自然舒服很多了。
所以大家會發現,在我們場景裡有非常多個性化應用的需求,哪怕是基於一個通用的平臺,都可以加很多個性化的功能進去,這在編程的終極場景裡都可以實現。
我們在小紅書、知乎或者百度上,想搜索一個軟件去解決我們一些問題時,本質上都是在提需求。如果這樣的需求可以通過自動生成的代碼和應用實現,而不需要用戶去找各種各樣的應用,找到後還要剋制自己的需求。這兩種體驗完全不一樣。
大模型的核心功能,究竟是什麼?
關於代碼生成和我們公司要做的事情,介紹到這裡就結束了。接下來我有三個真話想說:
一、大家一直在追求 AGI 或者解決 AGI 問題,是很割裂的。比如很多大佬都會說,整個大模型目前還處於嬰兒期,但是從 2024 年初到現在,大家都說今年是 Agent 元年,但一個嬰兒期的工具怎麼解決那麼多問題?
我們經常聽到說 Scaling Law 走到盡頭了,但是囤卡樂此不疲,H100、B200,1 萬張,10 萬張,大幾十萬張卡,現在大廠甚至開始搞核電站了,包括 Ilay 最近提到的,預訓練期結束了,其實裡面沒有什麼乾貨,主要把樣本學完,但是還有很多高質量樣本,需要結構化輸入進整個網絡結構裡。
所以有什麼資源,大家就會依賴什麼路徑,對於我們這樣的公司來說,我們看到更多的是網絡結構層帶來了非常大的紅利。從 Transformer 出現,到前面幾十年,大家對於通用人工智能的追求,都避不開網絡結構這個環節,這一層獲得的收益和待解決的問題更多。
宿文對大模型的核心做出預測|圖片來源:極客公園
二、互聯網或者移動互聯網,給大家留下的思維慣性太強了,不管投資人、創業者、產業分析師,在大模型出現的第一天,很快就出現了一個分析框架,這個框架鏈條裡有基模、OS、Agent、應用……但這些分類的基礎,都是從上個時代復刻下來的,大模型時代的鏈條會長什麼樣,我們都不知道,它大概率不會長成上個時代的樣子。
我們做的過程中發現,做 Infra 這一層、做基模、做應用,各個環節的基礎鏈條都不成熟,在不成熟的時候,大家如果去等待鏈條成熟,或者自己找一段去完善,這個商業通路很難跑通,因爲它很難把價值直接傳遞給用戶。對我們來說,我們有能力把這些鏈條打通到一起做,而不會很刻板地停留在過去的技術思路里。
三、在大模型出現第一天起,就很多人提超級應用,這同樣是互聯網時代留給我們的想象。移動互聯網時代,我們看到這種超級應用本身不產生內容,更多是做一個信息的嫁接平臺或者一箇中間平臺,讓我們搜內容搜得越來越快,給我們推薦信息越來越準,讓我們交易越來越高效,但這個平臺本身不會提供內容服務。
但是到了大模型時代,這些互聯網產品特性基本都消失了,大模型只有一個核心功能:在底層幫大家生成內容。
這個競爭力一定是最底層的,未來超級應用長什麼樣不知道,甚至不會存在。但是超級應用底層是對超級智能的支持,這一點是一定避不開的,這是最內核的競爭力。
看起來我們是在做 AICoding,但其實我們是在這樣一個商業場景裡,去解決 AGI 自身的問題,我們朝着 AGI 一路狂奔,也是希望有更多小夥伴像我們一樣,大家向上卷,向核心技術卷,最後把這些技術沉澱在產品上,提供給我們的用戶。
謝謝大家。