Manus 最新對話全文:嘗試 Agent 支付,公司 RRR 近 1 億美元
作者|Li Yuan
編輯| 靖宇
?
搬到新加坡的 Manus,對通用 AI Agent 的思考沒有停止。
在今天在新加坡舉行的 Stripe Tour 上,Manus 聯合創始人兼首席科學家季逸超(Peak)與 Stripe 亞太地區及?本?席營收官 Paul Harapin 進行了對談。
席間, Manus AI 披露了近期的經營數據,Manus AI 收入運行率(RRR,Revenue Run Rate)已經達到 9000 萬美元,很快即將上億。
Manus AI 的肖弘還特意在即刻表示,Revenue Run Rate 指的是當月的 Revenue *12,并不等于 Cash Income。很多 AI 產品都會有年付選項,這部分只能算作預存款,而不能記為 Revenue。「如果我們按照這種【錯誤方式】披露,可以算出一個一個比 1.2 億美金更大的數。」肖弘表示。
除了經營數據之外,季逸超還分享了 Manus 團隊是如何思考通用 Agent 的的下一步的,以及 AI Agent 和 AGI 未來到底有什么區別。
「現在大家幾乎把一切都叫做 Agent。比如一個麥克風,有人會叫它是「有環境感知的收音 Agent。」季逸超開玩笑地講道。
他也給出了拓展通用 Agent 能力下一步的兩條主線: 其一,用多 Agent 協作把執行規模做寬 (如在大規模調研里衍生出上百個并行的子 Agent); 其二,給 Agent 打開更大的「工具面」 ,不把能力綁死在少數預置 API,而是像程序員一樣調用開源生態、安裝庫、甚至在可視化后 看圖自檢并回改 。
季逸超還提到,今天的數字世界仍按「給人用」的范式建造——非 API 化網頁、CAPTCHA、流程「小游戲化」帶來大量摩擦, 瓶頸更像生態與制度約束,而非模型智力 。
這也是 Manus 參與 Stripe 活動的原因之一:雙方正推進 在 Agent 內完成支付 ,把「研究—決策—下單/結算」連成閉環,用基礎設施協作來消解世界的摩擦。
以下為對話精華,經極客公園編輯整理:
問:給觀眾簡單介紹一下你自己吧。你最近關于「上下文工程」的博客非常鼓舞人心,我覺得對于在座任何正在開發 AI Agent 的人來說都是必讀的。我每次去和工程師們吃午飯時,他們總是在談論這個,所以我現在只能坐到別的地方(笑)。但對于現場可能不太熟悉 Manus 的人,你能分享一下你的經歷和愿景嗎?
答: 謝謝 Paul。很高興能來到。Manus 在構建一個通用 AI Agent。
很多研究機構和公司,其實在嘗試打造一個大腦——打造一個大語言模型。但我們認為,從消費者的角度來看,這其實并不好。AI 應該能真正采取行動,完成事情,所以我們構建了 Manus。
我們的方式,是讓 AI 可以使用人類歷史上最偉大的發明之一——通用計算機。給了 AI 計算機,它能做人類能做到的所有事。Manus 能真正完成任務。比如它可以幫你做演示文稿、幫你規劃一次旅行,甚至能幫你運營社交媒體——雖然我并不推薦你真的這樣做。
我們的用戶真的很喜歡 Manus。 我們在三月份發布了 Manus,現在已經實現了大約 9000 萬的收入運行率(RRR,Revenue Run Rate),很快就會突破 1 億。
我覺得這對我們這樣一個小型創業公司來說非常巨大。但更重要的是,這表明 AI Agent 已經不再只是一個研究領域的流行詞,而是真正在被應用,落地生根。
我可以和大家分享一個我們構建 Manus 過程中的小故事。
我們其實從 Agent coding 的應用中得到了很多靈感。比如像 Cursor 這樣的 AI 編程產品,之前已經吸引了很多關注。
作為工程師,我們自然會使用 Cursor。但讓我們驚訝的是,公司里很多非工程師同事也在用 Cursor。當然,他們并不是在寫軟件,而是用它來做數據可視化,甚至寫一些文章。他們會忽略左邊的代碼部分,只是跟 AI 對話來完成工作。
這讓我們意識到:我們應該把這種方式泛化,賦能非程序員。這就是 AI 的一個用例。
問:我們越來越常聽到人們談論 AI Agent 和 AGI。你能不能幫我們更清楚地區分這兩個概念?AI Agent 和 AGI 對你和 Manus 來說各自意味著什么?
答: 我們認為這是一個非常好的問題。
現在大家幾乎把一切都叫做「Agent」。比如一個麥克風,有人會說它是「有環境感知的收音 Agent「。
但至少我們主張,Agent 應該是應用型 AI 的一個子集。我們不妨退一步,看看常見的 AI 應用類別。
大多數人已經熟悉兩類:一類是聊天機器人,比如 ChatGPT;另一類是生成式工具,比如 MidJourney 或 Sora。 在這些系統中,通常只有兩個角色:用戶和模型。你和模型交互,得到輸出。而 Agent 的不同在于,它除了用戶和模型,還引入了第三個關鍵元素——環境。
這個「環境」的概念會因智能體類型不同而變化,比如在設計型 Agent 里,環境可能是一個畫布或一段代碼;而在 Manus 這里,我們的目標是讓 Agent 出現在虛擬機甚至整個互聯網中。這樣 Agent 就能觀察環境,決定下一步該做什么,并通過行動來改變環境。這讓它非常強大。
比如在 Manus,你可以表達需求,它會打開瀏覽器、發布網頁、幫你訂一張機票。我很喜歡這個例子,因為雖然訂機票聽起來很簡單,但這其實是 AI 在直接改變現實世界——結果不是模型的輸出,而是你手里的機票。AI 真正介入了你的世界。這就是我們所說的 Agent。
簡單來說,Agent 就是能代表用戶與環境交互的 AI 系統。
至于 AGI,這個詞也經常被提到,很多人把它等同于超級智能。我們認為,AGI 是一種能利用 AI 模型的通用能力,在不經過特別設計的情況下完成許多任務的系統。
我們認為「Agent coding」其實是通往 AGI 的一條路徑。它不是一個垂直領域的能力,而是如果你把它賦予計算機,它幾乎能在計算機上做任何事。所以對我們來說,AGI 的條件就是要構建足夠完善的環境,讓這種能力得以發揮。
問: AI 今天究竟在哪些場景中真正發揮了作用?未來會在哪些地方發揮作用?什么時候會出現 iPhone 時刻?
答: 就 Agent 而言,如果單看模型能力的話,現在的旗艦模型已經非常驚人了,幾乎是「超人」級別的。它們可以在數學競賽或邏輯推理上勝過我們大多數人。
但我認為,模型仍然像是「瓶子里的大腦」,如果想真正發揮力量,就必須讓它們與真實世界交互、觸達現實。但不幸的是,這正是問題開始的地方。
比如你讓一個 AI 去做一些事務性的任務,它在重復性任務上確實很擅長。比如像 Deep Research 這樣的產品,它只是聚合信息然后給出一個結果,它的輸出只是簡單地出現在那里。
舉個例子,現在幾乎所有東西都是為人類設計的,不只是物理世界,甚至數字世界也是這樣。比如網頁工具,它們就像小游戲一樣,沒有提供 API 或標準接口。驗證碼 CAPTCHA 無處不在,處處在攔截 Agent。
所以我認為 AI 在封閉的自包含任務中表現很好,但一旦涉及真實世界,就會遇到障礙。
未來什么時候能出現 iPhone 時刻?我覺得這并不是技術問題,而是更像是一種制度性限制。這不是像我們這樣的 Agent 創業公司能夠單獨解決的事情。
我認為這需要一個漸進的轉變,要求整個生態系統共同進化。這也需要像 Stripe 這樣的公司在基礎設施層面發力。比如我們正在集成新的 stripe 的 Agentic 支付 api。大家共同努力。
問:那我們能不能具體談談用戶在使用 Manus 時的一些典型場景?他們是如何使用的?這其中體現出了怎樣的力量?
答: 是的,我們雖然來自當前這一代 Agent,但已經看到很多很棒的用例。
比如說,我們剛剛搬到新加坡,需要雇傭房產中介來幫我們找住所。是真人 Agent(笑)。
而現在這些中介已經在使用 Manus:他們會根據客戶的需求,用 Manus 來分析公司所在地、員工想住的區域,并生成相應的推薦。
我覺得這很有意思,因為這屬于一種「長尾需求」。一般來說,并沒有專門的 AI 產品是為這種具體場景設計的,但由于 Manus 是一個通用型 Agent,它就能滿足這些需求。我們認為長尾需求非常值得關注。
從宏觀角度看,它可能是長尾,但對具體用戶而言,這正是他們的日常工作。這種場景特別有價值。
這就像今天的搜索引擎格局一樣。如果你只是搜索一些常見的內容,不管用 Google 還是 Bing,結果質量差不多。那為什么人們會選擇其中一個?可能是因為某個搜索引擎在特定時刻給了他們更合適的結果。而如果你搜索的是非常個性化或專業化的內容,就更能體現差異。所以我們認為通用型 Agent 的優勢就在這里。
那如何讓它更好呢?我們思考了很久,因為我們認為一切都繞不開編程。如果你把計算機交給 AI,那么它與環境交互的方式其實就是通過編程。
我們認為可以從兩方面改進。第一是規模化。但如果你能把 Agent 的能力放大一百倍會怎樣呢?
最近 Manus 剛剛發布了一個新功能,叫做 Wide Research。它的基本思路是允許一個 Agent 再衍生出上百個 Agent 一起去完成任務。你知道的, 如果只是讓 AI 幫你做一些小事,很多時候你自己也能完成。但如果任務非常龐大,你一個人根本不可能完成,比如需要做大規模的研究,這時候讓上百個 Agent 并行去做,就會變得非常強大。
其次,我們還需要讓 Agent 更靈活地使用計算機使。比如,如果你只給一個 AI Agent 設置了預設工具,那么它的行動空間就被限制在這些工具里。但想象一下,如果你是一個程序員,你有整個開源社區的資源可以調用。
比如你在 3D 打印的時候,直接修改模型的參數很困難,但是你如果能找到 GitHub 上的合適的庫,直接安裝就能解決你的問題了。 在 Manus,我們在優化通用性,并且提出了一個概念,叫做「工具的網絡效應」。
有一個很有意思的例子:很多用戶在用 Manus 做數據可視化。你們知道,在亞洲有時候會遇到問題,比如在圖表中顯示中文時可能會出現字體錯誤。或許有些專業用戶會寫一些硬編碼規則,比如在輸出韓文時應該用哪種字體。但這種方式會讓系統越來越僵化。
我們采取的辦法是給系統增加了一個很簡單的能力:查看圖像。結果很驚喜——因為今天的模型已經很聰明了,它們會在生成可視化圖像后自己檢查,并意識到錯誤,然后再自動修正。我們發現, 增加工具的靈活性比硬編碼規則能解決更多的問題。
問:這是一個令人興奮的時代。我真的很激動,只希望自己能再年輕到三十歲(笑)。提到醫學研究的,我知道 Manus 在這方面也很強。你們觀察到有些用戶在使用 Manus 研究醫療嗎?
答: 很多人已經在用 Manus 做研究,不僅限于醫學研究。我們覺得這很有意思,因為現在確實有很多所謂的「深度研究」產品,它們會幫你收集大量信息并做一些分析,但最后只給你一個 markdown 文件或文檔。這遠遠不夠。
很多時候,研究人員真正需要的,是能夠直接交付給老板或團隊的成果。所以我們在 Manus 上加強了研究結果的輸出。例如在醫學研究中,很多時候需要生成正式的報告,比如幻燈片報告之類的東西。因此我們必須優化 AI 的輸出能力,以滿足研究人員的需求。這是一種「工具化」的體驗。
比如現在很多用戶會先用 Manus 做研究,然后直接生成一個網站。你會覺得這和傳統的網站搭建方式完全不同。
要知道,搭建一個網站本身其實不難,難的是如何確保數據的可靠性和準確性。所以我們認為,最好能在一次會話、一個共享的上下文中完成整個流程。這樣,你的研究、你的見解就能無縫轉化為最終成果。 這就是我們在 Manus 里所做的事情。
問:很多國家都在討論一個話題:在 AI 時代,人類的未來和經濟影響。你怎么看待就業被取代?又會出現哪些新的工作機會?
答: 我們的朋友和投資人也經常問我們這個問題。當我們推出 Manus 時,最初認為如果能構建這樣一個 Agent,它就能幫人們節省很多時間,讓大家輕松賺錢。
但實際上,我們發現這個愿景并沒有完全實現。通過大量用戶調研,我們發現用戶在使用之后,他們反而工作得更多了。因為他們變得更高效了,他們實際上能做更多他們本來就很擅長的事情。這是第一點。
其次,我們認為 Manus 還打開了一個全新的空間。我們一直在討論虛擬機和云計算。我們覺得 Manus 正在扮演一種「個人云計算平臺」的角色。比如云計算已經存在幾十年了,但它更多是工程師的特權,只有我們能通過編程來調用云的力量。普通知識工作者無法使用。
但現在有了像 Manus 這樣的 AI Agent,人們可以用自然語言下達指令,讓 AI 去執行。這等于解鎖了一種全新的生產力。這就是我們所帶來的。
而最后,關于「替代」,我認為其實很難。比如房產中介,他們每天都在用 Manus 完成日常工作。但你知道,AI 永遠無法替代中介面對客戶時的那種溝通方式。我們是一家 AI 公司,甚至 Manus 的發布視頻都是由 Manus 寫的腳本,但視頻里出現的還是我,因為這是關于信任的事情。而信任,是不能完全交給 AI 的。
*頭圖來源:stripe