王小川的第一個 AI 應用來了!主打 AI 搜索 + 智能助手
百川智能已經成立超過一年了,據媒體報道,估值已經超過 130 億人民幣。
盡管作為頭部大模型公司,百川智能曾被朱嘯虎點名為「技術也靠譜,創始人也靠譜」,普通用戶對百川智能的技術和產品感知并不強。
其主要原因是,在此之前,百川智能并沒有推出一款文心一言、Kimi 智能助手這樣鮮明的針對 C 端用戶的產品——直到昨天。
5 月 22 日,百川智能在北京召開發布會,發布自己的最新模型 Baichuan 4,并同時推出了自己的首款移動端應用——百小應。
百小應的定位為 AI 智能助手,與文心一言、Kimi 智能助手相似,但主打的特點是「懂搜索、會提問」,這點又與目前很火的 AI 搜索應用類似。
百川智能表示,并不想做普通的 AI 搜索——將搜索網頁結果聚合起來,由大模型進行匯總,提供一個答案。而希望用搜索的能力,強化助手的概念。這讓百小應的設計與普通 AI 搜索略有不同。
比如,在百小應的產品設計下,百小應會更希望能在用戶提問后,對用戶進行進一步追問,不在一輪搜索中,多抓取網頁結果綜合比對直接作答,而是通過多輪對話,獨有搜索技術,通過搜索少量網頁,精準地回答用戶的問題。
除了能夠搜索之外,百小應還能完成代碼撰寫、主題創作、活動策劃等一般 AI 助手能完成的任務。
在 AI 圈的大新聞——國內大模型 api 紛紛降價的大背景下,此次百川智能推出了新模型,是否降價也受到了關注。不過在發布會上,王小川顯得很淡然:「百川而言,API 是收入非常少的事情,也不會構成我們收入的重點。我們最終希望用超級模型,做出超級應用。因此對于國內大模型 API 調用降價,是吃瓜的態度。」
不過,王小川承認,此次推出的 Baichuan 4 和百小應,都還沒有達到他心目中理想的「超級模型和超級應用」。「 會有人問我是不是發應用發晚了,我其實覺得發早了。我認為大家之前發的各種應用只是模型的展示 ,大模型行業的 C 端應用都還在為百萬 DAU 努力,行業沒有成熟。」王小川表示。
對于此次發布的百小應,他表示這是一個能讓行業內對百川智能有基礎了解的機會,也是一個能讓團隊「轉起來」的機會。「 如果順利的話在今年內會有大的升級變化,到時候的應用能夠解決大家的剛需。 」王小川表示。
百川智能行不行?用戶可以親自驗證了
百川智能此次發布的百小應,取名自「一呼百應」,代表了百川智能希望 AI 助手能夠真正解決人們的問題的愿景。
在 AppStore 里,目前就能下載到這款產品。
圖片來源:截圖
可以看到,百小應的應用,開屏主打,就是其搜索功能。
筆者簡單試用了一下這款 app。與 AI 搜索應用不完全相同的是,在對百小應進行提問的時候,不一定會觸發搜索功能,比如,在提問「百川智能是一家什么樣的公司」時,百小應應該是調用了自己的知識庫,直接給出了回答,而沒有觸發搜索功能。
在觸發搜索功能時,相對于筆者用過的搜索產品,百小應閱讀網頁的時間似乎相對較長,但是生成回答的速度相對較快,給出的回答,也相對較長且結構化。
比如在詢問「高通有哪些產品線」這一問題的時候,百小應給出的結果有八百多字,而秘塔搜索的「深入」模式(共有簡潔、深入、研究三種模式)給出的回答大概為六百多字。Kimi 的回答大概五百多字。
在手機上看百小應的回答,要下拉三屏,第一反應還是感覺非常詳細。
圖片來源:截屏
和另外兩個產品相比,百小應的另一個特點是,搜索的網頁比較少——似乎在百小應的產品設計里,一輪搜索就是四個網頁。
因為搜索的網頁比較少,如何判斷搜索的答案的精準性,也是百川智能的一個重要技術方向。百川智能表示, 百小應的搜索背后有一些獨特的能力,尤其是定位問題領域,訪問權威網站的能力。「它搜索的時候不是只調用通用搜索,而知道在關鍵時候調用一些更關鍵的搜索引擎獲得答案。」 王小川表示。
在上面的搜索中,這一點似乎有所體現,在高通這一問題的四個網頁中,其中第三個網頁,是一個高通的官網鏈接,最后的回答,也主要以高通的官網鏈接,作為了主要參考。
而在我的另一部分搜索中,百小應會搜索八個網頁——產品會顯示「做了兩輪搜索」。
這似乎也是百川智能搜索方向的一個獨有設計。「 我們做兩輪搜索,是先搜一個詞,獲得答案或者啟發之后,會激發它根據之前的搜索回應,進行第二次搜索。 」
百川表示,百小應的另一部分獨特能力,在于會提問。
百川智能自己提供了一個真實用戶案例。「我們的員工問了百小應一個問題,引擎蓋打不開了怎么辦。國內流行的模型,回答大同小異,會提供一些辦法。但是百小應會問你車的品牌以及型號,以及是哪年的車,然后去具體搜索維修點信息等等。」
?
圖片來源:百川智能
這樣的能力,確實在一般的 AI 搜索上較為少見,在一些商品信息推薦的應用上,則有所使用——在用戶搜索推薦某個價位的耳機后,進一步詢問用戶的需求是室內還是戶外。
在未來 AI 助手為人們提供更個性化服務方面,這樣的功能,似乎是一個重要的組成部分。不過此次我在和百小應的聊天中,百小應追問能力表現并不明顯。而對于用戶而言,是否愿意打破之前搜索的習慣,多打字進行多輪回答,似乎也是一個未知數。
百小應也有普通的 AI 助手會出現的弱點——在對網上信息不足的問題進行搜索時,AI 很難給出準確的回答,甚至會一本正經地胡說八道。
王小川表示,目前的解決方法也只能是提供「引用校驗」。當 AI 提供的回答嵌入了搜索結果的時候,后面會打個標,來自什么樣的網頁里面,由用戶去判斷其可靠性。
在之前的 極客公園直播 中,獵豹移動董事長兼 CEO 傅盛曾提到,部分 AI 搜索產品雖然會提供引用校驗,但實際上標內內容與實際回答對不上,而在百小應中,引用標記并不是對應網頁,而是直接對應到網頁的特定文字,應該能為用戶提供更強的可靠性。
Baichuan 4:發布首日SuperCLUE登上榜首
此次為百小應提供產品背后的搜索模型的,是百川新發布的 Baichuan 4 模型。
進入 2024 年,百川將新模型的發布節奏從每月變到每季度。上次百川發布新模型,還在 2024 年 1 月,發布 Baichuan 3 模型。
百川智能表示,相較 Baichuan 3,Baichuan 4 在各項能力上均有極大提升,其中通用能力提升超過 10%,數學和代碼能力分別提升 14% 和 9%。
「SuperCLUE 目前是中國最公正的榜單。從結果上看,Baichuan 4 在 SuperCLUE 里理科目前排國內第一。文科因為是中文模型,明顯有更大的優勢,處于全球最好的位置。」王小川表示。
不過王小川的發布顯然比較切近實際,并沒有夸張宣稱超越了 GPT-4:「在 SuperCLUE 上我們拿到第一,數據是真實的,但是并不代表能力上超過了 GPT-4。 和國外模型作對比,能看到像知識百科、文本創作或者安全里是遙遙領先的,在代碼、邏輯這幾條線條里可以看到國際模型更加領先。 」
圖片來源:百川智能
Baichuan 4 模型有千億參數規模,是閉源模型。「開源是我們去年立投名狀時的一個動作。」王小川表示。
值得一提的是,此次百川也公布了自己的多模態方面的數據。
之前百川智能一直表示,智能源自語言,也曾公開宣布不追 Sora 這條技術線。
此次雖然王小川仍然堅持「多模態不具有智能。今天語言用著用著可能沒數據了,人們在嘗試是否能在圖像視頻里面能產生智能。不過,語言是白粉的話,圖片就是面粉,它在里面蘊含的智能濃度低太多。」,仍然簡單發布了 Baichuan4 的多模態能力,表示其多模態能力在各大評測基準上表現優異,領先 Gemini Pro、Claude3-sonnet 等多模態模型。
圖片來源:百川智能
?
百小應,只是一個過渡產品
曾經提出過在大模型領域里頗具影響力的 TPF 理論(大模型時代,更重要的是找到技術和產品的契合)的王小川,此次終于帶公司推出了第一款面向 C 端的產品。
搜索,一方面是百川智能一直以來強調的強項——百川智能 CEO 王小川曾任搜狗 CEO,在搜索領域深耕十幾年。王小川強調,目前,百川能自建搜索能力,且在數據方面也有合作伙伴,這兩方面都是百川智能的優勢。
另一方面,搜索也是市場驗證過的幾個較為成功的 AI 應用場景之一——國外的 Perplexity.ai,國內的秘塔搜索等等,都是目前收獲不少用戶的明星大模型創業項目。
搜索領域,或許確實是百川智能不錯的 TPF。
不過,在整個發布會上,明顯能感覺到,百小應這種形態,并不是百川智能未來想做的超級產品。百川智能只是想把有搜索能力的助手作為未來超級應用的第一步——王小川定義這樣未來的超級應用,應該是能解決人們的剛需的,能擁有近億級用戶。
不過究竟這樣的應用是怎樣的,未來是怎樣的商業模式,王小川相對含糊其辭。其中「職業人士」這個詞被提及多次。真正的超級應用,似乎是要等到模型能力足夠成熟之后,替代「職業人士」才能出現。
「如果 AI 能像人一樣工作像人一樣學習,最后就會變成一個職業人士,往下會變成 AI 律師,AI 醫生,AI HR,這種情況下跟人一樣能提供人的供給,我覺得這種時候就可能出現超級應用。」 王小川表示。當人們用醫生的價格去衡量 AI 應用,而不是用娛樂價值、算力成本等方法來衡量 AI 應用,那確實將是用戶付費率高漲的時候。
而在今天,百川推出百小應,似乎還沒有開始擔心商業模式的事情。
「做百小應,是在這個行業中,我們也需要有一個機會把它發上去,讓行業端有基礎的了解,也能讓團隊轉起來。」王小川表示。
他還表示,從成本上而言,做搜索,建立索引庫的技術成本相對是可控的。「現在最大的成本其實是在 Scale Up(把大模型參數規模做大),大模型中間的實驗加上 Scale Up 這個錢,這個是遠大于其他地方的。」
「我覺得現在談商業模式是過早的事情。沒有足夠的用戶價值、足夠的體量,在這個情況下,不管是走流量模式,還是廣告模式都是有意義的探索,但是我覺得有或沒有,其實沒有本質的區別。」王小川表示。
?
?