富士康開(kāi)發(fā)出臺(tái)灣首個(gè)推理大模型 性能落后于DeepSeek
北京時(shí)間3月10日,據(jù)《華爾街日?qǐng)?bào)》報(bào)道,富士康母公司鴻海已研發(fā)出中國(guó)臺(tái)灣地區(qū)首個(gè)具備先進(jìn)推理能力的大模型,性能上落后于DeepSeek的部分大模型。
鴻海周一表示,已自主研發(fā)了具備推理能力的人工智能(AI)大語(yǔ)言模型FoxBrain,并在四周內(nèi)完成訓(xùn)練。FoxBrain最初為公司內(nèi)部使用而設(shè)計(jì),具備數(shù)據(jù)分析、數(shù)學(xué)運(yùn)算、推理以及代碼生成的能力。
鴻海稱(chēng),英偉達(dá)通過(guò)其臺(tái)灣超級(jí)計(jì)算機(jī)和技術(shù)咨詢(xún)?yōu)轼櫤L峁┝酥С郑沟么竽P陀?xùn)練得以成功完成。該公司表示,計(jì)劃將該模型開(kāi)源,以便與行業(yè)合作伙伴開(kāi)展合作,并希望FoxBrain推動(dòng)制造和供應(yīng)鏈管理方面的進(jìn)步。
鴻海研究院AI研究所所長(zhǎng)栗永徽表示,該模型在解決問(wèn)題時(shí)“優(yōu)先考慮優(yōu)化訓(xùn)練策略,而不是單純依賴(lài)算力”。鴻海表示,栗永徽的團(tuán)隊(duì)使用了120個(gè)英偉達(dá)H100圖形處理單元(GPU),在大約四周時(shí)間內(nèi)完成了FoxBrain的訓(xùn)練。
鴻海已公布了FoxBrain的一些參數(shù),表示它是基于Meta公開(kāi)可用的大語(yǔ)言模型Llama 3.1的架構(gòu)構(gòu)建而成,是臺(tái)灣地區(qū)首個(gè)具備先進(jìn)推理能力的大語(yǔ)言模型,專(zhuān)為臺(tái)灣地區(qū)使用的繁體中文而設(shè)計(jì)和優(yōu)化。鴻海稱(chēng),F(xiàn)oxBrain的性能略遜于DeepSeek的部分模型,但已接近世界一流水平。該公司表示,更多相關(guān)信息將在今年3月中旬的英偉達(dá)年度技術(shù)大會(huì)上公布。
富士康是鴻海的產(chǎn)品代工子公司,因組裝 蘋(píng)果 公司的iPhone而被外界熟知。鴻海在核心電子制造業(yè)務(wù)方面正面臨產(chǎn)業(yè)轉(zhuǎn)型以及盈利能力下降所帶來(lái)的挑戰(zhàn),已開(kāi)始向AI、電動(dòng) 汽車(chē) 等領(lǐng)域拓展業(yè)務(wù)。
【來(lái)源: 鳳凰網(wǎng) 科技 】