世界 500 強 CIO 齊聚第八屆南方信息大會丨漢數創始人陳開冉受邀發表演講
8月16日,由廣東省首席信息官協會主辦的第八屆南方信息大會在廣州盛大啟幕。作為華南地區極具權威性與前瞻性的 CIO 年度巔峰盛會,本屆大會匯聚 AI 領域頂尖學者、各行業頭部企業 CIO 及全球領先大模型廠商,其中包括南航、華為、阿里、字節、美的、西門子等世界 500 強公司的 CIO,共同探討 AI 時代 CIO 的挑戰與機遇。
*華為董事兼質量流程 IT 總裁 陶景文
*美的集團首席信息安全官 劉向陽
探跡 科技 創始人兼 CTO、漢數科技創始人陳開冉受邀出席本次盛會,他以《大模型時代下的高質量數據云》為主題發表精彩演講,與一眾行業頂尖 CIO 嘉賓同臺分享AI技術趨勢,展現出卓越的行業洞察力與前瞻性思維。
*探跡科技創始人兼 CTO、漢數科技創始人陳開冉
作為本次主論壇首位演講嘉賓,陳開冉深入剖析高質量數據集在 AI 發展進程中的核心價值,為大模型在千行百業的應用落地提供了清晰可行的 “數據破局” 路徑,引發嘉賓的廣泛關注與熱烈反響。
01高質量數據集“高標號汽油”,為 AI 產業落地賦能
人工智能浪潮席卷全球,數據作為驅動 AI 發展的 “新石油”,其戰略地位已毋庸置疑。而在陳開冉看來,高質量數據集更是如同 “高標號汽油”,直接決定 AI 模型性能與應用效果。
“人工智能已從‘以模型為中心’轉向‘以數據為中心’,” 陳開冉引用吳恩達等學者的觀點強調,“高質量標注數據是釋放 AI 價值的關鍵,直接決定了大模型的應用效果與產業落地能力。只有經過深度治理、精準標注的高質量數據,才能讓 AI 真正服務于產業實踐。”
02高質量數據集解決“幻覺”,讓大模型從“通才”變“專才”
盡管大模型技術日新月異,但其在產業落地中仍面臨兩大核心痛點,而高質量數據集正是破解這些難題的關鍵。
1.解決“幻覺”問題:以權威數據筑牢模型可信度
大模型本質是概率模型,“幻覺現象”(生成錯誤或無依據信息)成為其落地行業的重要障礙,尤其在缺乏專業數據支撐時更為凸顯。陳開冉指出:“高質量數據集能為模型提供權威依據,從源頭減少‘無中生有’的錯誤。”?通過專業領域的高質量數據集,可讓大模型輸出的信息有跡可循、有據可依。
2. 突破 “專業壁壘”:讓大模型從“通才”進階“專才”
通用大模型雖能應對基礎問題,卻在垂直行業的專業場景中 “力不從心”。陳開冉解釋:“大模型在專業問題上的表現,高度依賴垂直行業領域數據。只有融入行業專識數據,大模型才能真正理解產業細節,給出有價值的答案。”?
高質量數據集正是打通這一壁壘的核心 —— 通過注入行業知識、業務邏輯等專屬數據,推動大模型從“全而不精”的“通才”,轉變為“專而優”的“行業專家”。
03曠湖數據云構建大模型時代的高質量數據底座
面對大模型對數據的高要求,以及針對企業在數智化轉型中 “數據整合難、調用難” 的痛點,陳開冉詳細介紹了漢數科技推出的?“曠湖” 高質量數據集平臺 —— 這一平臺正是基于高質量數據云所必備的 “輸入輸出標準、數據質量高、適配大模型調用、高并發高性能、計費方式靈活” 五大核心能力構建,為企業的行業大模型訓練和應用落地提供堅實的數據基礎。
1、全場景數據生態:覆蓋18大垂直領域的 “數據百科”
曠湖數據云整合了3.8億+企業、25萬+樓宇、30億+商品等海量數據,覆蓋工商企業、實體制造、零售門店、產業招商、宏觀 經濟 等18大垂直領域。通過統一數據標準、分級治理體系與實時質量監控,實現多源異構數據的高可信融合,為 AI 大模型提供 “權威可信” 的全場景數據供給。
2. “三段式” 對接:讓數據獲取從 “復雜開發” 到 “簡單配置”
傳統數據對接流程復雜、周期長,難以適配敏捷的 AI 開發需求。曠湖創新 “三段式數據對接” 模式,將數據獲取簡化為:創建數據對接器(配置基礎信息,支持 API、文件等多形式)、篩選數據范圍(利用上千個條件精準框定)、選擇數據字段(在萬級維度中自由勾選,實時計價交付),大幅降低企業數據獲取門檻。
3. MCP 服務市場:打通大模型落地 “最后一公里”
當大模型開始“無所不能”,卻卡在“最后一公里”,缺少連接內外部數據與工具的標準化方式。為解決大模型實時調用高質量數據的難題,曠湖利用多場景高質量數據集,通過 MCP 服務跨越大數據與大模型的鴻溝。
目前,曠湖數據云已與字節、阿里、百度等頭部大模型廠商深度合作,并且上架火山引擎、百度千帆、阿里百煉、Github 等知名大模型平臺,為企業提供更豐富的調用方式。
“我們希望通過高質量數據集,助力行業大模型解決幻覺問題,哪怕是在專業的應用場景中,也能給出令人滿意的答案;同時積極擁抱各大模型生態,降低數據調用門檻,更好地適配大模型的應用場景。”?陳開冉總結道。
從“新石油”到“高標號汽油”,“通才”到“專才”,“數據孤島”到“數據即服務”,漢數科技以曠湖數據云為支點,撬動大模型落地千行百業的無限可能。未來將持續拓展數據覆蓋的廣度與深度,攜手合作伙伴構建開放共贏的數據生態,驅動產業新質生產力發展。