數據挖掘國際頂會KDD 2021收錄結果公布百度多篇論文入選

砍柴網 ? 4年前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

8月14日至18日，國際數據挖掘與知識發現大會?KDD?2021在線上正式舉行。此前本屆KDD入選論文已經揭曉，百度被收錄的多篇論文，其突出的特點是學術研究與技術應用緊密結合，再次展現百度在AI領域的技術實力。

ACM?SIGKDD（簡稱KDD）國際數據挖掘與知識發現大會至今已連續舉辦了26屆，是世界數據挖掘最高級別的學術會議之一，有數據挖掘領域“世界杯”之稱，每年吸引了大量數據挖掘、機器學習、大數據和人工智能等領域的研究學者、從業人員參與。

百度在AI技術方向多年創新積累，數據挖掘和知識發現也是重點關注和持續投入的相關領域，并擁有多項技術成果和應用落地案例。在多年為KDD輸送優質論文的基礎上，百度今年的被收錄論文再次體現了技術與應用緊密融合的趨勢。

生物計算與醫療：生命健康里的AI新可能

在與人類息息相關的生命健康領域，百度也取得了長足進步：在AI+醫療多個方向上探索，構建醫療AI中臺、面向醫療場景提供各種AI解決方案；更進一步尋覓生物計算的密碼，推出生物計算平臺螺旋槳PaddleHelix。此次KDD?2021中，百度發表了論文聚焦生命健康領域，提出了相關的新型圖神經網絡模型和醫學實體關系循證框架。

1.?三維結構感知的交互式圖神經網絡?——?用于蛋白質-配體親和力預測的新型圖神經網絡模型

Structure-aware?Interactive?Graph?Neural?Networks?for?the?Prediction?of?Protein-Ligand?Binding?Affinity

藥物設計的一個關鍵步驟是準確的預測蛋白質-配體的親和力(protein-ligand?binding?affinity)。最近的研究進展已經證明，使用圖神經網絡?(GNNs)?來學習蛋白質-配體復合物(protein-ligand?complexes)的表示，比傳統方法可以更準確地預測親和力。然而，現有的模型通常將蛋白質-配體復合物視為拓撲圖，并沒有充分利用分子的三維結構信息。同時GNN模型也忽略了原子之間基本的遠距離相互作用。為此，我們提出了一種新型的三維結構感知的交互式圖神經網絡?(SIGN)，它由兩個部分組成：基于極坐標的圖注意力層?(PGAL)?和成對交互式池化層?(PiPool)。具體來說，PGAL層首先迭代執行節點-邊聚合過程以更新節點和邊的表征，在這個過程可以同時保留原子之間的距離和角度信息。然后，SIGN可以通過PiPool層來對交互邊進行池化操作，隨后通過重建交互矩陣的學習任務來反映蛋白質-配體的全局交互信息。在兩個基準數據集上的實驗結果驗證了SIGN預測效果的優越性。

數據挖掘國際頂會KDD 2021收錄結果公布百度多篇論文入選

2.?基于大規模機器閱讀理解的醫學實體關系循證

Medical?Entity?Relation?Verification?with?Large-scale?Machine?Reading?Comprehension

醫學實體關系驗證是構建企業級醫學知識圖譜的關鍵步驟。現有的信息抽取的方法專注于實體關系的挖掘，但并不能對挖掘的關系提供有效的循證支撐，這在真實醫學應用場景下是不可接受的。因此，設計一種以循證為基礎的醫學實體關系驗證框架是十分必要的。

針對上述場景，我們提出了一種基于大規模機器閱讀理解技術的醫學實體關系循證框架。該框架中我們設計了多種創新性的方法和模塊來提高醫學實體關系循證的效率和準確率。比如，為了解決醫學實體的多樣性和變體問題，我們提出了一種近義詞感知（synonym-aware）的召回模型；為了更好的利用醫學的領域知識，我們創造性的設計了基于關系感知（relation-aware）的證據探測模塊和基于醫學本體增強(medical?ontology-enhanced)的聚合模塊，來共同提高整體循證模型的效果。此外，為了解決證據標簽缺乏的問題，我們提出了一種新穎的基于交互協調訓練的新方法（interactive-collaborative?training）來提升標注效率，提升證據準確率。通過實驗驗證，我們提出的循證框架超越多個現有的基于事實驗證的最好基線方法(state-of-the-art?baselines)。該框架已經應用在了百度臨床輔助系統（CDSS）上，多方位支撐CDSS產品矩陣的可解釋循證，幫助了上萬名醫生。

數據挖掘國際頂會KDD 2021收錄結果公布百度多篇論文入選

POI檢索、推薦等為用戶提供更好、更便捷的智能化位置服務

作為國內智能化位置服務的代表產品之一，百度地圖日均位置服務請求已突破了1200億次。

怎樣讓用戶在使用百度地圖時能夠獲得更好、更快、更方便的服務？KDD?2021中選論文中，百度延續以往在百度地圖方面的技術研究、進行了升級和創新，覆蓋POI即時檢索、多語言POI檢索、POI推薦和基于自監督元學習的路線耗時預估辦法等。

3.?MST-PAC：基于元學習的時空個性化POI即時檢索

Meta-Learned?Spatial-Temporal?POI?Auto-Completion?for?the?Search?Engine?at?Baidu?Maps

POI即時檢索（POI?Auto-Completion）是百度地圖POI搜索引擎的特色功能之一。POI即時檢索旨在幫助用戶以最少的輸入（理想情況下只需要用戶輸入一個字符），在搜索結果列表頁的首位即時給出用戶想找的POI，因此能夠大幅降低輸入成本并顯著提升搜索效率。POI即時檢索效果不僅與用戶輸入的字符以及輸入習慣有關，也與用戶發起檢索的時間與空間相關。統計數據顯示17.9%的地圖用戶在不同的時間或地點使用過相同的前綴尋找過不同的POI。考慮到時空數據分布的不均衡性，我們提出了一種基于元學習的時空個性化POI即時檢索方法，并使用高效MapReduce算法對其進行訓練（縮寫為MST-PAC）。MST-PAC能夠顯著克服時空數據分布不均的問題，并能以較少的訓練樣本快速適應冷啟動的時空場景。MST-PAC已在百度地圖成功部署，每天處理數十億檢索請求，這表明MST-PAC是一種具有實用價值且能夠大規模落地的POI即時檢索工業解決方案。

數據挖掘國際頂會KDD 2021收錄結果公布百度多篇論文入選

4.?基于異構圖與注意力匹配網絡的多語言POI檢索

HGAMN:?Heterogeneous?Graph?Attention?Matching?Network?for?Multilingual?POI?Retrieval?at?Baidu?Maps

多語言POI檢索旨在幫助用戶使用自己熟悉的語言查找到由其他語言所描述的POI。該功能在出境旅游時尤為重要，因為本地POI往往缺乏多語言翻譯，要用完全陌生的語言進行查詢對大部分用戶來說不太現實。數據稀疏是多語言檢索任務面臨的挑戰之一。為此，我們提出了一種基于異構圖的注意力匹配網絡（HGAMN）。首先，在異構圖的幫助下，我們能夠有效建立起低頻POI與高頻POI之間，以及POI與其不同語言的查詢表達之間的關聯。其次，我們使用基于注意力的網絡對該圖的節點表示進行學習后，能夠顯著緩解數據稀疏問題。HGAMN已在百度地圖成功部署，每天響應數億搜索請求，這表明HGAMN是一種實用且魯棒的多語言POI檢索工業解決方案。

5.?SSML:?基于自監督元學習的在途路線耗時預估方法

SSML:?Self-Supervised?Meta-Learner?for?En?Route?Travel?Time?Estimation?at?Baidu?Maps

路線耗時預估旨在根據路線和出發時間預測用戶的到達時間，是地圖產品必不可少的基礎功能之一。在途路線耗時預估是路線耗時預估在用戶駕駛過程中的細分場景任務，旨在估算出從用戶當前位置到目的地的剩余時間。然而，現有方法未考慮從起點到當前位置的用戶駕駛行為，從而很難快速適應用戶的駕駛習慣，并據此及時調整剩余的預估耗時。為此，本文提出利用已行駛路線所觀察到的少量用戶駕駛行為，來提升在途路線耗時預估的準確率。我們將該任務建模為一個小樣本學習問題，把已行駛路線中觀察到的用戶行為作為訓練樣本，同時把剩余路線中未發生的行為作為測試樣本。我們提出了一種基于自監督元學習的在途路線耗時預估方法（SSML），并使用自監督學習進行數據增強，從而得以快速適應用戶的駕駛行為、提升模型的預測效果。基于百度地圖大規模真實數據集的實驗表明，SSML是一種具有實用價值與穩健性的在途路線耗時預估工業解決方案。

6.?CHAML：基于課程式元學習框架的POI推薦技術

Curriculum?Meta-Learning?for?Next?POI?Recommendation

POI推薦，作為廣受用戶歡迎的POI發現方式，是百度地圖的特色功能之一。該功能旨在結合當前的時空場景和用戶使用習慣，快速發現其潛在感興趣的POI。但是，由于『用戶-POI』交互的天然長尾效應，現有技術很難為數據稀疏的冷啟動城市提供令人滿意的POI推薦。本文提出了一種將隱藏在豐富數據中的知識從熱門城市遷移到冷啟動城市的構想。為了達成這一構想，我們設計了一種新的課程式元學習（CHAML）框架。CHAML框架能夠分別從城市和用戶兩個層面，考慮樣本的訓練難度，并以此來增強元學習訓練過程。同時，我們設計了一種由易到難的課程式學習方案，用于樣本抽樣，以幫助元學習模型收斂到更好的狀態。目前，CHAML已經用于百度地圖的POI推薦業務，并且取得顯著的應用效果。

新技術助力百度搜索引擎性能與效果提升

如何進一步優化提升百度搜索引擎的體驗和效率，是百度技術人員一直關注的問題。此次KDD?2021百度中選論文中，有數篇圍繞百度搜索引擎性能效果提升探討了最新技術研究成果，包含使用百度先進的中文預訓練語言模型文心（ERNIE），快速近鄰檢索（ANN）和快速最大內積檢索（MIPS），高效智能在線推理系統JiZhi（極智）等。

7.?基于預訓練語言模型的百度搜索排序

Pre-trained?Language?Model?based?Ranking?in?Baidu?Search

排序作為搜索的核心，在滿足用戶的信息需求方面起著至關重要的作用。近來，基于預訓練語言模型?(PLM)?的微調方法取得了當前最好的效果。然而，在大規模搜索引擎中應用基于PLM的排序模型卻并不容易：1.?PLM的計算成本過高，尤其是對于排序中的長文本，限制了他們在低延時系統中的部署；2.?現有的預訓練目標與相關性無關，直接應用相關性無關的PLM模型，是限制基于PLM的排序模型的另一個主要障礙；3.?現有的排序模型需要和其他排序模型共同應用，因此模型與其他模型的兼容性對于一個排序系統來說也至關重要。

在本工作中，我們提出了一系列如何成功部署最先進的中文預訓練語言模型（ERNIE）的技術。首先，我們闡明了如何高效地抽取文檔的摘要，并提出了能強大的Pyramid-ERNIE?架構將查詢、標題和摘要三者建模。然后，我們提出了一個范式來精細地利用大規模的有噪聲和偏見的點擊后行為數據進行面向相關性的預訓練。其次，我們還提出了一種為在線排名系統量身定制的人工錨定微調策略，旨在保證基于PLM的排序模型和其他模塊的兼容性。最后，大量的離線和在線實驗結果表明，所提出的方法可以顯著提高了搜索引擎的性能。

8.?預訓練語言模型在百度大規模網頁召回中的應用

Pre-trained?Language?Model?for?Web-scale?Retrieval?in?Baidu?Search

召回是網頁搜索中的重要階段，其功能在于從海量網頁庫中找到一個相對較小的相關候選集。其中，基于語義相關的召回有助于展現更多高質量的搜索結果給用戶。但是，搭建和部署一個高效的語義召回模型，在搜索引擎業務中一直面臨著諸多挑戰。本文介紹了目前百度搜索中所使用的基于預訓練語言模型的召回系統。此系統采用了百度自研的中文預訓練語言ERNIE，通過應用基于多層Transformer的模型結構，以及多階段的訓練流程，賦予了召回系統強大的語義匹配能力。同時，本文還介紹了基于預訓練的召回模型在整個召回系統中的工作流程。通過嚴謹的離線和線上實驗驗證，基于預訓練語言模型的召回系統已全量部署在百度搜索業務中，提升了百度搜索的整體效果。

9.?基于模調節近鄰圖的最大內積檢索

Norm?Adjusted?Proximity?Graph?for?Fast?Inner?Product?Retrieval

快速近鄰檢索（ANN）和快速最大內積檢索（MIPS）是工業界超大規模排序系統的核心，在搜索引擎公司的各項主要業務中發揮了巨大作用。有關ANN和MIPS的各項前沿研究在百度已經有了很長的歷史。從2019年開始，通過學術論文百度逐步而系統地對外公開了自主開發的各項ANN和MIPS核心技術。這篇KDD?2021論文就是其中之一。

最大內積檢索（MIPS）旨在快速查找與檢索向量（Query）內積最大的候選向量，原本是學術界和工業界的一個重大難題。最大內積檢索之所以具有挑戰是因為內積不符合三角關系，即內積不是度量標準（Metric?Measure）。傳統的快速向量檢索技術多為Metric?Measure所設計，如歐式距離和余弦距離。這些傳統方法并不適用于最大內積檢索。比如針對Metric?Measure效果非常好的圖索引方法就不能直接應用到最大內積檢索中。在本文中我們提出模調節圖索引結構，將針對Metric?Measure的圖索引結構擴展到最大內積檢索任務中。大量實驗表明，該方法相比于之前有代表性的內積檢索方法，有很大的性能優勢。我們提出的方法NAPG相比于之前有代表性的MIPS方法ip-NSW，Greedy-MIPS和Rang-LSH，在檢索性能上有巨大優勢。在同等召回率水平上，該方法可以處理的查詢數遠多于其他方法。

10.?JIZHI：百度面向網絡應用的實時高效模型預估系統

JIZHI:?A?Fast?and?Cost-Effective?Model-As-A-Service?System?for?Web-Scale?Online?Inference?at?Baidu

對于來自數億級用戶的巨量預估請求，如何能夠以超低成本支撐起超大規模離散稀疏深度模型進行高效的實時在線推理仍然具有極大挑戰性。在本文中，我們構建了一套高效智能在線推理系統JiZhi（極智），將每個請求的推理過程轉換為一個階段式的事件驅動處理流（SEDP），創新性的以全局最優視角自適應精細化調整各個階段最合理的架構算法和參數，動態調度模型預估算力的分配，更加智能通用的適應各種預估應用場景。通過多層次自適應緩存機制，大幅減少了由超大規模稀疏模型參數引起的計算成本和數據訪問延遲，進一步加速在線推理過程。此外，JiZhi還實現了智能資源管理機制，從系統運行期歷史中學習最佳的資源分配計劃，調整負載控制策略，最大限度的提高JIZHI的系統吞吐。JIZHI已在百度20多個業務場景落地，從端到端的實現成本、服務延遲、系統吞吐量、資源消耗等角度展現出了JIZHI系統顯著的優勢，在保障模型效果的前提下節省了大量的實現、硬件和基礎設施的應用成本。

AI+房地產評估：從地理分布、人口流動性分布、居民人口學分布等多個角度構建豐富的特征集，以對房地產價值進行全面綜合的剖析。

11.?MugRep:?一種面向房地產評估的多任務層次圖表示學習框架

MugRep:?A?Multi-Task?Hierarchical?Graph?Representation?Learning?Framework?for?Real?Estate?Appraisal

房地產評估是指對房地產的市場價值進行公正評價的過程，其對房地產市場的各種參與者（如房地產經紀人、估價師、貸款人和買家）的決策過程起著至關重要的作用。然而，要做到準確的對房地產進行評估并不容易，將主要面臨三個方面的挑戰：(1)?房地產價值復雜的影響因素；(2)?房地產交易間的異步時空依賴；(3)?城市居民社區間的多元相關性。針對以上幾大挑戰，本文提出了一種多任務層次圖表示學習框架?(MugRep)，用來準確的評估房地產。具體來說，通過獲取和整合多源城市數據，本文首先從地理分布、人口流動性分布、居民人口學分布等多個角度構建豐富的特征集，以對房地產價值進行全面綜合的剖析。然后，我們提出了一種演化的房地產交易事件圖卷積模塊，以融合房地產交易之間的異步時空依賴。此外，為了進一步從居民社區的視角提取有價值的知識，我們設計了一種分層異構的社區圖卷積模塊，以捕獲居民社區之間的多元相關性。最后，我們引入以城區作為劃分的多任務學習模塊，以生成不同分布的房地產評估意見。我們在兩個真實數據集上進行了大量的實驗，結果證明了MugRep及其組件和特性的有效性。

AI+人才管理：聚焦新領域的創新突破

一直以來，百度在“AI+人才管理”方面也實現了深厚的技術研究積累，今年年初就有相關研究成果登上國際頂級刊物Nature子刊Nature?Communications。在KDD?2021的被錄取論文中，百度相關研究團隊展現了在工作流動行為預測、人才需求預測等方面的最新研究成果。

12.?基于異構圖注意力表征的工作流動行為預測

Attentive?Heterogeneous?Graph?Embedding?for?Job?Mobility?Prediction

??在當今人才經濟時代，跳槽頻繁現象已經成為新常態。因此，對工作流動預測的研究應運而生，它能使組織和個人在多個方面獲益。本文聚焦在工作流動預測任務，現有研究主要集中在對個體層面的職業軌跡建模，而很大程度上忽略在宏觀層面上職業流動的影響（例如，在公司與公司或崗位與崗位之間的人才流動）。實際上，這種宏觀層面上的職業流動信息能夠反映出人才市場的趨勢，對個人的跳槽決定會產生一定影響。為此，本文提出一種建模宏觀層面職業流動行為影響來輔助預測個體層面的工作流動框架（Ahead）。首先，從觀測到的職業軌跡鏈中構造異質企業-崗位網絡來保留宏觀層面的職業流動信息。其次，本文構建了AHGN模塊從異質圖中獲取崗位和企業豐富的語義表征。其中提出了兩種聚合器，分別用來聚合內部和外部鄰居的信息，以及一種新穎的類型注意機制被用來融合兩種聚合器的信息以更新節點表示。最后在公開互聯網數據集上的實驗結果從多個角度證明了本文方法的有效性。

13.?基于注意力序列模型的人才需求預測

Talent?Demand?Forecasting?with?Attentive?Neural?Sequential?Model

??人才需求預測（Talent?Demand?Forecasting）技術是指根據公開互聯網數據對未來公司的人才招聘需求進行預測的技術。在當今瞬息萬變的商業環境中，根據公開數據及時預測各個企業在招聘市場中的人才需求趨勢，不僅可以幫助企業指定合適的人才斬落，保持自身人才競爭力，還可以幫助政府從宏觀角度對人力市場的供需關系進行分析。雖然已有很多在招聘市場分析方面的工作，但由于細粒度人才需求時間序列的稀疏性和招聘市場復雜的時序模式，仍然沒有有效的方法可以預測細粒度的人才需求動態。為此，在本文中，我們提出了一種數據驅動的注意力序列模型，即人才需求注意力網絡（TDAN），用于預測公開市場中的細粒度人才需求。我們首提取多個粒度級別上人才需求的時間序列，并使用矩陣分解技術提取公司和職位的內在屬性。然后，我們設計了一種混合注意力模塊來捕捉公司的趨勢和行業的趨勢，用以增強細粒度人才需求的信息。接著設計了一個相關性注意力時序模塊，用于對隨公司和職位變化的復雜的時間相關性進行建模。最后，在大規模公開互聯網數據集上進行了大量實驗，結果驗證了所提方法在細粒度人才需求預測方面的有效性，展示了其對招聘趨勢建模的可解釋性。

隨意打賞

百度推出AI搜索APP“梯子AI”，主打無廣告智能搜索

i黑馬 ? 36秒前

近日，百度旗下的AI搜索App“Tizzy.ai”完成了前期的測試，正式更名為“梯子AI”，定位為智能搜索助手，依托多個大模型能力開發而成。該應用主打無廣告智能搜索，整合深度思考、資源檢索及影視娛樂功能，主打“簡單搜索，一觸即達”。梯子AI提供“自動模式”和“深度模式”雙路徑搜索：前者快速響應簡單問題，后者針對復雜需求
百度暗藏了一支1200人的勁旅

虎嗅網 ? 2天前

?8月14日，在百度旗下“最質樸”的辦公地點鵬寰大廈，虎嗅見到了百度集團副總裁，文庫事業部、網盤事業部負責人王穎，她和她團隊的1200人平日里就在鵬寰大廈辦公。?多位業內人士和互聯網圈老炮兒，此前曾告訴虎嗅，這1200人，是目前百度內戰斗力最強的團隊之一。虎嗅了解到自2023年以來，百度文庫一直保持著盈利，在2024年
問道未有窮期星海即是歸途 | 2025百度商業AI技術創新大賽圓滿收官

砍柴網 ? 2天前

生成式AI重塑商業生態，多模態技術加速滲透，端到端解決方案需求激增——AI技術創新正當時。在人工智能從實驗室加速邁向產業應用深水區的關鍵階段，2025百度商業AI技術創新大賽為業界呈現了一場聚焦前沿技術與商業實踐深度融合的精彩盛宴。 8月22日，2025百度商業AI技術創新大賽在北京
百度上線蒸汽機2.0視頻生成大模型，實現多人有聲視頻一體化

i黑馬 ? 3天前

8月21日，百度宣布其音視頻一體化模型百度蒸汽機（MuseSteamer）完成重大升級，在行業內首次實現多人有聲視頻一體化生成。此次升級推出Turbo版、Lite版、Pro版及全系有聲版，并已全面開放。普通用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗相關服務，企業用戶則可在千帆平臺享受更高性能的視頻生成支持。
DPVR 全新 AI 眼鏡即將登場，百度云智大會揭秘三大核心亮點

砍柴網 ? 4天前

自2015年成立以來，DPVR（大朋 VR ）始終以“用科技拓展人類感知與連接的邊界”為理念，從VR設備到XR解決方案，在行業浪潮中持續進化。2025年，面對AI與智能終端的爆發式發展，DPVR再度出發，即將推出全新AI眼鏡產品。這款新品雖非VR設備，卻延
AI 創業“不可能三角”，被百度攻破：20 家未來獨角獸融資過億

砍柴網 ? 11天前

? GPT-5 發布，全球科技界目光重新聚焦 AI。在 AI 這場滔天巨浪里，每一家入局巨頭，都在思考怎么能跑得更快，并最終有機會到達終極理想。百度的選擇是——務實，為需求服務，用結果說話。當 AI 創業熱潮在各行業蔓延，從電商、游戲、在線教育，
鴻蒙版百度地圖新增小度語音、美食推薦，導航更智能，體驗更完善

砍柴網 ? 15天前

為持續優化智能導航服務，提升用戶體驗，鴻蒙版百度地圖于近日完成新一輪更新，新版本不僅新增小度語音及美食推薦功能，更在導航效果、歷史軌跡、公交導航、語音包等核心板塊實現全面迭代，旨在為用戶帶來更加精準便捷、更加個性化的導航服務。從指引到顯示全面進階，導航體驗煥然一新????小度語音：出門在外手里拎著大包小包時，
消息稱百度8月底前發布AI推理新模型

i黑馬 ? 17天前

據媒體報道，有知情人士稱，百度計劃在本月底（2025年8月底）前推出一款新的推理模型，該模型能夠處理更復雜的任務，以在與DeepSeek和OpenAI等公司的競爭中占據一席之地。此外，百度還計劃未來數月內發布文心基座大模型最新版，有內部人士指出，新模型大概率在百度世界大會上發布。文章評價匿名用戶發布發布
自動駕駛遇難題？A車企靠百度搜來了救兵； IPO 急剎車，E公司被鐘“敲”了；F車企員工出差住30塊招待所

雷鋒網 ? 19天前

自動駕駛遇難題？A 車企靠百度搜來了救兵A 車企早期攻關自動駕駛時，曾卡在地下車庫定位這道難題上 —— 車輛一進地庫就沒了信號，自動泊車功能直接歇菜。項目負責人四處求招兒，可那會兒業內能接這活兒的寥寥無幾。情急之下，團隊抱著死馬當活馬醫的心態，試著上度娘碰運氣。沒想到還真搜出了轉機：廣州有家定位公司接了茬，老板拍著胸脯
百度搜索首頁將全面開放智能體入口

i黑馬 ? 26天前

7月30日，《每日經濟新聞》記者獲悉，百度搜索電腦端正在首頁測試開放智能體應用入口。用戶可在搜索框下方的“AI應用入口”直接調用感興趣或已使用過的智能體。據內部人士透露，首頁集成的智能體主要來自文心智能體平臺、搜索開放平臺接入的外部優質AI應用、部分百度自研應用。目前該功能已在灰度測試（指先由特定人群試用，再逐步擴大試
高質量訓練集助力研究第七屆傳播數據挖掘競賽喊你報名！

砍柴網 ? 5月前

對于大模型而言，數據集作為機器學習和統計建模的基礎，是算法學習所需的“食材”。而對于智能與計算傳播學專業的師生而言，高質量的數據集是前沿課題研究中不可或缺的基礎資源。由中國新聞史學會智能與計算傳播專委會指導，中央民族大學新聞與傳播學院、微熱點研究院聯
第六屆傳播數據挖掘競賽報名通道開啟！

砍柴網 ? 1年前

由浙江工業大學與微熱點研究院聯合舉辦的第六屆傳播數據挖掘競賽正式啟動。報名截止時間為4月25日，感興趣的團隊可要抓緊時間報名啦！自2018年創辦至今，傳播數據挖掘競賽已舉辦五屆，吸引了來自北京大學、清華大學、復旦大學、帝國理工學院、哥倫比亞大學等國內外名校近600個團隊、2300余名學生參與。隨著參賽團隊數量的增加、覆
微美全息開發基于數據挖掘和神經網絡的數據分析與監測算法系統

砍柴網 ? 2年前

近年來，互聯網及其相關技術促進了計算機、網絡和通信的整合，數據處理總量越來越大，各產業的信息化程度越來越高，社會的數據化趨勢越來越明顯。面對海量數據，決策者很難直接從中提取有價值的知識，這導致對數據分析工具的強烈需求。數據挖掘是信息技術自然演進產生的高級數據分析工具。數據挖掘是從龐
微美全息開發基于人工神經網絡的數據挖掘聚類算法系統

砍柴網 ? 2年前

互聯網數據量呈爆炸式增長，數據對社會生產和生活的影響越來越大，數據挖掘技術的應用也越來越廣泛。數據挖掘過程是一個反復多次的人機交互過程，它包括定義問題、建立數據挖掘庫、分析數據、準備數據、建立模型、評估模型等。主要的數據挖掘算法包括關聯分析、序列模式挖掘、分類算法及聚類算法等。據了解，WIMI微美全息
容聯云知識圖譜Demo論文被數據挖掘頂級國際會議CIKM 2022錄用

砍柴網 ? 2年前

近日，信息檢索和數據挖掘領域的國際頂級學術會議CIKM公布了2022年Demo論文的錄用結果，容聯云人工智能實驗室（Cloopen Research）與南開大學合作的論文《DASH: An Agile Knowledge Graph System Disentangling Demands, Algorithms, D
干貨分享：數據挖掘淺談

人人都是產品經理 ? 3年前

編輯導讀：數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中通過算法搜索隱藏于其中信息的過程。本文作者圍繞數據挖掘展開分析，希望對你有幫助。豆豆和花花開了一家鮮花店。豆豆跟花花說：“情人節快到了，咱店都需要準備哪類情人節花束？每類花束需要準備多少？……” 花花回答道，“根據顧客分類，大致分為自信示愛、甜蜜上
中山大學聯合創鄰科技Galaxybase破萬億數據挖掘世界記錄

砍柴網 ? 3年前

數字經濟時代，數據成為關鍵生產要素。企業從海量數據中挖掘商業價值的需求越發迫切。但這些高維、異構、復雜關聯的數據給傳統大數據處理和關系型數據庫產品帶來了極大挑戰。中山大學聯合創鄰科技 “Galaxybase”圖數據庫，完成了萬億規模交易數據智能挖掘性能
數據挖掘頂會ICDM 2021獎項出爐：華人包攬頭獎，張成奇獲杰出服務獎

雷鋒網 ? 3年前

作者?| 王曄編輯 | 青暮近日，ICDM 2021公布了研究貢獻獎、杰出服務獎、10年最具影響力論文獎、最佳論文獎、最佳學生論文獎、DEI獎等多項大獎。其中，華人學者獲得包括杰出服務獎、最佳論文獎、最佳學生論文在內的眾多獎項！IEEE ?ICDM（全稱IEEE International Co
四種方法，用數據挖掘潛力用戶

人人都是產品經理 ? 3年前

編輯導語：如何才能高效地挖掘潛力用戶？現有的數據可以告訴我們用戶現狀如何，但這些表示現狀的數據卻不能成為我們判斷“潛力”的標準。那么我們如何利用數據分析來判斷潛力用戶？本文作者便總結了用數據挖掘潛力用戶的方法操作，一起來看一下。“挖掘一下，哪些客戶有潛力”是很多同學在日常工作中老大難問題。到底怎么算是有潛力？又該怎么用

評論

提交建議

數據挖掘國際頂會KDD 2021收錄結果公布 百度多篇論文入選

數據挖掘國際頂會KDD 2021收錄結果公布百度多篇論文入選