花費(fèi)百萬的Netflix推薦系統(tǒng),有那些值得借鑒的特性

2006年,一家通過租用傳統(tǒng)DVD影片發(fā)跡的網(wǎng)站netflix宣布了一個消息:他們將舉辦一次大賽,第一個能夠?qū)⒃摼W(wǎng)站推薦效果提升10%的團(tuán)隊(duì)將會獲得100萬美元的獎金。消息甫一公布,世界各地的團(tuán)隊(duì)無不踴躍參與,紛至沓來。最終,歷經(jīng)三年時間,前后一百八十多個團(tuán)隊(duì)的較量,一支名叫“BPC”的團(tuán)隊(duì)率先突破障礙,以10.06%的改進(jìn)效果獲得了這份百萬大獎。他們算法是怎么做到的呢,讓我們留個懸念,文章結(jié)尾再做說明。
而通過這次百萬大獎賽,netflix升級了自家網(wǎng)站的算法,在工程師中塑造了財(cái)大氣粗的大公司形象,發(fā)掘了無數(shù)優(yōu)秀算法人才,可謂一舉多得。更重要的是,它向用戶普及了“推薦”這個概念,并在用戶心目中將推薦這個概念與netflix網(wǎng)站劃上了等號,從此用戶使用netflix時對它的推薦系統(tǒng)有了更直觀的價(jià)值參照物——一百萬美金,天然產(chǎn)生信任感和參與感,不可不謂高明之至。
下面,就讓我們看看,netflix耗時三年開發(fā)、花費(fèi)百萬、吸引無數(shù)業(yè)界精英關(guān)注的推薦系統(tǒng)都有哪些特性。
為每個用戶建立畫像
打開netflix,首先彈出的是角色選擇窗口,通過一句親切的詢問”who’s watching“,netflix迅速定位到用戶的年齡、性別、過去看過的視頻,甚至好友信息,并據(jù)此產(chǎn)生一個瀑布流主頁,結(jié)合獲取到的信息為用戶推薦符合口味的影片和電視劇。
讓用戶知道為什么而推薦
Netflix推薦系統(tǒng)中一個非常重要的特性就是”推薦理由“,在每個推薦板塊中,用戶能夠清楚地知道為什么獲得這些推薦結(jié)果。這些理由都是些口語化的句式,比如:”因?yàn)槟憧催^**“,”我們猜你喜歡**“等等。這個舉措不但會給用戶帶來信任感,還會鼓勵他們更積極地參與到推薦互動中來,給予更多有效反饋。

注重多樣性
如果認(rèn)為netflix的推薦就是一行一行視頻海報(bào)組成的瀑布流,那你就錯了,它的推薦綜合了多種形式,并且很注重多樣性。同一個首頁中,不僅會根據(jù)用戶曾經(jīng)看過什么、也許會有的喜好推薦,netflix還專門開辟區(qū)域,為用戶推薦當(dāng)天或當(dāng)周最熱的視頻-即topN為用戶推薦。這些舉措在最大限度滿足用戶喜好的同時,為發(fā)現(xiàn)更多用戶喜愛影片提供了可能。

利用好友鏈
Netflix鼓勵使用facebook登陸,因?yàn)橐粋€Facebook賬號在帶來用戶身份特征的同時,還有一項(xiàng)非常重要的作用,那就是它所關(guān)聯(lián)的好友圈,這個圈就是用戶的互聯(lián)網(wǎng)社交圈,所謂物以類聚人以群分,通過好友們正在觀看的視頻,能更準(zhǔn)確地推算用戶喜好。
Genre系統(tǒng)
這是netflix最強(qiáng)大,也是最核心的推薦理念之一。這些“基因”可以廣泛如“喜劇”、“正劇”這些包括成千上萬的分類概念,也可以細(xì)分如”80年代的時間旅行科幻電影“這種主題。每個基因下限制一個影片集合,再按照影片本身屬性與該基因吻合程度排序。
一個用戶會看到什么樣的基因內(nèi)容呢?這個就要結(jié)合前面所有特征:用戶角色、瀏覽歷史、多樣性、好友信息等等,再糅合保證讓用戶有足夠新鮮感的更新特征,最終選擇合適的genre展現(xiàn)在用戶面前。在用戶瀏覽每個基因下的影片時,netflix還會采取手段吸引用戶為基因的合理性打分。

相似度系統(tǒng)
Netflix除了top N和genre系統(tǒng)外,還有一個重要的推薦形式,被netflix穿插在推薦系統(tǒng)中,那就是相似度推薦。這個相似度推薦可以是兩個影片的相似度,也可以是兩個用戶的相似度,它可以出現(xiàn)在播放頁里,也會出現(xiàn)在搜索結(jié)果中,甚至首頁timeline中,作為一個genre出現(xiàn)。
推薦系統(tǒng)發(fā)展到現(xiàn)在,已經(jīng)是一個擁有無數(shù)工程師、眾多分支共同發(fā)展的成熟體系,它在大部分網(wǎng)站中也均有應(yīng)用。以上提到的種種特性,可以說是凡有推薦網(wǎng)站都會或多或少采用的推薦措施。
但是Netfilx推薦系統(tǒng)的強(qiáng)大之處在于它的將這些特性完美地綜合在了一起,在主頁上你會看到topN型的推薦,也會看到genre型推薦,還會看到根據(jù)歷史的相關(guān)推薦,但它同時保持了界面的簡潔,每個推薦都有適當(dāng)?shù)睦碛桑屇阋谎劬椭浪鼮槭裁磿霈F(xiàn)在timeline里。這正符合了推薦的作用:讓用戶最快最簡便地找到所需信息。
結(jié)語
最后,讓我們揭開懸念,看看價(jià)值百萬美金的算法究竟是什么樣子:獲勝團(tuán)隊(duì) BPC 的算法的高明之處在于考察了用戶評級數(shù)據(jù)中的時間和“頻率”, 用戶在為影片打分時往往帶有情緒影響,而情緒是與時間有關(guān)的。
另外, 用戶的口味也許隨著時間的變化而變化; 對比一位用戶五年之前的打分和他最近的打分,肯定他最近的打分更為準(zhǔn)確地反映了他當(dāng)前的好惡標(biāo)準(zhǔn),在決定他明天可能喜好哪些電影時所起的作用更大。于是 BPC 團(tuán)隊(duì)就研究用戶評分的結(jié)果與他們打分的時間以及頻率之間的關(guān)系,建立了相關(guān)性模型。
比如用戶在周一和周五在打分時所用的標(biāo)準(zhǔn)有差異,有些用戶在周日的情緒最好,這時所打的分?jǐn)?shù)比平時偏高。通過這樣的分析,他們能更精確地發(fā)現(xiàn)用戶對電影的喜好口味,進(jìn)而對他們打分的規(guī)律預(yù)測得更為準(zhǔn)確。
據(jù)我所知,netflix已經(jīng)發(fā)布了第二次百萬大獎賽的懸賞。這一次,這個以傳統(tǒng)DVD租賃開始,卻以先進(jìn)推薦技術(shù)笑傲群雄的網(wǎng)站,又會給我們帶來什么驚喜呢,讓我們拭目以待。
?
作者:linz,來自樂視創(chuàng)新與用戶體驗(yàn)研究院(LetvIUEI)。樂視IUEI是一個技術(shù)交流平臺,將第一時間向行業(yè)展現(xiàn)樂視最新的技術(shù)成果、項(xiàng)目經(jīng)驗(yàn)與工作感悟。微信ID:LetvIUEI
本文由@linz 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。