添加時間:2013/9/7 10:35:21 編輯:奇億網(wǎng)站建設公司
Netflix讓國人廣泛關(guān)注莫過于利用大數(shù)據(jù)分析技術(shù)“算出來”的自制原創(chuàng)劇《紙牌屋》的火爆。紙牌屋有多火,網(wǎng)上搜一下。而實際上Netflix最擅長的是它非常厲害的視頻推薦算法,估計這也是Netflix作為全球十大視頻網(wǎng)站中唯一收費站點的重要原因。
提到推薦算法,很容易想到搜索引擎的相關(guān)搜索推薦,各類網(wǎng)站相關(guān)推薦插件(百度的百度推薦、阿里的云推薦等),各自網(wǎng)站開發(fā)的相關(guān)文章閱讀推薦等,多基于關(guān)鍵詞廣泛匹配來推薦,各類在線視頻網(wǎng)站,大部分“你可能喜歡看”、“看xxx的還喜歡看”等推薦,也多根據(jù)演員、導演及視頻所屬標簽等推薦。
為了打造比搜索引擎更精準的推薦引擎,Netflix曾兩次公開懸賞百萬美元,只為提供更精準的推薦算法。推薦引擎也成為Netflix的一個標志。很多人都想要了解在浩如煙海的大數(shù)據(jù)及評分星級的背后,Netflix是如何利用其算法來向用戶作出推薦的?
Netflix個性化算法副總裁卡洛斯·葛梅茲-烏里韋(Carlos Gomez-Uribe)的一些回答整理:
1、查找相似性
通過查閱元數(shù)據(jù)找到各種各樣的相似性。比如兩部電影是不是在同一時間被創(chuàng)作的?是不是傾向于擁有相同的評分?此外,你還可以查看用戶行為——瀏覽、播放和搜索等,從而找到它們之間的相似性。
2、鑒別視頻特點并標記分類
有員工專門負責以人工方式來對電視劇和電影進行標記。
3、個性化追蹤用戶觀看歷史
我們能知道你播放和搜索過哪些視頻,對哪些視頻進行了評分。我們還知道你播放視頻的時間、日期和使用的設備。我們甚至還會追蹤用戶交互活動,如瀏覽或滾動等行為。
4、推薦引入上下文環(huán)境
在一個星期中的不同日子,在一天的不同時間段,用戶的觀看行為都會有所不同;此外,他們的觀看行為還會隨著設備的改變而有所差異,有時候甚至用戶所在的位置也會產(chǎn)生影響。
5、預測評分并非最重要指標
問:為什么我會在推薦中看到如此之多的三星級甚至是兩星級的電影呢?
答:人們喜歡把《辛德勒的名單》等電影的評分打得很高,而不是我喜歡看的《熱浴盆時光機》惡搞喜劇片。如果你只向用戶推薦四星級或五星級電影,并不意味著他們工作一天以后還想看那樣的電影。