網(wǎng)上有很多關(guān)于快手賣(mài)pos機(jī),因果推斷在快手推薦場(chǎng)景的應(yīng)用探索的知識(shí),也有很多人為大家解答關(guān)于快手賣(mài)pos機(jī)的問(wèn)題,今天pos機(jī)之家(www.dprolou.com)為大家整理了關(guān)于這方面的知識(shí),讓我們一起來(lái)看下吧!
本文目錄一覽:
快手賣(mài)pos機(jī)
導(dǎo)讀:推薦系統(tǒng)不可避免地存在偏差(bias)。一個(gè)用戶(hù)無(wú)論是在刷視頻、看資訊、還是在線(xiàn)購(gòu)物等基于推薦的場(chǎng)景中作出的選擇通常會(huì)產(chǎn)生各種偏差。比如用戶(hù)會(huì)偏向點(diǎn)擊位置靠前的內(nèi)容,也會(huì)偏向于點(diǎn)擊流行度比較高的內(nèi)容;另外由于推薦系統(tǒng)給用戶(hù)推薦的候選內(nèi)容只占整體內(nèi)容的一小部分,而用戶(hù)的點(diǎn)擊行為都是基于這樣一小部分候選集進(jìn)行的,所以這會(huì)產(chǎn)生選擇偏差。
添加小助手鏈接:https://wpz.h5.xeknow.com/s/3udZfR
1.免費(fèi)資料領(lǐng)取:點(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)合集】免費(fèi)領(lǐng)取《大數(shù)據(jù)典藏版合集》
回復(fù)【算法合集】免費(fèi)領(lǐng)取《互聯(lián)網(wǎng)核心算法合集》
2.添加交流群:點(diǎn)擊點(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)交流群】加入“大數(shù)據(jù)交流群”
回復(fù)【算法交流群】加入“算法交流群”
與此同時(shí),用戶(hù)交互日志是模型訓(xùn)練的基礎(chǔ),直接基于這部分觀(guān)測(cè)日志數(shù)據(jù)作為訓(xùn)練模型的樣本會(huì)導(dǎo)致訓(xùn)練的模型存在bias,導(dǎo)致給用戶(hù)推薦的內(nèi)容同樣存在bias,進(jìn)而整個(gè)系統(tǒng)會(huì)形成bias閉環(huán),在影響用戶(hù)體驗(yàn)的同時(shí),不利于系統(tǒng)生態(tài)的建設(shè)。
因此我們嘗試結(jié)合因果推斷來(lái)解決推薦系統(tǒng)中的bias問(wèn)題,本次分享的主題是因果推斷在快手推薦場(chǎng)景的應(yīng)用探索,旨在通過(guò)識(shí)別變量之間的因果關(guān)系來(lái)進(jìn)行糾偏。
具體將圍繞以下幾點(diǎn)展開(kāi):
背景介紹最新研究進(jìn)展因果推斷在快手的應(yīng)用總結(jié)與思考01背景介紹
首先和大家分享下因果推斷的背景。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
首先我們介紹一下因果推斷的定義。因果推斷主要研究如何更加科學(xué)得識(shí)別變量之間的因果關(guān)系,強(qiáng)調(diào)原因的唯一性。因果性和相關(guān)性是有一定的聯(lián)系與區(qū)別的,從他們的定義來(lái)看:因果性指的是在改變X后Y隨之也發(fā)生變化,我們稱(chēng)X是Y的因;相關(guān)性指在觀(guān)測(cè)到的數(shù)據(jù)分布中,若果我們觀(guān)測(cè)到了X的分布就可以推斷出Y的分布。因此從定義可以得出,相關(guān)性是對(duì)稱(chēng)的,即若X和Y相關(guān),則Y和X相關(guān);但是因果性是非對(duì)稱(chēng)的。相關(guān)性不一定說(shuō)明因果性,但是因果一般會(huì)在統(tǒng)計(jì)層面導(dǎo)致相關(guān)性。我們現(xiàn)有的機(jī)器學(xué)習(xí)中純數(shù)據(jù)驅(qū)動(dòng)的方法其實(shí)更多時(shí)候?qū)W習(xí)的是相關(guān)性,這就導(dǎo)致目前的深度學(xué)習(xí)模型的可解釋性較差。如果我們引入因果性結(jié)合相關(guān)性一起建模,從理論上來(lái)說(shuō)它的效果會(huì)比僅使用相關(guān)性建模要好,即會(huì)使模型的可解釋性變好,模型的魯棒性也有一定的提升。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
因果推斷可以被總結(jié)為三個(gè)層次。從問(wèn)題角度出發(fā),首先,因果推斷的第一個(gè)層次主要是探索變量之間的關(guān)系,即相關(guān)性。常規(guī)機(jī)器學(xué)習(xí)在應(yīng)用中主要學(xué)習(xí)的就是變量之間的相關(guān)性。第二個(gè)層次是研究實(shí)施某種干擾的效果,這一層次在營(yíng)銷(xiāo)領(lǐng)域使用得較多,典型的例子是uplift model。舉個(gè)例子,我們對(duì)某個(gè)地方或者某一群用戶(hù)發(fā)放優(yōu)惠券,我們考慮發(fā)多少優(yōu)惠券、對(duì)哪些人發(fā)放優(yōu)惠券,實(shí)施這一行為后產(chǎn)生的效果或者收益是否符合業(yè)務(wù)預(yù)期。這類(lèi)方法被稱(chēng)為干擾或者干預(yù)。第三個(gè)層次是從結(jié)果考慮原因,被稱(chēng)為反事實(shí)推斷,即如果我想得到某種結(jié)果我們應(yīng)該做什么改變?,F(xiàn)在大多數(shù)因果建模都是從這一層次來(lái)進(jìn)行探索。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
常用的因果推斷方法如上圖列舉所示。首先是基于加權(quán)的方法,典型代表是IPW。第二類(lèi)是基于匹配的算法,這里主要是無(wú)偏匹配。另外,還有基于樹(shù)模型來(lái)做因果推斷的方法,比如因果森林等。當(dāng)然,還有很多其他類(lèi)型的方法,由于這部分內(nèi)容不是本次分享的重點(diǎn),這里我就不一一列舉了。
02最新研究進(jìn)展
接下來(lái)我選取幾個(gè)代表性工作介紹一下因果推斷在推薦系統(tǒng)中最新的研究進(jìn)展。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
首先是在WWW21發(fā)表的DICE。DICE這一方法是基于causal embedding的解決方案。論文認(rèn)為用戶(hù)的交互行為可以被拆解為兩部分:由于視頻的流行度較高導(dǎo)致用戶(hù)基于從眾心理產(chǎn)生交互行為;用戶(hù)的純興趣導(dǎo)致的交互行為。我們可以進(jìn)一步抽象為基于interest和基于conformity的兩部分表征。那么問(wèn)題就轉(zhuǎn)化為如何構(gòu)建不同的數(shù)據(jù)集來(lái)分別學(xué)習(xí)interest和conformity的embedding。具體地,在構(gòu)造數(shù)據(jù)集時(shí)可以使用<user,pos_item,neg_item>三元組。當(dāng)用戶(hù)點(diǎn)擊了一個(gè)postive item且它的流行度比negative item更小,就認(rèn)為交互行為是基于興趣的;如果點(diǎn)擊的item的流行度大于negative item,那么這次交互是由從眾心理和用戶(hù)興趣疊加而成的。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
基于上述想法,可以把數(shù)據(jù)分為O1和O2兩部分,然后使用多目標(biāo)學(xué)習(xí)的框架來(lái)分別學(xué)習(xí)interest embedding和conformity embedding。其中,DICE將兩個(gè)embedding疊加在一起產(chǎn)生的向量表示作為主任務(wù),其單獨(dú)的2個(gè)embedding學(xué)習(xí)作為輔助任務(wù)。損失函數(shù)是將三個(gè)損失與一個(gè)正則項(xiàng)相加,其中discrepancy損失的目的是為了讓兩類(lèi)embedding具有區(qū)分性。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
第二個(gè)工作是華為在Recsys21發(fā)表的一篇論文,它的基本思路也是使用了causal embedding方案進(jìn)行建模。它的出發(fā)點(diǎn)是認(rèn)為系統(tǒng)的feedback表征可以分為bias和unbias兩部分,文章并沒(méi)有指出bias具體是哪類(lèi)bias,而是認(rèn)為bias表征的是所有feedback bias。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
在訓(xùn)練的時(shí)候,論文分別訓(xùn)練兩部分embedding;在infer的時(shí)候,僅僅使用無(wú)偏的embedding。具體來(lái)說(shuō),這篇工作從信息瓶頸的角度來(lái)構(gòu)造損失函數(shù)。信息瓶頸類(lèi)似于一個(gè)信息提取方式,該方法認(rèn)為輸入的信息包含很多噪聲,因此使用信息瓶頸將信息進(jìn)行壓縮,使得最后得到的表征信息量足夠大。在實(shí)現(xiàn)過(guò)程中基于互信息實(shí)現(xiàn),其中,互信息的物理含義是度量?jī)蓚€(gè)變量之間的相關(guān)性,如果兩個(gè)變量是強(qiáng)相關(guān)的,那么它們的互信息很大;反之,如果兩個(gè)變量幾乎相互獨(dú)立,那么它們之間的互信息就很少。作者構(gòu)造了上圖所示的損失函數(shù),它由四項(xiàng)組成。前兩項(xiàng)屬于信息瓶頸,它希望無(wú)偏表征不能過(guò)度擬合有偏輸入變量x,同時(shí)希望無(wú)偏表征能盡可能擬合目標(biāo)y。但無(wú)偏表征和輸入不能完全不相關(guān),所以這里在損失函數(shù)前添加了參數(shù)β進(jìn)行控制。第三項(xiàng)表示無(wú)偏表征和有偏表征要保持一定程度的獨(dú)立,使得它們有一定的區(qū)分性。第四項(xiàng)損失函數(shù)是基于bias對(duì)真實(shí)標(biāo)簽的預(yù)估也會(huì)有一定的輔助作用的想法。在推薦領(lǐng)域,bias不一定是完全有害的,其中一部分bias是有意義的,因此這里需要一個(gè)參數(shù)去控制bias的量級(jí)。文章通過(guò)KL散度以及一些理論推導(dǎo)將上述損失函數(shù)轉(zhuǎn)化為信息熵的形式,使得模型可以通過(guò)最小化變換后的損失函數(shù)來(lái)學(xué)習(xí)無(wú)偏表征和有偏表征。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
下面介紹的兩個(gè)工作從因果效應(yīng)的角度來(lái)解決糾偏問(wèn)題。首先是一篇發(fā)表在KDD21上的文章。它的基本想法與第一個(gè)工作相似,構(gòu)造因果圖的時(shí)候?qū)Ⅻc(diǎn)擊行為分為K->Y的用戶(hù)興趣匹配、I->Y的物品流行度以及U->Y的用戶(hù)從眾心理。論文希望用戶(hù)對(duì)item的點(diǎn)擊預(yù)估是基于純興趣匹配,因此我們需要去除存在bias的邊,即去除item流行度與用戶(hù)從眾性導(dǎo)致的bias。文章基于因果效應(yīng)理論給出解決方案如下,其中TE是總效應(yīng)、NDE是bias的直接效應(yīng),我們可以通過(guò)使用TE和NDE的差來(lái)得到無(wú)偏估計(jì)。事實(shí)上,NDE基于反事實(shí)假設(shè)的,即如果沒(méi)有基于興趣匹配的K->Y輸入而只包含U的從眾性和I流行度輸入,那么最終模型的預(yù)估是怎么樣的。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
模型建模方式也是多任務(wù)學(xué)習(xí)。在訓(xùn)練時(shí),上圖中間的模型作為主任務(wù),左右兩側(cè)分別是一個(gè)user塔和一個(gè)item塔分別作為輔助任務(wù)。user和item塔分別學(xué)習(xí)用戶(hù)特征和物品特征單獨(dú)作用下的預(yù)估輸出,它們的標(biāo)簽值與主任務(wù)使用的一致。根據(jù)前述公式推導(dǎo),在最終推斷時(shí)我們就需要將總效應(yīng)TE減去NDE即可,最終得到的計(jì)算公式如上圖所示。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
第四個(gè)工作和第三個(gè)工作解決方案相同,它解決的是“標(biāo)題黨”問(wèn)題。當(dāng)一個(gè)用戶(hù)點(diǎn)擊一個(gè)視頻,他可能是被標(biāo)題吸引進(jìn)來(lái),但實(shí)際上他對(duì)視頻內(nèi)容不感興趣。當(dāng)平臺(tái)上這類(lèi)視頻特別多時(shí)是非常影響用戶(hù)體驗(yàn)的。因此為了解決這個(gè)問(wèn)題,文章構(gòu)建了如上因果圖,e代表標(biāo)題,t代表視頻的內(nèi)容表征,u是用戶(hù)表征,Y是交互表征。我們的目標(biāo)是去除標(biāo)題e對(duì)Y的邊,使得user與item的匹配是基于純興趣匹配的。類(lèi)似第三個(gè)工作,文章使用TE減NDE的方式進(jìn)行推導(dǎo),得到unbias的輸出結(jié)果。另外,這篇工作也使用了多目標(biāo)建模方式。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
下面介紹的工作使用了第三類(lèi)解決方案,即采用后門(mén)機(jī)制結(jié)合貝葉斯概率模型來(lái)解決糾偏問(wèn)題。這篇文章發(fā)表在SIGIR21上,解決的是傳統(tǒng)流行度偏差問(wèn)題。在推薦系統(tǒng)中,流行度會(huì)影響物品是否曝光,也會(huì)影響用戶(hù)是否交互。作者認(rèn)為流行度高代表的內(nèi)容質(zhì)量通常比較高,所以流行度到點(diǎn)擊的邊需要被保留。但是物品是否被曝光應(yīng)該基于用戶(hù)的真實(shí)興趣,而與該物品的流行度無(wú)關(guān),所以流行度到物品的邊不應(yīng)該存在,這條邊是一個(gè)bias。文章的解決方案是使用了后門(mén)機(jī)制,使得最終的交互條件概率與流行度對(duì)內(nèi)容是否曝光的條件概率無(wú)關(guān)。我們基于這個(gè)工作做了一些改進(jìn)并落地,之后會(huì)詳細(xì)介紹算法的原理。
03因果推斷在快手的應(yīng)用
接下來(lái)介紹一下快手使用因果推斷在推薦場(chǎng)景下的探索。
1. 流行度debias
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
首先是流行度debias的工作。流行度偏差在推薦系統(tǒng)中十分常見(jiàn),我相信大家在各個(gè)業(yè)務(wù)中也面臨了同樣的問(wèn)題。頭部效應(yīng)嚴(yán)重就會(huì)導(dǎo)致熱門(mén)內(nèi)容曝光量較大,進(jìn)而導(dǎo)致訓(xùn)練日志被熱門(mén)內(nèi)容主導(dǎo),這對(duì)于長(zhǎng)尾內(nèi)容非常不友好。此外,模型會(huì)過(guò)度曝光頭部的視頻,因?yàn)橛行╊^部的視頻有可能已經(jīng)處于衰退期,它的pxtr已經(jīng)在下降,此時(shí)給予它太多曝光會(huì)導(dǎo)致低效率,浪費(fèi)曝光流量?;谶@兩個(gè)問(wèn)題,工業(yè)界有三種解決方案。首先是使用IPW,但這種方法依賴(lài)于流行度具體值,流行度值大小的變化使得權(quán)重值波動(dòng)較大,所以模型的方差很大,訓(xùn)練很難收斂。第二個(gè)方法是使用causal embedding方案,這類(lèi)方案需要?jiǎng)澐殖鰞煞N數(shù)據(jù)集。如最開(kāi)始的causal embedding論文使用無(wú)偏數(shù)據(jù)集,但是無(wú)偏數(shù)據(jù)很貴,也有其他工作嘗試基于觀(guān)測(cè)數(shù)據(jù)進(jìn)行處理后劃分不同數(shù)據(jù)集,但人為劃分?jǐn)?shù)據(jù)也會(huì)引入其他一些偏差。第三種方式是直接通過(guò)加特征或者加debias塔的方案建模流行度對(duì)模型的影響,類(lèi)似于之前youtube和google提出的建模方法,但是這種方式?jīng)]有完美的理論支撐,而且bias特征很難與其他輸入特征進(jìn)行平衡(bias特征可能被其他特征淹沒(méi))。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
因此我們引入了因果推斷的思想來(lái)進(jìn)行debias。流行度偏差的核心問(wèn)題是流行度偏差確實(shí)不利于學(xué)習(xí)用戶(hù)真實(shí)興趣,但流行度較高的視頻其內(nèi)容質(zhì)量較好;另外用戶(hù)有看熱門(mén)的需求,比如大家打開(kāi)微博、知乎或者脈脈等軟件都會(huì)去看看熱榜。我們的解決方案是在訓(xùn)練時(shí)去除流行度偏差對(duì)模型的負(fù)向影響,對(duì)應(yīng)于因果圖就是去掉Z到I的這條邊。又由于流行度高的內(nèi)容質(zhì)量其實(shí)是不錯(cuò)的,因此在infer 時(shí)會(huì)保留Z到C這條邊。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
接下來(lái)具體看一下訓(xùn)練的時(shí)候如何去消除流行度對(duì)模型的負(fù)向影響。結(jié)合上圖的因果圖來(lái)看,我們基于后門(mén)機(jī)制,使用一個(gè)do算子來(lái)表示消除流行度影響。具體推到過(guò)程如上圖,在公式中,第一步到第二步利用了貝葉斯概率公式,第二步到第三步是源于我們使用do算子消除了I與Z的關(guān)系,所以U和I與Z是獨(dú)立的,第三步到第四步是因?yàn)榱餍卸鹊南闰?yàn)在兩個(gè)因果圖中是不變的。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
另外我們將用戶(hù)、視頻與視頻流行度進(jìn)行解耦,將P(C|U,I,Z)條件概率轉(zhuǎn)化為匹配分與流行度的乘積。建模的數(shù)學(xué)公式如上圖所示,其中ELU’是一個(gè)激活函數(shù),流行度部分引入了γ參數(shù)進(jìn)行控制,并引入了pair loss對(duì)模型進(jìn)行訓(xùn)練。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
進(jìn)一步,我們可以將P(C|U,I,Z)的解藕結(jié)果帶入引入do算子的條件概率公式繼續(xù)進(jìn)行推導(dǎo),最終的表達(dá)式如上圖所示。我們可以發(fā)現(xiàn)最終的結(jié)果只與流行度的期望有關(guān),而流行度這個(gè)單變量的期望是一個(gè)常數(shù),對(duì)排序不產(chǎn)生影響。所以通過(guò)這個(gè)方法,我們已經(jīng)將流行度對(duì)模型的影響消除了。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
在infer階段,我們也使用了do算子,將流行度作為變量引入條件概率。具體地,我們針對(duì)流行度考慮了其變化趨勢(shì)對(duì)推薦的影響。這么做是希望模型與item的生命周期進(jìn)行結(jié)合,因?yàn)閕tem的流行度變化是呈現(xiàn)從逐漸增加到逐漸降低的過(guò)程。最終的模型infer得分是匹配得分與流行度的乘積。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
我們對(duì)比了干預(yù)后流行度對(duì)item的影響變化,上圖左側(cè)是沒(méi)有進(jìn)行糾偏的推導(dǎo),右側(cè)是進(jìn)行糾偏的推導(dǎo)。它們的主要差別在于因果圖中Z對(duì)I的條件概率,進(jìn)行糾偏操作后U,I與Z式獨(dú)立的,進(jìn)而就去除了流行度對(duì)item的曝光影響。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
在具體落地過(guò)程中,我們對(duì)模型進(jìn)行了進(jìn)一步改進(jìn)。比如損失函數(shù)使用了pointwise來(lái)替代pairwise,當(dāng)然這一選擇是基于業(yè)務(wù)表現(xiàn)的。此外,我們使用RELU來(lái)替代ELU’,因?yàn)橛写罅抗ぷ髯C明RELU+BN的效果好于ELU’。我們還將流行度變化趨勢(shì)從差值替換為計(jì)算梯度,這是因?yàn)椴钪祵?duì)低流行度內(nèi)容十分不友好。另外我們還把控了infer階段注入流行有益部分的內(nèi)容質(zhì)量。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
從實(shí)驗(yàn)結(jié)果來(lái)看,曝光提升或者下降的case是符合預(yù)期的。具體地,曝光下降最快的case大多是一些獵奇的或者低質(zhì)量的內(nèi)容。從實(shí)驗(yàn)結(jié)果圖來(lái)看,上圖橫軸從左至右分別代表的是曝光區(qū)間,越往右的曝光區(qū)間的曝光量越大。從圖中可以看出,對(duì)比各曝光區(qū)間的曝光item數(shù)量,中長(zhǎng)尾的曝光item數(shù)是增多的;對(duì)比各曝光區(qū)間的曝光量,中長(zhǎng)尾item的曝光量也是提升的,而頭部視頻或者流行度較高視頻的曝光量提升主要是因?yàn)閕nfer的時(shí)候我們特意引入流行度導(dǎo)致。另外我們還針對(duì)效率進(jìn)行可視化,發(fā)現(xiàn)中尾部的視頻對(duì)應(yīng)的pxtr的提升更大,這也符合我們的預(yù)期。
2. 因果表征解耦
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
第二個(gè)工作我們引入causal embedding思想,基于DICE針對(duì)落地進(jìn)行了一些改進(jìn)。具體地,我們將用戶(hù)消費(fèi)視頻的行為拆解為基于興趣(interest)以及基于從眾心理(conformity)。在這樣的假設(shè)下,主要問(wèn)題就轉(zhuǎn)化為如何構(gòu)造訓(xùn)練兩個(gè)embedding的數(shù)據(jù)集。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
首先,針對(duì)feedback相關(guān)的正負(fù)樣本的構(gòu)建,我們會(huì)去統(tǒng)計(jì)用戶(hù)點(diǎn)擊視頻的reward,它是由用戶(hù)觀(guān)看時(shí)長(zhǎng)和互動(dòng)的綜合打分進(jìn)行定義的。對(duì)于conformity相關(guān)的正負(fù)樣本的構(gòu)建,我們使用like數(shù)進(jìn)行定義,如果正樣本的like數(shù)比較多那么就將其作為conformityembedding的訓(xùn)練集,如果一個(gè)正樣本的like數(shù)小于負(fù)樣本,但是它的reward更大,那么我們認(rèn)為用戶(hù)是基于興趣去點(diǎn)擊這個(gè)item的,從而得到interest embedding的訓(xùn)練集。我們使用like數(shù)的原因是源于我們認(rèn)為用戶(hù)是否喜歡一個(gè)視頻最直觀(guān)的感知就是點(diǎn)贊行為。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
在訓(xùn)練的時(shí)候,我們沿用了DICE的多任務(wù)訓(xùn)練范式,其中feedback loss作為主任務(wù),同時(shí)使用如上所述定義的兩個(gè)數(shù)據(jù)集分別對(duì)conformity和interest embedding進(jìn)行訓(xùn)練。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
上圖展示了我們的實(shí)驗(yàn)效果,可以發(fā)現(xiàn)兩類(lèi)embedding的可視化表明了它們之間有明顯的區(qū)分性。我們也對(duì)conformity embedding和流行度的相關(guān)性進(jìn)行了可視化,不同的顏色表示不同的流行度。我們也可以觀(guān)察到不同流行度的item,他們的embedding也具有一定的區(qū)分性。
3. 視頻完播率debias
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
第三個(gè)工作是基于視頻完播率的debias。它的背景是源于我們?cè)诤芏鄻I(yè)務(wù)場(chǎng)景中,如單列短視頻場(chǎng)景,視頻是自動(dòng)播放的,不需要用戶(hù)點(diǎn)擊。這種情況下會(huì)導(dǎo)致我們很難去定義什么樣的播放時(shí)長(zhǎng)可以作為正樣本。比較直觀(guān)的方法是人為設(shè)定一個(gè)閾值,但是這存在著一定的bias,比如對(duì)于長(zhǎng)視頻而言這種方式偏差很大。因此,我們使用播放完成率來(lái)衡量用戶(hù)對(duì)于視頻的偏好。但事實(shí)上,基于完播率的這種做法天然對(duì)短視頻是友好的。如上圖右側(cè)所示,短視頻的完播率比長(zhǎng)視頻高出許多。所以這導(dǎo)致我們?nèi)ニ伎既绾味x正負(fù)樣本以及如何對(duì)不同長(zhǎng)度視頻的完播率進(jìn)行消偏。
編輯切換為居中
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
首先,針對(duì)正負(fù)樣本的定義,我們需要設(shè)定一個(gè)對(duì)于各長(zhǎng)度視頻均適用的判別方式。此外,它需要有一定的判別性,并且具有一定的物理意義。上圖右側(cè)是我們對(duì)某長(zhǎng)度視頻的完播率與對(duì)應(yīng)播放日志數(shù)的關(guān)系圖。我們可以看到它是一個(gè)明顯的雙峰分布,也就是說(shuō)如果我們?cè)陔p峰中間選擇一個(gè)閾值對(duì)其進(jìn)行切分是可以很容易地將正負(fù)樣本區(qū)分開(kāi)的。我們?cè)趯?shí)際使用時(shí)統(tǒng)計(jì)了對(duì)應(yīng)視頻時(shí)長(zhǎng)下的平均完播率,使用在這個(gè)數(shù)值來(lái)作為切分閾值。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
第二個(gè)問(wèn)題是對(duì)不同長(zhǎng)度視頻的完播率進(jìn)行消偏。我們認(rèn)為bias的本質(zhì)是樣本分布不均勻,而消偏可以通過(guò)一些加權(quán)的方法使得treatment和control組的分布差異盡量減小。這里我們使用了經(jīng)典的IPW方法,具體來(lái)說(shuō),我們使用不同視頻時(shí)長(zhǎng)的完播率來(lái)定義IPW的權(quán)重,將其加入損失函數(shù)進(jìn)行加權(quán)從而進(jìn)行debias。
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
最終的實(shí)驗(yàn)結(jié)果表明消偏后播放視頻數(shù)以及完播數(shù)都有明顯的提升,另外不同長(zhǎng)度的視頻對(duì)應(yīng)的完播率也有上升。
04總結(jié)與思考
最后,我來(lái)總結(jié)一下我們的工作并提出一些個(gè)人的思考。
首先,我們?cè)诳焓滞扑]場(chǎng)景首次落地因果推斷。上述工作是因果推斷在快手推薦場(chǎng)景的一些成功的探索,它提供了一套糾偏框架落地的pipeline,除了傳統(tǒng)的item側(cè)消偏,我們對(duì)用戶(hù)維度的糾偏并也取得了一定收益。目前,因果推斷在推薦中的應(yīng)用目前較少,從學(xué)術(shù)界也很難拿到可以落地的方法,而在營(yíng)銷(xiāo)領(lǐng)域有比較多的落地應(yīng)用,這可能是因?yàn)樵跔I(yíng)銷(xiāo)領(lǐng)域的場(chǎng)景中,它們的treatment很好定義,但是在推薦場(chǎng)景下就很難被定義。此外,推薦中使用的評(píng)估方法和因果評(píng)估不一致。推薦系統(tǒng)的評(píng)估注重排序,例如AUC等指標(biāo)。
目前因果推斷在推薦系統(tǒng)的應(yīng)用存在以下三個(gè)問(wèn)題:
對(duì)于一些bias如流行度、曝光偏差,我們需要掌握好debias的度;現(xiàn)在的糾偏大多是大點(diǎn)進(jìn)行的,缺少一套完整的糾偏系統(tǒng),目前已有的一些工作很難在工業(yè)界進(jìn)行落地;因果推斷對(duì)于解決信息繭房難題目前還很難去解決。我們現(xiàn)在的推薦系統(tǒng)更多還是迎合式的推薦,即我們會(huì)根據(jù)用戶(hù)的喜好推薦內(nèi)容,取悅用戶(hù),進(jìn)而導(dǎo)致我們無(wú)法解決信息繭房的問(wèn)題。如果我們的推薦策略由迎合式轉(zhuǎn)變?yōu)橐龑?dǎo)式,即系統(tǒng)可以引導(dǎo)用戶(hù)對(duì)item進(jìn)行交互,那么我們可以在一定程度上解決信息繭房問(wèn)題。05精彩問(wèn)答
Q:如何驗(yàn)證學(xué)習(xí)到的interest embedding和conformity embedding的準(zhǔn)確性?
A:我們是通過(guò)可視化來(lái)觀(guān)察embedding是否符合我們的預(yù)期。從之前展示的embedding可視化結(jié)果圖中我們可以發(fā)現(xiàn),模型學(xué)習(xí)到的兩類(lèi)embedding在二維空間上可以被明顯地區(qū)分,與此同時(shí)item的流行度與conformity embedding的相關(guān)性在流行度區(qū)間之間也具有區(qū)分性。
Q:Debias會(huì)不會(huì)在一定程度上對(duì)某些業(yè)務(wù)指標(biāo)產(chǎn)生負(fù)作用?
A:Bias不一定全是對(duì)模型有害的,例如流行度其實(shí)對(duì)推薦是有收益的。假如你糾偏過(guò)度,那么實(shí)際上你會(huì)降低系統(tǒng)的整體收益的;與之相反,如果你糾偏不夠的話(huà)有無(wú)法解決bias問(wèn)題。這就是為什么因果推斷很難在推薦中落地,因?yàn)檫@需要根據(jù)具體業(yè)務(wù)不斷地對(duì)糾偏程度進(jìn)行調(diào)整。
Q:點(diǎn)擊行為和like行為都是非常稀疏的,那么對(duì)于長(zhǎng)尾item應(yīng)該如何進(jìn)行糾偏?
A:我們針對(duì)流行度糾偏做了兩個(gè)工作。第一個(gè)工作是基于后門(mén)機(jī)制,我們可以看到它對(duì)于中長(zhǎng)尾item是有明顯收益的。而第二個(gè)工作是從輸出表征的角度進(jìn)行糾偏的。我們可以看到這兩個(gè)工作的出發(fā)點(diǎn)不一樣,第一個(gè)工作是在系統(tǒng)層面建模debias,而第二個(gè)工作是從交互中建模用戶(hù)不同的意圖。針對(duì)長(zhǎng)尾item的糾偏,我認(rèn)為第一個(gè)工作的方法會(huì)對(duì)長(zhǎng)尾item更友好并且更加可控。
今天的分享就到這里,謝謝大家。
在文末分享、點(diǎn)贊、在看,給個(gè)3連擊唄~
分享嘉賓:
添加圖片注釋?zhuān)怀^(guò) 140 字(可選)
分享嘉賓:趙煒琪 快手 算法專(zhuān)家
編輯整理:吳祺堯
出品平臺(tái):DataFunTalk
添加小助手鏈接:https://wpz.h5.xeknow.com/s/3udZfR
1.免費(fèi)資料領(lǐng)?。狐c(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)合集】免費(fèi)領(lǐng)取《大數(shù)據(jù)典藏版合集》
回復(fù)【算法合集】免費(fèi)領(lǐng)取《互聯(lián)網(wǎng)核心算法合集》
2.添加交流群:點(diǎn)擊點(diǎn)擊上方鏈接添加小助手回復(fù)【大數(shù)據(jù)交流群】加入“大數(shù)據(jù)交流群”
回復(fù)【算法交流群】加入“算法交流群”
以上就是關(guān)于快手賣(mài)pos機(jī),因果推斷在快手推薦場(chǎng)景的應(yīng)用探索的知識(shí),后面我們會(huì)繼續(xù)為大家整理關(guān)于快手賣(mài)pos機(jī)的知識(shí),希望能夠幫助到大家!
