一、為什麼需要“信任”
傳統 User-CF 的核心假設是:
相似用户 = 好的推薦來源
但在真實系統中存在明顯問題:
- 數據稀疏下,相似度極不穩定
- 相似 ≠ 可靠(刷單、噪聲用户)
- 用户行為具有明顯的“圈層”效應
在很多產品中(社交、社區、電商):
- 用户之間存在 顯式或隱式關係
- 朋友 / 關注 / 專家 的行為更有參考價值
這引出了 **基於信任的協同過濾(Trust-aware CF)**。
二、什麼是信任協同過濾
核心思想:
在用户相似度之外,引入用户間的信任權重,對信息來源進行加權。
信任可以來自:
- 顯式信任:關注、好友、信任打分
- 隱式信任:互動頻率、歷史採納率
模型本質:
評分預測 = 相似度 × 信任權重 × 行為
三、常見建模方式
1️⃣ 信任加權 User-CF(最經典)
預測公式:
[ \hat r_{u,i} = \bar r_u + \frac{\sum_{v \in N(u)} T_{u,v} \cdot S_{u,v} \cdot (r_{v,i} - \bar r_v)}{\sum_{v \in N(u)} T_{u,v} \cdot |S_{u,v}|} ]
其中:
- (T_{u,v}):用户 u 對 v 的信任度
- (S_{u,v}):相似度(如餘弦 / Pearson)
2️⃣ 信任傳播模型(Trust Propagation)
特點:
- 信任具有 傳遞性
- 好友的好友也可能可信
常見方法:
- TidalTrust
- MoleTrust
思想類似 帶衰減的圖傳播。
3️⃣ 信任 + 矩陣分解(TrustMF)
在 MF 目標函數中加入信任正則:
[ \min ||R - UV^T||^2 + \lambda ||U||^2 + \gamma \sum_{(u,v)} T_{u,v} ||U_u - U_v||^2 ]
👉 工程上比純 Trust-CF 更穩。
四、信任數據的來源
| 來源 | 示例 |
|---|---|
| 顯式 | 關注、好友、信任打分 |
| 隱式 | 轉發、點贊、採納率 |
| 規則 | 認證用户、專家標籤 |
現實中通常:
信任不是 0/1,而是連續權重。