一、為什麼需要“信任”

傳統 User-CF 的核心假設是:

相似用户 = 好的推薦來源

但在真實系統中存在明顯問題:

  • 數據稀疏下,相似度極不穩定
  • 相似 ≠ 可靠(刷單、噪聲用户)
  • 用户行為具有明顯的“圈層”效應

在很多產品中(社交、社區、電商):

  • 用户之間存在 顯式或隱式關係
  • 朋友 / 關注 / 專家 的行為更有參考價值

這引出了 **基於信任的協同過濾(Trust-aware CF)**。


二、什麼是信任協同過濾

核心思想:

在用户相似度之外,引入用户間的信任權重,對信息來源進行加權。

信任可以來自:

  • 顯式信任:關注、好友、信任打分
  • 隱式信任:互動頻率、歷史採納率

模型本質:

評分預測 = 相似度 × 信任權重 × 行為

三、常見建模方式

1️⃣ 信任加權 User-CF(最經典)

預測公式:

[ \hat r_{u,i} = \bar r_u + \frac{\sum_{v \in N(u)} T_{u,v} \cdot S_{u,v} \cdot (r_{v,i} - \bar r_v)}{\sum_{v \in N(u)} T_{u,v} \cdot |S_{u,v}|} ]

其中:

  • (T_{u,v}):用户 u 對 v 的信任度
  • (S_{u,v}):相似度(如餘弦 / Pearson)

2️⃣ 信任傳播模型(Trust Propagation)

特點:

  • 信任具有 傳遞性
  • 好友的好友也可能可信

常見方法:

  • TidalTrust
  • MoleTrust

思想類似 帶衰減的圖傳播


3️⃣ 信任 + 矩陣分解(TrustMF)

在 MF 目標函數中加入信任正則:

[ \min ||R - UV^T||^2 + \lambda ||U||^2 + \gamma \sum_{(u,v)} T_{u,v} ||U_u - U_v||^2 ]

👉 工程上比純 Trust-CF 更穩。


四、信任數據的來源

來源 示例
顯式 關注、好友、信任打分
隱式 轉發、點贊、採納率
規則 認證用户、專家標籤

現實中通常:

信任不是 0/1,而是連續權重