满舰饰真子 说: 咋看?
Mr.Tang 说: 我在想啊,如果对方的收藏和自己完全一样,打的分却完全相反,这算是口味一样嘛
芥末酱油丸 说: 赞!能不能麻烦也看一下我的呢??
Genius、小乖 说: Oh it looks nice! You can start thinking about onboarding your similarity retrieval system to produc...
Hentyclopedia 说: ('apocalypse_shu', 1.0, False), ('grubstreet', 0.96718556, True), ('oisris', 0.96701944, False), ...
芥末酱油丸 说: 挺有趣的,不过我的和上面层主的list里有些可疑的overlap。。。比如小寒和sai,不知是什么原因
Hentyclopedia 说: 可能是我模型的原因,因为我训练时刻意让互为好友的人Euclidean距离更近一些(虽然同步率算的是cosine similarity也就是夹角,不过拿来做求同步率的东西感觉有点cheating?),我...
@小乖
('grubstreet', 0.96718556, True),
('oisris', 0.96701944, False),
('sai', 0.96666586, True),
('18128', 0.96472096, False),
('akito_sakurai', 0.96318054, True),
('vince19', 0.96296251, False),
('233550', 0.96281499, False),
('kurichan', 0.96090686, False),
('haohao69', 0.96029615, False),
('saker', 0.95996654, False),
('rainshiner', 0.9594872, False),
('zq0504032', 0.95921475, False),
('nakedbaby', 0.95883942, False),
('lasteaster', 0.9579131, False),
('wenzhlove', 0.95676237, False),
('shameimaruaya', 0.95622432, False),
('chu2otaku', 0.95606077, False),
('ethereal', 0.95588112, False),
('wyxacl', 0.95552611, False)
我训练时还加了一些social regularization来增强泛化能力,来让互为好友且Pearson correlation比较大的人在latent space上距离近一些,而且让有关联的动画(比如第一季和第二季)在latent space上距离也近一些,结果是加上这些确实有助于减小validation set上的RMSE
然后我试着在latent space上跑了下K-means看看能不能把用户分类,最后感觉分四类差别比较明显,然而除了平均评分的差别以外没什么太大的收获,大致可以分为
A类:高分党,占大约40%的人
B类:中高分党,占大约17%的人
C类:中低分党,然而里番高于B类,肉番还有后宫只比B类少一点,占大约25%的人
D类:低分党,占大约18%的人
考察了一下这四类之间好友关系的密度,发现BD两类占了75%的好友关系,隐隐感到给工口条目评分高的人不大爱加好友