～技术宅真可怕～ » 讨论
有没有可能通过machine learning用bangumi的数据预测动画评分？

#1 - 2018-11-16 09:46

本子战士 (B站难民)

X可以是作品的meta data，Y是评分

========================

这里的meta data包括但不限staff表，制作公司，staff履历，作品时间。但是不包括作品内容。

========================

突然炸出来好多ML的大佬。。。。

========================

再解释一下，并不是想为动画质量做AI评分，而是以整体性的视角预测bangumi群体对某一作品的评分。
如果有读过《基地》系列的，可以类比里面的心理史学。

#2 - 2018-11-16 09:52

windrises (一个纠结的面瘫伪宅)

我曾经认真考虑过这个问题，不过也只限于脑内yy
如果是拿历史评分数据来预测，感觉可能还不如来个直接的时间序列分析之类的方法预测得准，或者还不如自己观察一下评分走势来的实在，而且新番没法预测，也就失去了很大的意义
如果是拿staff，比如导演，原作，脚本，原画，制作公司，以及bgm上的标签等信息来做，感觉很难预测准 (bgm38)

#2-1 - 2018-11-16 10:18

> 时间序列分析之类的
是說對全視頻嗎? 比較擔心運算量呢.
感覺像碼率這些直接信息用視頻壓縮方法就可以提取到的特徵沒有全部放進運算.
而像是情節什麼的又因為數據量太小(幾萬部番?)、且沒有準確的supervision、得不出有意義的結果.

(剛意識到「監督」有歧義 (bgm38)

)

#2-2 - 2018-11-16 10:19

不過 unsupervised 提取特徵感覺也是一個方法, 這些說不定可以和 staff 信息很好得互相補充.

#2-3 - 2018-11-16 10:19

本子战士

个体的评分很难预测，但是群体的行为应该是具有可预测性吧？

#2-4 - 2018-11-16 10:19

總之考慮到運算量, 感覺需要非常精巧的學習結構的設計,才能有效.

#2-5 - 2018-11-16 10:26

本子战士说: 个体的评分很难预测，但是群体的行为应该是具有可预测性吧？

我猜 @windrises 說的是 staff data 太稀疏了. 即使有規律也做不好.

#2-6 - 2018-11-16 10:27

本子战士说: 个体的评分很难预测，但是群体的行为应该是具有可预测性吧？

事實上我覺得不僅太稀疏、還有太多的隱藏緯度, 比如: 不同 staff 在不同時間的發展不同.

#2-7 - 2018-11-16 10:30

本子战士

Willian 说: 事實上我覺得不僅太稀疏、還有太多的隱藏緯度, 比如: 不同 staff 在不同時間的發展不同.

问题应该是在对于一名正常staff，他每年的作品也不太会超过十部，数据量不足以训练model吧

#2-8 - 2018-11-16 10:34

本子战士说: 问题应该是在对于一名正常staff，他每年的作品也不太会超过十部，数据量不足以训练model吧

正是如此, 說起來你是在考慮用樹方法嗎? regression tree 之類的.

#2-9 - 2018-11-16 10:36

本子战士

Willian 说: 正是如此, 說起來你是在考慮用樹方法嗎? regression tree 之類的.

只是一个idea，并没想好具体要怎么做。大概就是只差一个程序员可以创业的水平。

#2-10 - 2018-11-16 13:07

th3ta "Paradox"

X 里面应该也要包含 Y(t-1) 之类的东西，因为过去的评分一般可以预测未来的评分，这确实有点 time series 的成分在里面，不过我觉得还是做一个季度整体的 dynamic panel data 更好，时间序列本身大概率 inconsistent ...
不过统计模型的前提都是我们可以搞清楚数据的情况：例如评分是不是一个 stationary & ergodic process, error 是不是 conditionally homoskedastic & uncorrelated, 其他 regressors 是不是 endogenous 之类的；另外评分只能在 [0, 10] 之内，所以一般 estimator 都不太好（就类似于 OLS linear probability model 预测 binary dependent variable 不如用 logit 那样），所以我们还必须去找某种不知道是否存在的冷门 estimator... 这种事情太可怕了，还是ML更友好...
话说回来，我对ML不太放心的地方在于这东西就是个黑盒子，基本上无法理解到底发生了什么（或者为什么机器这样学习是对的），我们根本就不知道这个 estimator (?) 的 asymptotic behavior，所以也就不知道究竟是否该相信这个预测，但做了半天预测评分却没办法说服自己去相信这个预测就太悲剧了，得出结论是玄学更好 (bgm38)

#2-11 - 2018-11-16 16:37

th3ta "Paradox" 说: 预测，但做了半天预测评分却没办法说服自己去相信这个预测就太悲剧了，得出结论是玄学更好 (bgm38)

其實只是用來參考不做重要決定的話「不能相信」也無所謂?

#2-12 - 2018-11-16 16:45

th3ta "Paradox" 说: X 里面应该也要包含 Y(t-1) 之类的东西，因为过去的评分一般可以预测未来的评分，这确实有点 time series 的成分在里面，不过我觉得还是做一个季度整体的 dynamic panel da...

當成「time series」的意義我有點不明了、像是 seasonality 之類真實和 time 有關的情報其實存在嗎?

#2-13 - 2018-11-16 16:49

看到你說 time series, 突然意識到「时间序列分析」其實就是這個.

腦補過多以為是 RNN 了.
總之 RNN 放到下面視頻流那邊討論吧.

#2-14 - 2018-11-16 21:20

本子战士

ML并不是黑箱吧。只是现在Deep learning是黑箱吧？还是有ML模型是有理可依的。

#2-15 - 2018-11-17 09:58

th3ta "Paradox"

Willian 说: 當成「time series」的意義我有點不明了、像是 seasonality 之類真實和 time 有關的情報其實存在嗎?

我忽然我发现我们想的不太一样... 我想的是“动画开播之后实时预测评分”，所以才会有用前一天评分预测后一天评分的想法；而你想的可能是“在动画开播之前预测这部作品完结时候会得到什么评分”，所以并不需要考虑时间序列（

#2-16 - 2018-11-17 10:05

th3ta "Paradox"

本子战士说: ML并不是黑箱吧。只是现在Deep learning是黑箱吧？还是有ML模型是有理可依的。

不，我的表达能力有问题，我其实想说的是 Large Sample Property 的问题... 传统的 parametric 统计模型都可以通过概率论那些东西去证明 estimator 的 asymptotic behavior，由此可以说明在数据量增大的时候预测结果会越来越准确，也可以用 Monte Carlo Experiment 直观展示 n large 会提高预测准确度；然而据我所知（可能我是错的），ML的神经网络这一大类的模型都似乎都不遵循这套东西，一方面是因为两者的基本框架不同，另一方面则是因为两者处理的数据类型不同（传统统计模型自然做不到识别图片的输入，只能以数据作为输入，这样看来ML自然要更高级更复杂），而这样的后果就是... 我不太敢说“有理论证明这个神经网络模型的预测结果会随着数据的增大而越来越准确”，当然也可能只是我没见过，毕竟我没学过CS

#2-17 - 2018-11-17 10:51

th3ta "Paradox" 说: 我忽然我发现我们想的不太一样... 我想的是“动画开播之后实时预测评分”，所以才会有用前一天评分预测后一天评分的想法；而你想的可能是“在动画开播之前预测这部作品完结时候会得到什么评分”，所以并不需要考...

👍

#2-18 - 2018-12-21 05:10

kazami kazuki

国内的话，脏数据太多。如果从用户开始挖掘，损失太大
蹲了两年，补番经验来看好番并不是很多。可以对动画基本信息 staff 建立图和各种大数据label 手动调参实现模型
其实角色也很重要，拿il2vec解析分类一下做成网络图也是可以的

#2-19 - 2018-12-21 05:28

kazami kazuki

现实人现实集合动画人物动画番剧
这些都应该视作实例，并赋予不同的权重
学术角度看，动画只是表达手法。也许实现出来也只是原作者的理想。以至于作为乌托邦看待 (bgm38)

这一点也没错，毕竟动画之类的都是现实人造的（几个月前补了白箱顿悟）
最近填坑磊的一点数据格式

#3 - 2018-11-16 10:14

喂視頻流進來呢?
話說這裡是專貼嘛? 到處撒術語和論文也沒關係嗎?

#3-1 - 2018-11-16 10:23

本子战士

视频信息量太大，关系太复杂，建模有点难吧？

#3-2 - 2018-11-16 10:24

本子战士说: 视频信息量太大，关系太复杂，建模有点难吧？

所以才要用 neural network, 不過我猜 @windrises 說的「时间序列分析」就是指「喂視頻流進來」

#3-3 - 2018-11-16 10:25

windrises

Willian 说: 所以才要用 neural network, 不過我猜＠windrises 說的「时间序列分析」就是指「喂視頻流進來」

不是，就是简单的历史评分数据，平均分随着时间波动

#3-4 - 2018-11-16 10:26

本子战士

Willian 说: 所以才要用 neural network, 不過我猜＠windrises 說的「时间序列分析」就是指「喂視頻流進來」

我猜是不是影片年代的意思呢？因为不同的时代有着不同的潮流和时代。

#3-5 - 2018-11-16 10:28

windrises 说: 不是，就是简单的历史评分数据，平均分随着时间波动

原來如此. 那上一樓的回覆誤解了、這一樓跟「喂視頻流」的情況吧.

#3-6 - 2018-11-16 10:40

君寻

训练一个能看懂动画的AI？虽然无法分析剧情，不过作画水平、崩坏情况、3D效果、环境光效、原画张数这些似乎可以量化分析一下

#3-7 - 2018-11-16 10:55

君寻说: 训练一个能看懂动画的AI？虽然无法分析剧情，不过作画水平、崩坏情况、3D效果、环境光效、原画张数这些似乎可以量化分析一下

感覺是的! 只是難點是這些沒有數據.

#3-8 - 2018-11-16 10:59

本子战士

君寻说: 训练一个能看懂动画的AI？虽然无法分析剧情，不过作画水平、崩坏情况、3D效果、环境光效、原画张数这些似乎可以量化分析一下

这些特征不好打标签吧

#3-9 - 2018-11-16 13:18

th3ta "Paradox"

喂视频... 不知道机器能不能学会欣赏剧情，不过大概可以训练出识别“作画崩坏”，或者“棒读”的模型，这绝对可以预测大部分低评分的作品
不过也会有少数作品例外，比如《为这个美好世界献上祝福》的故意崩，又或者是用棒读/非常规的演出作为萌点的声优（《噬魂师》《黄段子》的破音姬）

#3-10 - 2018-11-16 15:42

th3ta "Paradox" 说: 喂视频... 不知道机器能不能学会欣赏剧情，不过大概可以训练出识别“作画崩坏”，或者“棒读”的模型，这绝对可以预测大部分低评分的作品
不过也会有少数作品例外，比如《为这个美好世界献上祝福》的故意崩，又...

如果考慮「作画崩坏」或者「棒读」作為 feature 的話, 那麼只要用 non-linear 模型, 說不定能夠學到這些反常例子.

實話說按照個人經驗「故意崩」的例子絕對是不少的.

#3-11 - 2018-11-16 20:31

598753468

Willian 说: 如果考慮「作画崩坏」或者「棒读」作為 feature 的話, 那麼只要用 non-linear 模型, 說不定能夠學到這些反常例子.

實話說按照個人經驗「故意崩」的例子絕對是不少的.

识别作画崩坏我觉得没那么简单，如果能识别崩坏了，ai自动画图也指日可待了。

#3-12 - 2018-11-17 10:08

th3ta "Paradox"

598753468 说: 识别作画崩坏我觉得没那么简单，如果能识别崩坏了，ai自动画图也指日可待了。

其实可以训练模型去“对比不同画面同一角色的面部相似程度”来作为评估“作画崩坏”的标准，如果绝大部分时候同一个角色长得都不一样了，那么这东西大概就是崩了...

#3-13 - 2018-11-17 10:54

th3ta "Paradox" 说: 其实可以训练模型去“对比不同画面同一角色的面部相似程度”来作为评估“作画崩坏”的标准，如果绝大部分时候同一个角色长得都不一样了，那么这东西大概就是崩了...

說不定還可以參考官方人設. 再 @ 一下: reptile

#4 - 2018-11-16 10:20

CureDovahkinn🤔 (プリキュアなりたい)

锦织大哥你能做偶像大师也能做弗朗西西，本格图灵测试

#4-1 - 2018-11-16 10:24

本子战士

监督只是一部分，还有很多影响作品质量的因素吧。

#4-2 - 2018-11-16 11:38

CureDovahkinn🤔

本子战士说: 监督只是一部分，还有很多影响作品质量的因素吧。

看看锦织哥哥担任了多少职位 (bgm38)

#5 - 2018-11-16 10:22

也許用預訓練過的模型做 one shot 也不錯. 例如這個: Reptile: A Scalable Meta-Learning Algorithm
Medium

#6 - 2018-11-16 10:29

豆沙包罐头

除非机器能看到全部内容，否则谁能料得到后面剧情崩盘

#6-1 - 2018-11-16 10:31

本子战士

并不是通过视频内容预测，而是通过staff表等meta data来预测。

#7 - 2018-11-16 10:52

padorax (戯言なんだよ)

我觉得动画放送前就预测评分本质上跟壁吧预测销量是一样的吧

#7-1 - 2018-11-16 11:18

Rくん

我们这是科学算命！(正色

#7-2 - 2018-11-16 11:24

#7-3 - 2018-11-16 12:03

padorax

Rくん说: 我们这是科学算命！(正色

刚看了青春大笨猪，我在想有没有量子算命 (bgm38)

#7-4 - 2018-11-16 12:12

Rくん

padorax 说: 刚看了青春大笨猪，我在想有没有量子算命

交出你的Ass就告诉你 (bgm67)

#8 - 2018-11-16 12:34

Cedar (｡´-д-)

先试试判断某段作画的原画师吧? 感觉这个比预测评分有意义

#8-1 - 2018-11-16 13:18

初神

#8-2 - 2018-11-16 21:17

本子战士

不好打标签吧，一般只知道单集的原画师有谁，不知道几分几秒是谁做的。数据不足吧。

#8-3 - 2018-11-16 21:31

Cedar

本子战士说: 不好打标签吧，一般只知道单集的原画师有谁，不知道几分几秒是谁做的。数据不足吧。

数据有不少 https://www.sakugabooru.com/

#9 - 2018-11-16 13:26

初神 (内容积淀为形式，想象、观念积淀为感受。 ... ... ... . ...)

这问题太大了吧

投资方就等着你这模型呢 (bgm24)

#10 - 2018-11-16 13:39

dhzy

Yes and CI=[0,10] (bgm35)

#10-1 - 2018-11-16 13:59

th3ta "Paradox"

没救了，p value 全都不显著（

#11 - 2018-11-16 14:24

完全没有 (就是没有)

预测本身就是玄学，再加上人工智障，结果你懂的 (bgm38)

#12 - 2018-11-16 14:33

不能。

但是先假设一个能的设定，然后会发生什么？编剧会用机器学习来构造和选取剧情要素，这样评分在你打之前就已经是高分。这就是社交网络的工作方式，回音室，你只看到你想看的东西。

审美是超越的，所以如果机器学习可以预测评分，那审美的意义就在机器学习不可预测的部分。

#12-1 - 2018-11-16 21:15

本子战士

这个预测其实不是预测作品的好坏，而是某个特定状态下，这个状态产生的作品是否符合当时社会的潮流/风向。预测的是作品与时代的契合度

#12-2 - 2018-11-17 19:00

Rくん

本子战士说: 这个预测其实不是预测作品的好坏，而是某个特定状态下，这个状态产生的作品是否符合当时社会的潮流/风向。预测的是作品与时代的契合度

预测的结果就是复读机 (bgm38)

#13 - 2018-11-16 16:56

败犬

google之前做过电影上映后的模型来着...好像是我在某本数据挖掘的书上看到的，但是忘了那是什么场景的了

#14 - 2018-11-16 17:20

发光的球 (想和可爱的纸片小男孩贴贴)

让我们根据职位和历史简单加权平均一下 (bgm38)

#15 - 2018-11-16 17:29

lhb5883-吹冈王♛⑩ (BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈三位一体 ...)

没什么意义吧我觉得iqiyi根据百度网盘下载指数买版权才是最sao的 (bgm38)

#15-1 - 2018-11-16 18:24

Rくん

#15-2 - 2018-11-16 18:36

Oalvay

真的假的…网上搜没找到，可以贴一下消息来源网址吗

#15-3 - 2018-11-16 19:37

lhb5883-吹冈王♛⑩

Oalvay 说: 真的假的…网上搜没找到，可以贴一下消息来源网址吗

估计已经被删了？逼乎上有人提过。

#15-4 - 2018-11-16 21:12

本子战士

不是搜索指数吗？

#15-5 - 2018-11-16 21:30

lhb5883-吹冈王♛⑩

本子战士说: 不是搜索指数吗？

搜了不看的太多下了才有意义，而且最有意义的是在客户端直接看的。

#15-6 - 2018-11-17 15:02

Bantorra

所以别想着什么都用AI/ML

#15-7 - 2018-11-17 19:17

牛马

数据上应该可行，毕竟爱奇艺就是百度这边的

#16 - 2018-11-16 18:06

CoColate (不存在的)

我感觉还需要人员年龄，舆论状态，工期松紧，资金支持程度等等难以量化的因素
还有原作数据、前作数据等关联因素

#16-1 - 2018-11-16 21:11

本子战士

越来越像预测股票了

#17 - 2018-11-16 21:37

唔噗噗 (生气了吗？才，才没有呢！)

唔做视频也交给AI 看和评价视频也交给AI
感觉人类已经没有用了呢 (bgm38)

#17-1 - 2018-11-16 22:22

本子战士

有本科幻小说就是类似的故事，人类都死完了，仿生人还是假装自己是人类生存

#17-2 - 2018-11-17 00:02

五点共圆

本子战士说: 有本科幻小说就是类似的故事，人类都死完了，仿生人还是假装自己是人类生存

那只要让ai一直复读就行了呀

#17-3 - 2018-12-11 15:35

唔噗噗

五点共圆说: 那只要让ai一直复读就行了呀

复读顶个啥子用哦

#17-4 - 2018-12-11 16:20

五点共圆

唔噗噗说: 复读顶个啥子用哦

复读就是人类的本质，所以可以假装还有人 (bgm38)

#18 - 2018-11-17 21:25

Bantorra

个人观点，想预测作品评分或口碑，meta data是远远不够的。
顺便一提，为了避免在找作品补时被剧透，我一直想尝试用bgm的短评作为X去预测自己对一部作品的评分。考虑到一部作品的短评数量可以有很多，数据量应该是勉强够用。如果成功了的话，大概就能回避好作品不被剧透就不会去补的窘境了 (bgm38)

。

#18-1 - 2019-1-10 09:13

橘枳橼

我觉得你的需求就是个朴素贝叶斯……

#19 - 2018-11-19 05:53

夢遊中 (旅行真好。)

感觉预测评分没有意义呀，还是做用户推荐比较重要吧

#19-1 - 2018-11-19 13:04

Hiyori

产品狗表示+1
你们engineer只会炫技，但是解决不了用户痛点的炫技并没有卵用呀 (bgm38)

#19-2 - 2018-11-19 22:03

本子战士

Hiyori 说: 产品狗表示+1
你们engineer只会炫技，但是解决不了用户痛点的炫技并没有卵用呀

产品没梦想（逃）

#19-3 - 2018-11-20 16:19

Hiyori

本子战士说: 产品没梦想（逃）

没梦想的是产品经理，我等做产品设计的日常就是眼睁睁看着梦想被产品经理和工程师用现实捏个粉碎呀 (bgm38)

#19-4 - 2018-11-20 17:01

MousHu

Hiyori 说: 没梦想的是产品经理，我等做产品设计的日常就是眼睁睁看着梦想被产品经理和工程师用现实捏个粉碎呀

有没有些可分享的令人心痛的例子呢 ~

#19-5 - 2018-11-20 17:23

Hiyori

MousHu 说: 有没有些可分享的令人心痛的例子呢 ~

[掏出一款完美解决用户痛点又超美丽的梦幻设计稿]
后端工程师：我们搞的是ML不是魔术，这个技术并不存在，请5年后再来找我
前端工程师：bug都堆成山了，你还让我去做UI动画？呵呵哒
产品经理：Naive！这功能又赚不了几个钱，赏你个优先级P4 S4吧
大老板：颜色太鲜艳插图太多用词太卖萌，我们是严肃的B2B产品不是卡通片，高端大气你懂吗，高端大气

[掏出删减成屎一样的设计稿]
前后端工程师：这个容易实现，我喜欢
产品经理：这个能赚钱，我喜欢
大老板：这个低调的UI一看就是专业软件，我喜欢
LGTM

#19-6 - 2018-11-20 17:43

MousHu

Hiyori 说: [掏出一款完美解决用户痛点又超美丽的梦幻设计稿]
后端工程师：我们搞的是ML不是魔术，这个技术并不存在，请5年后再来找我
前端工程师：bug都堆成山了，你还让我去做UI动画？呵呵哒
产品经理：Naiv...

懂了 ...

#19-7 - 2018-11-20 18:22

dhzy

笑死...

#20 - 2018-11-19 16:56

Glenn

这本质上就是预测股价吧

#21 - 2018-12-21 06:05

klijia

当然可以，只是估计结果也好不到哪里去。多选点feature可能会好一些？

/ 返回～技术宅真可怕～小组

～技术宅真可怕～ » 讨论有没有可能通过machine learning用bangumi的数据预测动画评分？

～技术宅真可怕～ » 讨论
有没有可能通过machine learning用bangumi的数据预测动画评分？