Hentyclopedia 说: 是QQ的聊天记录,我想找的图是一张excel表的截图,背景是白色图片尺寸也不大,很难简单的和表情包做区分
windrises 说: 看到知乎上有推荐的查找本地相似图片的软件,你可以试试再截一个excel的截图,然后找相似的
Hentyclopedia 说: 可以做个人脸识别,把教皇、学友这些人屏蔽掉 但是一些动画截图的表情包就不那么容易了
Genius、小乖 说: 你们思路就是太死。为何不按照文件的创建时间、来源、使用频率、使用时间作为特征,一个 logistic regression 或一棵 decision tree 就能搞定。
桜小路ルナ 说: dalao dalao
th3ta "Paradox" 说: 想了想,这个是不是需要用户自己先把 sample 里的图片分类成表情包和非表情包才能拿到 dependent var 啊... 不太懂 ML,但 Logistic 好像是 Supervised Lea...
Genius、小乖 说: 人脸识别、图片分类不也是 supervised learning?有什么问题?
Hentyclopedia 说: 应该在吧,我在放图片那个文件夹看到一些一年前的图,要找的图肯定是一个月之内发的
lhb5883-污喵王VIP⑩ 说: 那就按时间排序 然后把近一个月的挑出来 然后发一张excel截图 看看文件大小按文件大小再排序找
其实我觉得在这个表情包泛滥的时期,如果可以有效过滤掉表情包和复读留下重要信息是个不错的课题
其实就是找Q群里的图片麻烦,毕竟两个人聊天不会有太多表情包
不知道有没有算法层面的方法来过滤表情包
我不是,不没有.jpg
但是一些动画截图的表情包就不那么容易了
估计需要再找QQ的聊天记录文件做个预处理
不太懂 ML,但 Logistic 好像是 Supervised Learning