#1 - 2017-8-20 03:01
Hentyclopedia (Information doesn't harm)
问题如题,最近突然想找一张以前的图片,于是按照历史记录中的图片来查找,结果只能看到翻不到头的表情包(bgm38)

后来想按照图片尺寸或者文件大小过滤一下,结果发现并不是很准确,所以想问问有没有什么方法或者工具可以“判断”一张图是表情包呢?

PS: 解决方案不仅限于现成的工具,如果有代码的思路希望大家可以提供一下
#2 - 2017-8-20 03:02
(Information doesn't harm)
顺便贴一下之前发不出来的帖子,大家帮我看看哪里撞雷了(bgm38)
#3 - 2017-8-20 03:11
(一个纠结的面瘫伪宅)
是QQ群聊天记录吗?我记得聊天记录都会在本地有存储,记得图片是单独有文件夹的来着。自制的表情图片与普通的图片没法区分,除非你要找的图片比较特别。我觉得你可以在本地根据时间还有大小排序,找起来应该不会太难。
#3-1 - 2017-8-20 03:26
Hentyclopedia
是QQ的聊天记录,我想找的图是一张excel表的截图,背景是白色图片尺寸也不大,很难简单的和表情包做区分
#3-2 - 2017-8-20 03:56
windrises
Hentyclopedia 说: 是QQ的聊天记录,我想找的图是一张excel表的截图,背景是白色图片尺寸也不大,很难简单的和表情包做区分
看到知乎上有推荐的查找本地相似图片的软件,你可以试试再截一个excel的截图,然后找相似的
#3-3 - 2017-8-20 04:10
Hentyclopedia
windrises 说: 看到知乎上有推荐的查找本地相似图片的软件,你可以试试再截一个excel的截图,然后找相似的
好的,我看看
其实我觉得在这个表情包泛滥的时期,如果可以有效过滤掉表情包和复读留下重要信息是个不错的课题
#4 - 2017-8-20 09:32
(已淡出bgm38)
用Picasa查看QQ的本地图片文件夹,和好友的聊天图片都在C2C文件夹里,如果是QQ本身的表情包不会出现在里面。如果是群聊天图片的话,没有单独的文件夹,只在Group文件夹里按时间划分了几个文件夹
#4-1 - 2017-8-20 09:58
Hentyclopedia
我用的是Mac,貌似路径还不太一样,所有图片都在一个叫Image的文件夹里
其实就是找Q群里的图片麻烦,毕竟两个人聊天不会有太多表情包
不知道有没有算法层面的方法来过滤表情包
#5 - 2017-8-20 10:28
(深度隐藏宅)
如果有ORC软件的话可以尝试一下批量抽取图片中的文字,如果是表情包的话一般文字数不会太多,根据识别出的文字数筛选或许可行
#5-1 - 2017-9-26 09:00
橘枳橼
我永远喜欢xxx.jpg
我不是,不没有.jpg
#6 - 2017-8-20 11:41
(如果梶浦由记能再和clamp合作一次)
onedrive的相册能自动贴标签,应该能识别出excel表格并贴上标签“数据”之类的标签
#7 - 2017-8-20 14:32
(大変に気分がいい)
直接上机器学习啊233
Keras大法好
#7-1 - 2017-8-21 05:01
Hentyclopedia
可以做个人脸识别,把教皇、学友这些人屏蔽掉(bgm38)
但是一些动画截图的表情包就不那么容易了
#7-2 - 2017-8-22 21:02
Genius🌟小乖💯
Hentyclopedia 说: 可以做个人脸识别,把教皇、学友这些人屏蔽掉
但是一些动画截图的表情包就不那么容易了
你们思路就是太死。为何不按照文件的创建时间、来源、使用频率、使用时间作为特征,一个 logistic regression 或一棵 decision tree 就能搞定。
#7-3 - 2017-8-22 23:05
桜小路ルナ
Genius、小乖 说: 你们思路就是太死。为何不按照文件的创建时间、来源、使用频率、使用时间作为特征,一个 logistic regression 或一棵 decision tree 就能搞定。
dalao dalao
#7-4 - 2017-8-23 01:44
Hentyclopedia
Genius、小乖 说: 你们思路就是太死。为何不按照文件的创建时间、来源、使用频率、使用时间作为特征,一个 logistic regression 或一棵 decision tree 就能搞定。
直接看QQ存放图片的文件夹你说的大多数feature都没有吧
估计需要再找QQ的聊天记录文件做个预处理
#7-5 - 2017-8-23 08:55
aja
桜小路ルナ 说: dalao dalao
这位不是大佬,是元老。
#7-6 - 2017-8-23 09:27
th3ta "Paradox"
Genius、小乖 说: 你们思路就是太死。为何不按照文件的创建时间、来源、使用频率、使用时间作为特征,一个 logistic regression 或一棵 decision tree 就能搞定。
想了想,这个是不是需要用户自己先把 sample 里的图片分类成表情包和非表情包才能拿到 dependent var 啊...
不太懂 ML,但 Logistic 好像是 Supervised Learning
#7-7 - 2017-8-23 09:52
Genius🌟小乖💯
th3ta "Paradox" 说: 想了想,这个是不是需要用户自己先把 sample 里的图片分类成表情包和非表情包才能拿到 dependent var 啊...
不太懂 ML,但 Logistic 好像是 Supervised Lea...
人脸识别、图片分类不也是 supervised learning?有什么问题?
#7-8 - 2017-8-23 10:10
th3ta "Paradox"
Genius、小乖 说: 人脸识别、图片分类不也是 supervised learning?有什么问题?
觉得有些麻烦,为了收数据还要自己看一遍 sample,我想着能 unsupervised 最好... 另外我还以为人脸识别是靠用三个特定距离的圆圈去找眼睛和嘴的方法去实现,没学过ML所以还以为是 unsupervised
#8 - 2017-8-20 17:18
((((;゚Д゚)))))))
确定是excel白色背景的话...
直接写个脚本查白色最多的图?
#8-1 - 2017-8-21 05:00
Hentyclopedia
很多表情包也是白色背景这个恐怕不行
#9 - 2017-8-22 20:49
(xD)
直接看大小
#9-1 - 2017-8-22 23:14
#9-2 - 2017-8-23 01:42
Hentyclopedia
试过图片尺寸和图片大小,不是很有效
#10 - 2017-8-23 03:59
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 三位一体 ...)
你确认你要找的图片还在那个目录么?qq不会提示自动清理么?
#10-1 - 2017-8-23 04:21
Hentyclopedia
应该在吧,我在放图片那个文件夹看到一些一年前的图,要找的图肯定是一个月之内发的
#10-2 - 2017-8-23 07:30
lhb5883-吹冈王♛⑩
Hentyclopedia 说: 应该在吧,我在放图片那个文件夹看到一些一年前的图,要找的图肯定是一个月之内发的
那就按时间排序 然后把近一个月的挑出来 然后发一张excel截图 看看文件大小按文件大小再排序找
#10-3 - 2017-9-26 09:03
橘枳橼
lhb5883-污喵王VIP⑩ 说: 那就按时间排序 然后把近一个月的挑出来 然后发一张excel截图 看看文件大小按文件大小再排序找
根据文件类型和截图范围和截图分辨率影响,大小浮动很大