#1 - 2021-7-25 18:03
冈崎羽未鹰原汐 (二阶堂芽爱 小河坂青空)
百度云 指百度云开放平台,不是百度网盘。

咳咳,我喜欢推gal的时候随手截图,事后分门别类整理、存放。一般标准时长30h的作品截个600张吧。 写了个程序来管理截图,其中有步骤是识别截图中的台词打成目录日志,方便查阅。

之前用的是百度云的标准OCR(文字识别)接口,宣称免费额度是每天5w次。能找到有关的资料也都是这么写的,丝毫没有提到过有期限。



用了小半年,今天突然用不了,上控制台一看;每天5w次呢?怎么木大了?变成了需要手动领取——而领取也才每月200次??



每日50000→每月200还需要申请,真有你的百度云。跟以前百度网盘的套路如出一辙,早期撒饵引用户来,时间一到就收网。

大家还知道有啥免费或廉价,适合个人使用的文字识别接口?每月额度2k左右足够。
#2 - 2021-7-25 18:06
(いつでも微笑みを)
#2-1 - 2021-7-25 18:14
冈崎羽未鹰原汐
草,之前没有,哭了😂
#2-2 - 2021-7-25 18:18
狂犬榨汁姬艾莉丝
冈崎羽未鹰原汐 说: 草,之前没有,哭了😂
草,我怎么也没有(bgm38)
难道和百度的认证不通用(bgm38)
#2-3 - 2021-7-25 18:34
冈崎羽未鹰原汐
狂犬榨汁姬艾莉丝 说: 草,我怎么也没有难道和百度的认证不通用
啊这,你都发帖提醒大家了,不是自己先赶紧把流程走一遍么(bgm38)
#2-4 - 2021-7-25 18:35
狂犬榨汁姬艾莉丝
冈崎羽未鹰原汐 说: 啊这,你都发帖提醒大家了,不是自己先赶紧把流程走一遍么
当时忙到最后一天可能没找到入口(bgm38)
可能当时藏起来了
#3 - 2021-7-25 18:09
(miaow~~~)
OCR
#3-1 - 2021-7-25 18:17
冈崎羽未鹰原汐
事实证明字母的顺序不影响阅读(逃
#3-2 - 2021-7-25 18:17
MousHu
冈崎羽未鹰原汐 说: 事实证明字母的顺序不影响阅读(逃
要改标题正文一起改啊 ...
#4 - 2021-7-25 18:44
(天の光は全て星だ)
求管理截图程序(bgm38)
#5 - 2021-7-25 20:10
(二阶堂芽爱 小河坂青空)
话说,游戏截图文字识别的文本的后处理几个小难点;有没有大佬来聊一聊(bgm37)
例,典型的未经过处理的文本如下:

≦ 屏幕截图(1670).png ≧
直哉
自动跳过记录·存档读档快徒存档快捷读档设置语音隐藏
其实那句话的本来含义是“乘风破浪之声太过心旷神怡导致忘记去数经过了多少
时间,感觉这个长夜太过漫长,连第二天会不会到来都有些不知道了”」

≦ 屏幕截图(1671).png ≧
【直哉】
女办喜七书松小0办如吝的00人松书七表加
「夜醒众人漫漫夜,宝船乘风破浪声」
【直哉】
「是说那句回文吗?」
【里奈】
「是的,所以一旦想到这么舒服会不会是在做梦,不禁让我感到一丝害怕」
【直哉】
其实那句话的本来含义是“乘风破浪之声太过心旷神怡导致忘记去数经过了多少
时间,感觉这个长夜太过漫长,连第二天会不会到来都有些不知道了”」
希望做以下工作:
• 去除文本中的忽略词,如游戏UI的读档存档跳过之类。
    ◦ 我现在是用户手动输入忽略词列表。这样用起来也很麻烦,而且不同游戏的忽略词不能通用,比如有的是“存档”有的是“SAVE”。如果忽略词表太大,难免会误删正常文本。
    ◦ 如果分词然后分析词频,列出词频高的词推荐用户删除。这样靠谱么?
    ◦ 由于识别精度,有些词拼写会改变导致无法直接匹配,如save→sove。
• 去除无用的换行。有些句子被分了多行,希望能恢复为一行的文本。
    ◦ 如何识别“一行句子”的范围?
    ◦ 很多文本的标点符号使用不标准,如没有句号,或识别误差忽略了右括号 “」”。
• 记录台词对应的角色,即说话者。如果游戏界面中有日期,也记录对应的日期。
    ◦ 这个功能主要还是受限于前两个问题,即整理、规范化文本。
• 你觉得最终生成的目录以什么格式储存好?
    ◦ 用户能按关键词/说话者等搜索对应的台词,并显示对应的日期、截图画面等。
    ◦ 如果不借助软件,也能阅读目录。可读性较高。
#6 - 2021-7-25 20:34
为啥不用内存钩子读文本……OCR 不多此一举么…
#6-1 - 2021-7-25 21:59
冈崎羽未鹰原汐
好建议!(bgm47)
不过用起来会不会麻烦一点,每个游戏都要先配置什么的,而且每次运行游戏前都要打开软件……
我没用过翻译机啃生肉,不过看起来貌似挺复杂
#6-2 - 2021-7-26 12:39
拿月亮自刎
冈崎羽未鹰原汐 说: 好建议!
不过用起来会不会麻烦一点,每个游戏都要先配置什么的,而且每次运行游戏前都要打开软件……
我没用过翻译机啃生肉,不过看起来貌似挺复杂
使用内存钩子读取文本反而简单些。 上面你提到的几个问题都可以解决。
https://github.com/Artikash/Textractor
特殊码(h-code) 每个月 VNR 贴吧都在更新,以前的游戏可以在这里找 https://vn-hooking.fandom.com/wiki/H-Code
https://github.com/project-yuki/YUKI    这个没用过,带一些翻译功能。

可以自己写个工具,映射一下热键。截图的时候保存  Textractor 提取的文本。以前我用 AHK 写过类似的东西。
#7 - 2021-7-25 20:57
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 三位一体 ...)
百毒还没完蛋吗?
#8 - 2021-7-26 04:33
(在pixiv做产品设计)
mac 的话系统自带 OCR API
#8-1 - 2021-7-26 12:19
原野
此话怎讲
#8-2 - 2021-7-26 18:46
小神
原野 说: 此话怎讲
Apple Vision API
#9 - 2021-7-26 09:45
(ケ・セラ・セラ)
google lens
#10 - 2021-7-26 10:17
(把人看做人,做好工作,注重现实,保持联络)
微软最近免费ocr小程序了,不知道接口开没开
#11 - 2021-7-26 12:28
(是萌豚哒❗)

百度发邮件了,不过说这么含糊,一般人也不会看(bgm38)
https://ai.baidu.com/support/news?action=detail&id=2390
#12 - 2021-7-26 16:01
腾讯云每个月会送几千的额度 可以试试
https://cloud.tencent.com/document/product/866/35945#null
#13 - 2021-7-26 16:06
(不想上班)
LZ 可以试试 PaddleOCR,虽然是本地的
#13-1 - 2021-7-27 12:07
冈崎羽未鹰原汐
谢谢推荐,试了下看起来准确度还挺不错
#14 - 2021-7-27 18:01
百度还专门给我打了电话讲这件事
#15 - 2021-7-27 23:35
(往事如烟 随风飘远)
好帖mark
#15-1 - 2021-11-25 20:55
邓林
mark+1
#16 - 2021-11-25 17:19
(二阶堂芽爱 小河坂青空)
今天百度的工作人员打我电话,说双十一的返场优惠,1元1w次。包括通用版和高精度版。叫我多屯点(然而一账号只能买一次)(bgm38)
@狂犬榨汁姬艾莉丝
#17 - 2021-11-25 18:34
(bgm46)百度比腾讯还恶心,速度倒闭就完事了,看个贴吧强制下载app,美名其曰为了大伙的安全典型的要流量不要妈,平台首创之穷人不要发言,尊贵的百度会员骂完你反手给你一个禁言,你只能屈服在会员脚下(bgm46)