#1 - 2020-9-15 21:28
NekoNull
最近发现网易云移动端新上线了一个功能,在查看歌词的时候可以选择同时查看歌词的罗马音转写,但是这一功能似乎是需要用户手动提交转写数据的,所以不是所有日文歌曲都能开启。

我自己之前尝试过手动对一首歌的歌词进行汉字到罗马音的转写,找到了一个网站(现在找不到了...),但是似乎一个汉字可能会对应多个不同的罗马音,在这种情况下需要手动选择正确的转写(发音?)形式。

相较于从罗马音得到汉字(e.g. 日文输入法),这应该是一个更简单的问题。如果限定领域到歌词,有了音频辅助,是否有可能完全自动化的实现 音频+汉字歌词 -> 罗马音转写?

尝试着 Google 搜索了一下,但是可能是关键词没有选择好的原因,没有找到比较好的实现。如果有相关的 link / repo 欢迎分享。
#2 - 2020-9-15 21:55
(怠け者)
utaten里的歌词有提供罗马音(https://utaten.com/lyric/qk20082031/,随手找了一个,点ふりがな那里的A就行),只要能批量抓下来就行
#3 - 2020-9-15 22:21
(Bangumi ❤er)
歌词里汉字的读法千奇百怪,输入法都联想不出来的那种(bgm38)
#3-1 - 2020-9-16 16:23
v仔💎
+1
只是一般的文字转换成读音现在已经有成熟应用了,歌词里还是太多特殊安排了
#3-2 - 2020-9-16 20:22
Chirin
+2
#4 - 2020-9-15 22:26
(AE@Recording)
如果是一般的歌词,根本不需要音频,丢到谷歌翻译里就有罗马音。
虽然不知道谷歌怎么具体实现的,总感觉少不了炼丹。猜测是先分词,得到单词大概字典就能解决大部分,或许还会对单字的上下文分析。

有的歌喜欢乱注音(比如这首),所以最终还是需要人工介入。楼上那个拿来用最方便,遇到版权要求不刊载的额外处理就好。
#5 - 2020-9-15 22:59
(樱舞落花恋模样 恋花绽放樱飞时)
酷狗一直都有自动转,只是有些多音字会错
#6 - 2020-9-16 17:09
(請注意UID)
相比音頻輔助不如索性音頻轉錄?
#7 - 2020-9-17 07:29
(V1046-R MAHORO)
自动注音的服务很多 准确率并不低
http://www.hiragana.jp/zh/

另外当年dmhy有个工具来着……

#8 - 2020-9-17 08:12
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 三位一体 ...)
那帮人为了押韵简直丧心病狂,从音频提取应该可行,但是容易受歌曲风格影响,Google的Youtube的自动字幕不知道对霓虹歌曲效果如何。
#8-1 - 2020-9-19 20:56
橘枳橼
Youtube 自动字幕非常糟糕。
最好的识别结果就是 [music]
最差的见过日文歌跑出大量韩文。
#9 - 2020-9-17 09:48
原来看到的,貌似还可以: https://ethonlau.github.io/japanese-romaji-converter/
#9-1 - 2020-9-17 22:04
イマジン・ブレーカー
awesome, thx you for sharing
#10 - 2020-9-19 21:37
#11 - 2020-9-19 21:40
用mecab-ipadic配neologd词典,基本上除了故意乱标的那些以外都能标对,我自己的一个歌词标注程序就是基于这个写的(
#12 - 2020-9-19 21:48
网易云那个就是根据汉字或者假名标注而已,所以准确率极低(bgm38)
要做的话至少得做个分词或者语义解析吧
之前有看到Kuromoji,不过貌似还是不够用
#13 - 2020-9-30 15:21
把lrc复制到word,用自带假名注音注,10秒完成
无需学习成本,不要额外付费
#14 - 2020-10-16 23:53
这个工具处理日语歌词功能很多,注音时可以手动选择多音字读音,甚至还会提示有哪些音常注错
#15 - 2020-10-21 03:19
音读和训读勉强可以靠工具区分,但遇到熟字训意训直接全麻。