#1 - 2018-1-17 12:37
狂犬榨汁姬艾莉丝 (いつでも微笑みを)
有时候看到精彩的帖子又很可能被删的那种就有保存的必要了。
尤其是有很多楼那种,楼中楼几百楼的那种。
导出为什么格式不要求,但最好能保留所有格式,包括字体、音乐、视频等。(实在不行纯文字也行,关键的楼中楼问题和分页问题)
你说打印为PDF吧,几十页要打个几十页的PDF?而且多页的楼中楼也保存不了。
保存为mht吧,同样也只能保存多页楼中楼的第一页,几十页的帖子加上每楼几十页的楼中楼不知道要保存多少个mht。
保存到onenote吧,存在和打印为PDF一样的问题。
推而广之,其他社区的帖子又该怎么保存呢?(好像没有麻烦的楼中楼问题,贴吧解决了别的社区应该也可以。)
尤其是有很多楼那种,楼中楼几百楼的那种。
导出为什么格式不要求,但最好能保留所有格式,包括字体、音乐、视频等。(实在不行纯文字也行,关键的楼中楼问题和分页问题)
你说打印为PDF吧,几十页要打个几十页的PDF?而且多页的楼中楼也保存不了。
保存为mht吧,同样也只能保存多页楼中楼的第一页,几十页的帖子加上每楼几十页的楼中楼不知道要保存多少个mht。
保存到onenote吧,存在和打印为PDF一样的问题。
推而广之,其他社区的帖子又该怎么保存呢?(好像没有麻烦的楼中楼问题,贴吧解决了别的社区应该也可以。)
上面有v0.1.0版本的程序可以直接用
我又发布了v0.1.1版,用那个就好。
原因:
这个错误是说在程序所在的盘符上(如D:)没有找到/example/test0.json文件(如D:\example\test0.json)。
url.txt里面写了程序爬取帖子的入口,支持url和json文件两种格式,其中url是指贴吧的URL,如https://tieba.baidu.com/p/3922635509,json主要用来离线测试。
test0.json是之前测试用的json,在你的电脑上并没有这个文件,所以程序无法获取数据而报错。
我猜测要么是帖子发帖时间久远,v0.1.0不能正确解析,那用v0.1.1版尝试一下。
要么是帖子获取楼中楼的时候出现网络错误,那么隔一段时间比如一分钟再重新运行程序就能解决问题。
比较多的话还是推荐笔记管理
楼中楼测试了一下确实不行。
很多时候有意思的不是主楼,而是讨论
我现在是用上面提到的tiebaSpider,挺好的