菲莉丝·艾利斯 说: 什么是爬虫啊
一只火龙果 说: 请问不粗暴的爬虫是啥样的
Vincent 说: 比如我这种缩手缩脚的,1分钟一次,每次两三个条目,碰到502和404什么的站点爆炸,再休息几分钟...b38
Rくん 说: 那不就是人肉操作嘛b38
Vincent 说: 因为我写脚本的时候就发现每天会炸几次,加上历史网站体验感觉服务器并不是很好,所以不敢太放肆
VenaR 说: 我认为需要at一下 @Dimpurr
若卡 说: .... 502具体什么原因还是只有能看后台的老板知道,链接纯属转发不代表个人任何意见
Sai 说: 好了,那怎么判断一下给他塞点脏数据
豆沙包罐头 说: 感觉应该精简地址选项,搞这么多奇奇怪怪的不是选择困难
iuworks 说: 定期把数据库里的公开数据打包丢到BT下载里就能解决一切问题了
豆沙包罐头(id: 36176) 说: 感觉应该精简地址选项,搞这么多奇奇怪怪的不是选择困难
padorax 说: 只是这个月来的时间有点久
反手就是两刀 说: 哦呀,这个表情难道是很不舒服的意思?
去年老板吐槽过爬虫问题b38。
http://bgm.tv/user/sai/timeline/status/11742895
http://bgm.tv/group/topic/343652
补:感觉这年头看博客的已经很少了……这文章应该拉不了多少人来弄脚本(无责任瞎猜