站点图标 江湖人士

几个非常适合新手练习python爬虫的网页总有一款能搞定!

动态加载的json数据就出来了,没有反爬,留意的是,若是不想去内容里面抓图片的话,能够只抓缩略图,就是这个页面显示的图片,它在json数据中的image_list中,留意,将url中的list换成origin,就是大图哦!代码如下

间接搜刮全书网,打开主页,随便找一篇小说,好比《盗墓笔记》,点击后跳转到网页,在点击起头阅读,呈现了所有章节,在进入章节就呈现了小说内容,网页内容和代码如下:

80电子书网和上面的全书网比力雷同,可是它本身供给有下载功能,能够间接用小说Id和名字间接建立下载文件,页面截图和代码:

雷同的网站还有:妹子图网、美桌网、笔趣阁、久久等等以至百度图片也能够用抓包获取数据的!

以上代码都是随手写的,没有排版,大师有乐趣能够本人排下版,或者好比小说网站,能够先抓取大类别,然后在每一个类别中获取所有小说,最初在把所有小说的内容抓出来,如许就是全站爬虫了!!!

退出移动版