html转pdf生成电子书

html转pdf生成电子书

Python抓取网页资源生成电子书

Python抓取网页资源生成电子书

最近http://tutorials.jenkov.com/java-nio/的java-nio教程比较优质。在网站上找了下居然没有pdf下载的连接。该网站又在外网,需要挂代理才能访问,因此产生了自己抓取资源制作电子书想法。主要思路查看了下网页结构主要是获取左侧教程目录每一个文章的链接,抓取其中的网