关于爬虫,之前一直用做第一个站的时候,记得那时候写的?爬虫是爬?的数据,用的就是?htmlparser可能是由于好奇和满足我当时的需求,那开始就各种写啊,一个页面,把需要的内容处理下来,复杂的写完后不写注释自己都看不懂,一直我也知道?JSOUP好,也感觉没空学习新的?爬虫(完全是借口啊)。最近我试了一下用?JSOUP,尼玛,完全爱上了,完全秒杀?htmlparser。
PS:用过都知道是支持(CSS选择器),对于我这样的?jQuery用的非常6666的人来说,哪就是一个字,爽死了。
Maven依赖包:
下面展示的代码是,实现了相同的一个业务,爬取了百度的一些内容。但是你可以看到,Htmlparser繁琐,JSOUP轻量级。不多说下面看代码。
Htmlparser Java代码:
JSOUP创建一个模拟浏览器行为的请求头:
瞬间你看看,逻辑思维都符合现在流行的链式编程。
然后就开启jQuery模式了。
后面我会采用视频讲解的方式,结合实战去讲解。等着吧,我现在在整理?FreeMarker的视频!
如需转载,请注明文章出处和来源网址:http://www.divcss5.com/html/h60200.shtml