每天几分钟跟小猫学前端之node系列:用node实现最简单的爬虫

 先来段求分小视频:

upload/201805091639485456.png" alt="" style="margin: 0px; padding: 0px; border: 0px; max-width: 900px;" />

 

cheerio:
        
   cheerio 是一个 jQuery Core 的子集,其实现了 jQuery Core 中浏览器无关的 DOM 操作 API:
   本例子中将使用load方法,以下是一个简单的示例:
     
 
express:
 
     基于Node.js 平台,快速、开放、极简的 web 开发框架,这里主要用来做简单的路由功能,就不做详细介绍了,主要是用了get,具体可以参考官网。
 
 
具体实现:
 
1.首先,我们要使用express搭建简单的node服务
 
 
复制代码
 1 const request = require('request');  2 const app = express();  3  4 app.get('/:key',function(req,res){  5     console.log(req.params.key)  6      7 })  8  9 app.listen(3000,()=>{ 10     console.log("service start on port 3000"); 11 })
复制代码
 
使用命令行运行node demo.js,并在浏览器中访问 localhost:3000/key 运行结果为
 
 
 
2. 使用request实现页面抓取功能
 
复制代码
 1 const express = require('express');  2 const request = require('request');  3 const app = express();  4  5 app.get('/:key',function(req,res){  6     console.log(req.params.key)  7     let spider = new Spider();  8     spider.fetch("http://www.baidu.com/s?wd="+req.params.key,(err,body)=>{  9         if(!err){ 10             res.send(body.toString()); 11         } 12     }) 13 }) 14 15 app.listen(3000,()=>{ 16     console.log("service start on port 3000"); 17 }) 18 19 class Spider{ 
                        
关键字:
50000+
5万行代码练就真实本领
17年
创办于2008年老牌培训机构
1000+
合作企业
98%
就业率

联系我们

电话咨询

0532-85025005

扫码添加微信