15158846557 或

在线咨询

所在位置：首页 > 营销资讯 > 网站运营 > 前端工程师用什么工具扒网站？

前端工程师用什么工具扒网站？

时间：2023-12-15 09:36:01 | 来源：网站运营

时间：2023-12-15 09:36:01 来源：网站运营

前端工程师用什么工具扒网站？：如果题主说的是爬虫，一般来说我们需要这 3 类工具

页面请求工具
页面处理工具
请求代理&监控工具

笔者主要做web前端开发，因此主要介绍 JS 中常见的工具。

一、页面请求工具

本质上这些工具都是一个 网络资源请求 工具。NodeJS 技术栈中，常见的工具有

1. request

最基础的请求库，提供链式语法的 API，喜欢 Promise 的可以试试 request-promise 官方Github 地址

var request = require("request");request("https://www.zhihu.com", function(error, response, body) {  console.log("body:", body); // Print the HTML});

2. superagent

原生支持 Node 环境和浏览器环境，提供链式语法和 Promise 语法的 API，周边插件也很丰富官方Github 地址

// Node环境中const superagent = require("superagent");superagent  .get("https://www.zhihu.com") // 请求地址  .query({ user: "liukanshan" }) // 请求页面或接口的参数  .end((err, res) => {    // res是返回体，res.text就是html文本，更多查看官方文档  });

二、页面处理工具

抓取到的页面一般是个字符串（`< html >...< html >"），想要 读取里面的数据，比如获取导航栏菜单的名称，一般会用到页面模拟工具，常见的工具有

1. cheerio

类 JQuey 设计的服务端页面运行环境，以上面 request 请求到页面后为例官方Github 地址

var request = require("request");var cheerio = require("cheerio");request("https://www.zhihu.com", function(error, response, body) {  var $ = cheerio.load(body);  console.log($(".Tabs-link.AppHeader-TabsLink").text); // 打印出 '首页'});

2. puppeteer

以 Chromium 为基础开发的 Node 端无头浏览器，最近几年比较火，非常强大，非常强大，非常强大（说三遍～）官方Github 地址

const puppeteer = require("puppeteer");(async () => {  const browser = await puppeteer.launch();  const page = await browser.newPage();  await page.goto("https://zhihu.com");  await page.screenshot({ path: "本站首页截图打印成图片.png" });  await browser.close();})();

三、抓取代理工具

我们在调试 “抓取网页” 这个过程时，需要经常查看我们发出的请求对不对，返回是否有异常等，这时候需要代理工具能查看网络请求和返回

whistle

基于 NodeJS 开发网络代理工具

详情见官网

关键词：工具,工程师

网站
营销
设计
运营
优化
效率
专注
电商
方案
推广

解决方案&服务

客户&案例

营销资讯

关于我们

解决方案&服务

客户&案例

营销资讯

关于我们

微信公众号

为了最佳展示效果，本站不支持IE9及以下版本的浏览器，建议您使用谷歌Chrome浏览器。点击下载Chrome浏览器

关闭

快捷入口

前端工程师用什么工具扒网站？

一、页面请求工具

1. request

2. superagent

二、页面处理工具

1. cheerio

2. puppeteer

三、抓取代理工具

whistle

怎样制作多媒体课件？多媒体课件的设计制作流程工具，纯干货分享！

浙江网站建设开发有哪些可以学习和创新的地方

Dz插件-免费Dz采集发布伪原创插件-DzSEO插件大全下载

公司建设一个企业网站时需要哪些流程？

个人该怎么选择好用的自建站平台？

杭州装修公司家装/工装十强排名推荐，杭州装修公司排名前十强（含全半包价

UI设计专业培训课程

你常去哪些技术网站/论坛？

入门帖 | 新手定制师必须知道的机票预订平台大集合！

杭州协众信息技术成为网页设计师的四个步骤

快捷入口

前端工程师用什么工具扒网站？

一、页面请求工具

1. request

2. superagent

二、页面处理工具

1. cheerio

2. puppeteer

三、抓取代理工具

whistle

推荐文章