一、背景需求
1、因为数据包含机密信息,所以得自己搭建图表导出服务器;在后台生成对应Highcharts图表、以图片的形式导出保存。
2、图表个性化程度较高,如一些图列是Highchart没有的,但在前端可以利用css实现。
3、每周定时执行上述生成图表的任务,保存到指定位置。
4、需求已经上线一个月,生产上运行良好,时间有限,只能在这简单记录下,理一下思路也方便以后查阅。
二、实现思路
1、经过一番了解,发现Puppeteer,PhantomJs等可以实现上述Highchart图表以图片形式导出的功能,它们也常常用于:
- 爬虫
- 生成网页截图/PDF
- 测试等
2、这个需求选用了Puppeteer去完成,原因如下:
- 官方的文档也较为详细,相关API,另外其他项目用它实现PDF生成的实践,迁移到本项目爬的坑也会少点。
- 截出来的图片质量清晰,也满足业务的要求。
3、定时任务的需求则用了Cron实现;在设定的时间点,在后台用Puppeteer打开我们网页,实现特定区域截图。
三、Puppeteer使用
1、 安装,安装puppeteer同时,也会下载Chromium,安装地址为外国网站,下载失败的话多尝试几次、切换到cnpm或者手动下载。如果是部署再Linux上的话,还得安装依赖包才能启动Chromium,具体操作可以查看下面。
# 安装
npm i puppeteer --save
2、任意区域截图
第一张图为图表的HTML页面,第二张图是指定区域的截图,代码如下:
const express = require('express');
const puppeteer = require('puppeteer');
const app = express();
app.use(express.static('public'));
async function screenshot() {
try {
// 添加启动参数'--no-sandbox', '--disable-setuid-sandbox'
// 解决Linux环境下"no use sandbox"报错
const browser = await puppeteer.launch({
args: ['--no-sandbox', '--disable-setuid-sandbox'],
headless: true
});
const page = await browser.newPage();
await page.goto('http://localhost:3008/');
let clip = await page.evaluate(() => {
// 获取指定容器的坐标信息
let { x, y, width, height } = document.getElementById('container').getBoundingClientRect();
return { x, y, width, height };
});
await page.screenshot({
path:'chart.png',
clip:clip //设置clip 属性
});
await page.close();
await browser.close();
} catch (error) {
throw error;
}
}
// 访问http://localhost:3008/screenshot进行截图
app.get('/screenshot', (req, res) => {
screenshot()
.then(data => res.json('clip successed'))
.catch(err => res.json('clip failed'));
});
app.listen(3008);
四、定时任务
const CronJob = require('cron').CronJob;
// 每天9点钟执行定时任务,其他时间可查找corn表达是或者使用corn表达式生成工具
new CronJob({
cronTime: '0 0 9 * * *',
onTick: function () {
screenshot();
},
start: true
});
五、Linux上部署问题
至此,我们实现了导出Highcharts图表的功能,但是这只是在windows系统的开发机上把这个流程跑通,部署到linux机器上是仍需解决以下几点问题
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。