4

背景

这是一个全栈项目,后端使用 node 。项目需要提供B端与C端两个版本:

  • B端要求支持多实例环境
  • C端要求跨平台离线独立运行

项目中一些复杂的数据处理功能由 C语言 编译而成的 动态链接库(DLL) (在 Linux 下叫做 Shared Library , 简称 SO ,以下统称 DLL),及 python 封装的接口以 http 形式提供服务。在C端版本中,由于需要满足离线独立运行的需求,python 服务被打包成 可执行程序node 通过执行命令行方式调用。

根据以上要求,我们做了以下技术选型。

技术选型

  1. node 版本

    选用了当时的 LTS 版本 10.15.3,但由于后来为了和 Electron 中内置的 node 版本保持统一,修改为了 10.11.0

    虽然 10.15.3 与 10.11.0 感觉版本相差不多,但确实有一些特性不同。例如 fs.mkdir , 10.15.3 支持 recursive 选项,但 10.11.0 不支持,导致迁移到 Electron 时,运行结果不符预期。因此如果同时要开发 B 端与 C 端,为了更方便迁移,最好一开始便确定好 node 的具体版本。

  2. 数据库

    由于需要支持C端 离线独立运行 的需求,数据库选用了 sqlite

    sqlite 是单文件数据库,npm 包 sqlite3 ,是对 sqlite3 引擎的一层封装。一个数据库文件、一个包含数据库引擎的 npm 包,使得C端打包成离线独立运行程序成为可能。

  3. DLL 的载入与调用

    node 中,DLL 的调用,主要借助以下两个 npm 包:

    • ffi : 实现 node 加载并调用 DLL
    • ref : 提供强大的内存指针操作
  4. C 端应用构建与打包

    Electron 是由 Github 开发,用 HTML,CSS 和 JavaScript 来构建跨平台桌面应用程序的一个开源库。Electron 通过将 Chromium 和 Node.js 合并到同一个运行时环境中,并将其打包为 Mac,Windows 和 Linux 系统下的应用来实现这一目的。

    Electron 对前端开发者的友好,及对跨平台的支持,使得我们决定使用 Electron 来对 B 端版本进行一次包装,最大程度复用 B 端代码。主要用到了这几个依赖:

    • electron@4.2.0 : 4.x 版本的 electron 内置的 node 版本是 10.x ,可以与 B 端所用 node 版本匹配
    • electron-builder : 用于 electron 打包

开发环境搭建及问题排查

  1. 依据 DLL位数 确定开发环境

    DLL位数 对开发环境搭建有很大的影响。以本项目为例,某 DLL windows 平台上只提供了 32 位版本,导致我们在开发时,必须选用 32 位 node。万幸的是,不需要系统也为 32 位。

    此处推荐使用 nvm 对 node 版本进行管理,当切换了 node 版本后,类似于 ffi ref sqlite3 node-sass 这样的原生模块都需要重装,借助 node-gyp 或同类工具进行重新编译。

    参考:native module on node.js

  2. 安装 ref ffi sqlite3 等原生模块依赖时,需要借助 node-gyp 来针对当前系统平台进行编译。因此 node-gyp 的安装前置条件必须满足

    参考:github: node-gyp#Installation

    以下为本项目中实践步骤

    • Linux

      • 安装 python v2.7
      • 安装 make
      • 安装 gcc gcc-c++

        • gcc 版本需要与使用的 DLL 依赖的 gcc 版本保持一致,gcc-c++ 需要与 gcc 版本保持一致
    • Windows

      • npm install --global --production windows-build-tools

        • windows-build-tools 能够帮助我们方便地配置好编译 node 原生模块需要的环境
        • 本项目中还使用了参数 --vs2015 ,默认情况安装的是 VS2017 ,一开始遇到了一些问题,后来换成 VS2015 过程要顺畅一些,这个选项可看情况选择
      • npm config set msvs_version 2015 ,如果安装的是 VS2017 ,则值设置为 2017
      • npm config set python python2.7的安装路径
  3. Electron 开发环境

    Electron 开发环境与第 2 点要求一致,不同的是,我们使用的 node 是 Electron 内置的 node ,而非系统安装的 node 。因此需要为 Electron 环境重新编译 node 原生模块。

    这一步可以借助npm包 electron-rebuildelectron-builder 完成

    本项目使用的是第二种方式:

    • 安装依赖 electron-builder
    • 添加 "postinstall": "electron-builder install-app-deps" 到 npm scripts 中,这样每次安装依赖时,将会自动为我们进行原生模块编译

    Electron 版本选择扩展资料:

  4. 安装依赖(其中一些问题也可能出现在 Electron 打包中)

    npm install

DLL 的使用

相比起环境配置, DLL 的使用要更简单。ffi 结合 ref ,基本使用可参考 ffi 官方示例 ref 官方示例

常见问题

  1. DLL 依赖于其他 DLL

    这个问题比较常见,我们尝试过两种方案

    1. 使用 ffi.DynamicLibrary 引入依赖

      let { RTLD_NOW, RTLD_GLOBAL } = ffi.DynamicLibrary.FLAGS;
      // 有多个则执行多次 ffi.DynamicLibrary 来引入多个
      ffi.DynamicLibrary(
          '/path/to/.dll/or/.so',
          RTLD_NOW | RTLD_GLOBAL
      );
    2. 使依赖可全局访问,详情见下文
  2. 遇到错误码为 126 的 win error

    这个表示无法找到 DLL ,可能是路径错误,也可能是其依赖未引入或无法被程序在全局路径访问。开发与部署环境有差异时,很容易遇到这种问题。

    那么我们可以怎样确定缺少的依赖是哪一个呢? Linux 提供了 ldd 支持我们查看程序运行所需的 DLL ,若无法找到某个依赖,其对应的地址将为 not found 。 Windows 自带的 CMD 不支持该命令,但 Git Bash 等工具为我们集成了该功能。另外 Windows 下也可以使用 Dependency Walker 等工具获取依赖。

  3. 想合并多个库到一个对象上

    ffi.Library 第三个参数支持传入一个对象,若传入这个对象, ffi 会将该库新增的方法添加到这个对象上,同名将被覆盖,最终返回这个对象,没有传这个参数时,会返回一个新的对象。可以这样做,但一般来说没有这种需求。

  4. 使用 ffi 读取复杂数据结构

    举一个简单的例子——读取字符串数组

    function readStringArray (buffer, total) {
        let arr = [];
        for (let i = 0; i < total; i++) {
            arr.push(ref.get(buffer, ref.sizeof.pointer * i, ref.types.CString));
        }
        return arr;
    }

    参考:Complex data structures with node-ffi

使 DLL 或其依赖可全局访问

Windows 环境

  • 共享目录方式
Win 32Win 64
32-bit DLLC:/Windows/System32C:/Windows/SysWOW64
64-bit DLL C:/Windows/System32

根据 DLL 位数及操作系统位数的不同,将 DLL 放到以上某个目录即可

  • 环境变量 PATH

    众所周知, Windows 下 PATH 环境变量非常神奇, DLL 也不例外。将 DLL 所在目录的绝对路径加到 PATH 环境变量中,可以实现 DLL 全局访问。放在 node 里面,可以通过如下方式动态设置:

    process.env.PATH += `${path.delimiter}${xxx}`;

Linux 环境

主要是通过命令 ldconfigldconfig 是一个 SO 管理命令,可以使 SO 为系统所共享。 ldconfig 按照一定规则搜寻 SO 并创建链接、缓存,供程序使用。

以下为搜寻范围:

  • /lib 目录
  • /usr/lib 目录
  • /etc/ld.so.conf 文件中声明的目录
  • 通常情况下, /etc/ld.so.conf 文件中会有一行如下内容:

    include ld.so.conf.d/*.conf

    因此,目录 /etc/ld.so.conf.d 里以 .conf 结尾的文件中声明的目录也在搜寻范围

  • 全局变量 LD_LIBRARY_PATH 中设置的目录

因此,将 SO 放置到如上所说的目录中,并执行 ldconfig 即可实现 SO 共享。我们可以修改 /etc/ld.so.conf 文件、新增 /etc/ld.so.conf.d/*.conf 文件或修改全局变量 LD_LIBRARY_PATH

参考:

一个 Linux 开机脚本配合 ldconfig 应用实践

项目中文件解析部分依赖了许多 DLL ,其中有部分对图形界面产生了影响,导致用户再次登录时显示黑屏。

文件解析的 DLL 依赖是通过 node 在程序启动时写了一个文件到 /etc/ld.so.conf.d 下,里面声明了依赖所在路径,linux 开机时会自动加载。而解决黑屏则需要在开机时,自动去除该依赖声明,避免用户无法进入系统桌面。

因此此处需要用到开机脚本在开机时为我们做一些处理,示例如下:

新建文件 delete-ldconfig.sh 内容如下:

#!/bin/bash
# chkconfig: 5 90 10
# description: test

rm -f /etc/ld.so.conf.d/test.conf
ldconfig

执行如下命令:

cp ./delete-ldconfig.sh /etc/rc.d/init.d
cd /etc/rc.d/init.d/
chmod +x delete-ldconfig.sh
chkconfig --add delete-ldconfig.sh
chkconfig delete-ldconfig.sh on

参考:

Electron 主进程繁忙阻塞渲染进程问题

C端进行文件解析测试时,使用了一个 node_modules 目录打包而成的压缩包,体积虽然不算很大,但小文件十分多。调用 DLL 解析时,大致耗时30分钟,后续程序处理又花了较久时间。在此期间,C端应用界面失去响应。

经过查询,原来在 chromium 中,页面渲染时,UI 进程需要和 main process 不断的进行 sync IPC ,若此时 main process 忙,则 UI process 就会在 IPC 时阻塞。

所以,不希望渲染进程被阻塞,就需要为主进程减负。如

  • 在大量同步代码中间断地插入异步处理,将执行权暂时交出
  • 使用多进程

参考:Electron的主进程阻塞导致UI卡顿的问题

中断同步代码

在一开始的实现中,文件解析后的结果处理是使用一个 for 循环,无任何异步操作,是一个 CPU 密集型的任务。

使用以下代码模拟该场景:

(async () => {
    setInterval(() => {
        console.log('=====');
    }, 60);
    while (true) {
        // 一些处理
    }
})();

为了解决这块的阻塞问题,我们可以进行如下改造:

(async () => {
    setInterval(() => {
        console.log('=====');
    }, 60);
    while (true) {
        await new Promise(resolve => {
            setImmediate(() => {
                // 一些处理
                resolve();
            });
        });
    }
})();

使用多进程

在 Electron 中实现多进程有很多选择,如 Web Workers、Node 的 child_process 模块、 cluster 模块、 worker_threads 模块等。

由于 Electron 项目安装的原生模块是经过重新编译的,且应用运行时,会出现环境变量上的差异,导致某些系统程序无法找到。因此,我们不能直接用 child_process.exec 等类似方式来启动我们子进程。

此次实践中,我们经过多种尝试,最终决定采用如下方式:

// 主进程
const bkWorker = child_process.spawn(process.execPath /* 1 */, ['./app.js'], {
    stdio: [0, 1, 2, 'ipc'], /* 2 */
    cwd: __dirname, /* 3 */
    env: process.env /* 4 */
});
bkWorker.on('message', (message) => {
    // ...
});

// 子进程
process.send(/* ... */); /* 5 */

说明:

  1. 指定要执行的程序路径,主进程中, process.execPath 代表的是 electron 程序路径
  2. 启动一个父子进程间的IPC通道方便我们使用 process.send 进行通信
  3. 设置子进程的当前工作目录
  4. 同步父进程的环境变量到子进程

参考:node文档-child_process.spawn

spawn 的子进程意外退出重启处理探究

主进程 index.js

const { spawn } = require('child_process');

let worker;

function serve () {
    worker = spawn(process.execPath, ['./test1.js'], {
        stdio: [0, 1, 2, 'ipc'],
        cwd: __dirname,
        env: process.env
    });
    worker.on('message', (...args) => {
        console.log('message', ...args);
    });
    worker.on('error', (...args) => {
        console.log('error', ...args);
    });
    worker.on('exit', (code, signal) => {
        console.log('exit', code, signal);
    });
    worker.on('disconnect', () => {
        console.log('disconnect');
    });
    // 基本子进程退出,都会触发 worker.on('close')
    // 因此可以在这里做一些子进程重启之类的事
    worker.on('close', (code, signal) => {
        console.log('close', code, signal);
        // serve();
    });

    // 先后触发 worker 的 disconnect exit close 事件, exit 参数为 null SIGTERM
    // setTimeout(() => {
    //     worker.kill();
    // }, 2000);
}

// process.exit :主进程会马上退出,不会影响子进程,要退出子进程需要另做处理
// process.abort :不会影响子进程,要退出子进程需要另做处理
// throw Error :不会影响子进程,要退出子进程需要另做处理
// setTimeout(() => {
//     // process.exit();
//     // process.abort();
//     // throw new Error('1231');
// }, 10000);

setInterval(() => {
    console.log(process.pid, '===');
}, 1000);

serve();

子进程 test1.js

process.on('uncaughtException', (error) => {
    console.log('worker uncaughtException', error);
    process.send({
        type: 'error',
        msg: error
    });
});

process.send('connected');

setInterval(() => {
    console.log(process.pid, '---');
}, 1000);

// 会触发 worker.on('disconnect') ,主 子 进程都不会退出,但连接中断,不能使用 process.send ,会报错
// setTimeout(() => {
//     process.disconnect();
//     // process.send('hello?');
// }, 3000);

// process.abort :先后触发 worker 的 disconnect exit close 事件, exit 及 close 参数为 null SIGABRT
// process.exit :先后触发 worker 的 disconnect exit close 事件, exit 及 close 参数为 0 null
// setTimeout(() => {
//     // process.abort();
//     // process.exit();
// }, 10000);

// 用 process.on('uncaughtException') 处理
// setTimeout(() =>{
//     throw new Error('123');
// }, 1500);

打包后程序执行调试技巧

使用命令行运行程序

进入打包后程序所在目录,假设程序名为“Test”,则执行命令 ./Test 即可执行程序,并且程序中所有控制台输出都会打印在该终端中。我们可以借助输出信息进行调试。

asar

当 windows 打包开启 asar 时,打包后文件资源被归档到一个 asar 档案文件。如果刚好我们需要调试的话,可能需要更改代码后重新打包、安装、运行。但实际上有更方便的方式。

asar 提供命令行工具,通过命令行,我们可以打包、列出归档文件中的文件列表、解压某个单文件、解压整个档案文件等功能。

因此,我们的打包后调试过程可以被简化为:

  • 关闭应用,解压打包后 asar 文件
  • 修改代码,然后将修改后的文件整个重新打包,重启应用

参考:npm-asar

杂项

Linux 虚拟机的安装及常用环境搭建

虚拟机安装:http://note.youdao.com/notesh...

环境搭建:http://note.youdao.com/notesh...

VS Code 调试 Electron 配置文件

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Electron",
            "type": "node",
            "request": "launch",
            "cwd": "${workspaceRoot}",
            "program": "${workspaceFolder}/server/index.js",
            "runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron",
            "windows": {
                "runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron.cmd"
            },
            "args": [
                "."
            ],
            "outputCapture": "std",
            "env": {
                "NODE_ENV": "development"
            }
        }
    ]
}

使用硬链接管理文件资源引用关系

文件链接有两种:硬链接与符号链接。

硬链接直接指向数据,会增加该文件的 inode 计数,数据只会存在一份,所有指向该数据的链接是同步的。在文件系统中, inode 为 0 的数据会被删除。而符号链接是记录的该文件位置,并不会增加文件的 inode 计数,平时我们使用到的快捷方式就是符号链接,目标文件删除,链接并不会消失,但这个链接指向的资源却无法再找到。

在项目中有这样一个问题:整个系统是围绕着文件资源进行的业务处理,各个模块是串联进行,上游输出是下游输入。但各个流程的资源需要允许用户隔离管理,本模块对某个资源的依赖不影响其他模块的删除。

如果要做到相互不依赖,可能的办法有:每个环节都存一份文件。但是这种方式,会浪费大量的硬盘空间,数据同步也不好处理。因此最终我们选择使用硬链接来实现该部分需求。

硬链接操作起来非常简单,在 node 中主要有以下几个操作:

const fs = require('fs');
fs.link(existingPath, newPath, callback); // 创建硬链接
fs.unlink(path, callback); // 删除硬链接
fs.stat(path[, options], callback).nlink; // 查看 inode 数

参考:

postgre 数据导出

rm -f dlp.sql&&pg_dump -U 用户名 -d 数据库名 -f 文件名.sql -h 服务器host -p 端口 -s

参考:pg_dump

错误处理

事件相关

  • 事件内抛出的错误会被外层捕获

    const { EventEmitter } = require('events');
    const event = new EventEmitter();
    event.on('test', () => {
        // throw new Error('1');
        try {
            throw new Error('2');
        } catch (e) {
            event.emit('error', e);
        }
    });
    event.on('error', (e) => {
        console.log(e); // Error: 2
    });
    try {
        event.emit('test');
    } catch (e) {
        console.log(e); // Error: 1
    }

同步异步相关

  • Promise 中的错误处理

    await 非常关键,没有 awaittry 无法捕获到 catchthrow 的错误

    (async () => {
        try {
            let res = await new Promise(() => {
                throw new Error(2);
            }).catch(error => {
                if (error.message === '1') {
                    return Promise.resolve('haha');
                } else throw error;
            });
            console.log(res);
        } catch (e) {
            debugger;
        }
    })();

跨盘符移动文件

function moveFileCrossDevice (source, target) {
    return new Promise((resolve, reject) => {
        try {
            if (!fs.existsSync(source)) reject(new BEKnownError('源文件不存在'));
            let readStream = fs.createReadStream(source);
            let writeStream = fs.createWriteStream(target);
            readStream.on('end',function(){
                fs.unlinkSync(source);
                resolve();
            });
            readStream.on('error', (error) => {
                reject(error);
            });
            writeStream.on('error', (error) => {
                reject(error);
            });
            readStream.pipe(writeStream);
        } catch (e) {
            reject(e);
        }
    });
}

docker 常用命令

http://note.youdao.com/notesh...


1059802125
19 声望3 粉丝