记一次 Electron + DLL/SO(node-ffi) + sqlite3 项目实践

背景

这是一个全栈项目，后端使用 node 。项目需要提供B端与C端两个版本：

B端要求支持多实例环境
C端要求跨平台离线独立运行

项目中一些复杂的数据处理功能由 C语言 编译而成的 动态链接库（DLL） （在 Linux 下叫做 Shared Library ，简称 SO ，以下统称 DLL），及 python 封装的接口以 http 形式提供服务。在C端版本中，由于需要满足离线独立运行的需求，python 服务被打包成 可执行程序 ， node 通过执行命令行方式调用。

根据以上要求，我们做了以下技术选型。

技术选型

node 版本
选用了当时的 LTS 版本 10.15.3，但由于后来为了和 Electron 中内置的 node 版本保持统一，修改为了 10.11.0。
虽然 10.15.3 与 10.11.0 感觉版本相差不多，但确实有一些特性不同。例如 fs.mkdir ， 10.15.3 支持 recursive 选项，但 10.11.0 不支持，导致迁移到 Electron 时，运行结果不符预期。因此如果同时要开发 B 端与 C 端，为了更方便迁移，最好一开始便确定好 node 的具体版本。
数据库
由于需要支持C端 离线独立运行 的需求，数据库选用了 sqlite 。
sqlite 是单文件数据库，npm 包 sqlite3 ，是对 sqlite3 引擎的一层封装。一个数据库文件、一个包含数据库引擎的 npm 包，使得C端打包成离线独立运行程序成为可能。
DLL 的载入与调用
在 node 中，DLL 的调用，主要借助以下两个 npm 包：
- ffi : 实现 node 加载并调用 DLL
- ref : 提供强大的内存指针操作
C 端应用构建与打包
Electron 是由 Github 开发，用 HTML，CSS 和 JavaScript 来构建跨平台桌面应用程序的一个开源库。Electron 通过将 Chromium 和 Node.js 合并到同一个运行时环境中，并将其打包为 Mac，Windows 和 Linux 系统下的应用来实现这一目的。
Electron 对前端开发者的友好，及对跨平台的支持，使得我们决定使用 Electron 来对 B 端版本进行一次包装，最大程度复用 B 端代码。主要用到了这几个依赖：
- electron@4.2.0 : 4.x 版本的 electron 内置的 node 版本是 10.x ，可以与 B 端所用 node 版本匹配
- electron-builder : 用于 electron 打包

开发环境搭建及问题排查

依据 DLL 的 位数 确定开发环境
DLL 的 位数 对开发环境搭建有很大的影响。以本项目为例，某 DLL windows 平台上只提供了 32 位版本，导致我们在开发时，必须选用 32 位 node。万幸的是，不需要系统也为 32 位。
此处推荐使用 nvm 对 node 版本进行管理，当切换了 node 版本后，类似于 ffi ref sqlite3 node-sass 这样的原生模块都需要重装，借助 node-gyp 或同类工具进行重新编译。
参考：native module on node.js
安装 ref ffi sqlite3 等原生模块依赖时，需要借助 node-gyp 来针对当前系统平台进行编译。因此 node-gyp 的安装前置条件必须满足
参考：github: node-gyp#Installation
以下为本项目中实践步骤
- Linux
  - 安装 python v2.7
  - 安装 make
  - 安装 gcc gcc-c++
    - gcc 版本需要与使用的 DLL 依赖的 gcc 版本保持一致，gcc-c++ 需要与 gcc 版本保持一致
- Windows
  - npm install --global --production windows-build-tools
    - windows-build-tools 能够帮助我们方便地配置好编译 node 原生模块需要的环境
    - 本项目中还使用了参数 --vs2015 ，默认情况安装的是 VS2017 ，一开始遇到了一些问题，后来换成 VS2015 过程要顺畅一些，这个选项可看情况选择
  - npm config set msvs_version 2015 ，如果安装的是 VS2017 ，则值设置为 2017
  - npm config set python python2.7的安装路径
Electron 开发环境
Electron 开发环境与第 2 点要求一致，不同的是，我们使用的 node 是 Electron 内置的 node ，而非系统安装的 node 。因此需要为 Electron 环境重新编译 node 原生模块。
这一步可以借助npm包 electron-rebuild 或 electron-builder 完成
- electron-rebuild 方式：Electron 文档：使用 Node 原生模块
- electron-builder 方式：electron-builder：Quick Setup Guide
本项目使用的是第二种方式：
- 安装依赖 electron-builder
- 添加 "postinstall": "electron-builder install-app-deps" 到 npm scripts 中，这样每次安装依赖时，将会自动为我们进行原生模块编译
Electron 版本选择扩展资料：
安装依赖（其中一些问题也可能出现在 Electron 打包中）
```
npm install
```
- 依赖建议使用 npm 而不是 cnpm 进行安装，参考
- linux 环境安装时，如果当前用户为 root ，则需要添加参数 --unsafe-perm ，否则会遇到 EACCES: permission denied 等权限不足错误
- 若遇到 v140 相关报错，需安装 v140 工具集 ，可用的一个方法：通过 Visual Studio 安装
- 若 MSBuild 时报错信息出现了 Microsoft.Cpp.Default.props 相关信息，且发现寻找的地址并不正确
  可尝试设置环境变量：
```
set VCTargetsPath=C:\Program Files(x86)\MSBuild\Microsoft.Cpp\v4.0\V140
```
  该路径一般是这样的，但也有可能有所不同，根据实际情况设置
  参考：StackOverflow：Why does MSBuild look in C:\ for Microsoft.Cpp.Default.props instead of c:\Program Files (x86)\MSBuild? ( error MSB4019)
- rcedit.exe failed - unable to commit changes

`DLL` 的使用

相比起环境配置， DLL 的使用要更简单。ffi 结合 ref ，基本使用可参考 ffi 官方示例 ref 官方示例。

常见问题

DLL 依赖于其他 DLL

这个问题比较常见，我们尝试过两种方案

使用 ffi.DynamicLibrary 引入依赖

let { RTLD_NOW, RTLD_GLOBAL } = ffi.DynamicLibrary.FLAGS;
// 有多个则执行多次 ffi.DynamicLibrary 来引入多个
ffi.DynamicLibrary(
    '/path/to/.dll/or/.so',
    RTLD_NOW | RTLD_GLOBAL
);

使依赖可全局访问，详情见下文

遇到错误码为 126 的 win error
这个表示无法找到 DLL ，可能是路径错误，也可能是其依赖未引入或无法被程序在全局路径访问。开发与部署环境有差异时，很容易遇到这种问题。
那么我们可以怎样确定缺少的依赖是哪一个呢？ Linux 提供了 ldd 支持我们查看程序运行所需的 DLL ，若无法找到某个依赖，其对应的地址将为 not found 。 Windows 自带的 CMD 不支持该命令，但 Git Bash 等工具为我们集成了该功能。另外 Windows 下也可以使用 Dependency Walker 等工具获取依赖。
想合并多个库到一个对象上
ffi.Library 第三个参数支持传入一个对象，若传入这个对象， ffi 会将该库新增的方法添加到这个对象上，同名将被覆盖，最终返回这个对象，没有传这个参数时，会返回一个新的对象。可以这样做，但一般来说没有这种需求。

使用 ffi 读取复杂数据结构

举一个简单的例子——读取字符串数组

function readStringArray (buffer, total) {
    let arr = [];
    for (let i = 0; i < total; i++) {
        arr.push(ref.get(buffer, ref.sizeof.pointer * i, ref.types.CString));
    }
    return arr;
}

参考：Complex data structures with node-ffi

使 DLL 或其依赖可全局访问

Windows 环境

	Win 32	Win 64
32-bit DLL	C:/Windows/System32	C:/Windows/SysWOW64
64-bit DLL		C:/Windows/System32


根据 DLL 位数及操作系统位数的不同，将 DLL 放到以上某个目录即可

环境变量 PATH
众所周知， Windows 下 PATH 环境变量非常神奇， DLL 也不例外。将 DLL 所在目录的绝对路径加到 PATH 环境变量中，可以实现 DLL 全局访问。放在 node 里面，可以通过如下方式动态设置：
```
process.env.PATH += `${path.delimiter}${xxx}`;
```

Linux 环境

主要是通过命令 ldconfig 。 ldconfig 是一个 SO 管理命令，可以使 SO 为系统所共享。 ldconfig 按照一定规则搜寻 SO 并创建链接、缓存，供程序使用。

以下为搜寻范围：

/lib 目录
/usr/lib 目录
/etc/ld.so.conf 文件中声明的目录
通常情况下， /etc/ld.so.conf 文件中会有一行如下内容：
```
include ld.so.conf.d/*.conf
```
因此，目录 /etc/ld.so.conf.d 里以 .conf 结尾的文件中声明的目录也在搜寻范围
全局变量 LD_LIBRARY_PATH 中设置的目录

因此，将 SO 放置到如上所说的目录中，并执行 ldconfig 即可实现 SO 共享。我们可以修改 /etc/ld.so.conf 文件、新增 /etc/ld.so.conf.d/*.conf 文件或修改全局变量 LD_LIBRARY_PATH 。

参考：

一个 Linux 开机脚本配合 ldconfig 应用实践

项目中文件解析部分依赖了许多 DLL ，其中有部分对图形界面产生了影响，导致用户再次登录时显示黑屏。

文件解析的 DLL 依赖是通过 node 在程序启动时写了一个文件到 /etc/ld.so.conf.d 下，里面声明了依赖所在路径，linux 开机时会自动加载。而解决黑屏则需要在开机时，自动去除该依赖声明，避免用户无法进入系统桌面。

因此此处需要用到开机脚本在开机时为我们做一些处理，示例如下：

新建文件 delete-ldconfig.sh 内容如下：

#!/bin/bash
# chkconfig: 5 90 10
# description: test

rm -f /etc/ld.so.conf.d/test.conf
ldconfig

执行如下命令：

cp ./delete-ldconfig.sh /etc/rc.d/init.d
cd /etc/rc.d/init.d/
chmod +x delete-ldconfig.sh
chkconfig --add delete-ldconfig.sh
chkconfig delete-ldconfig.sh on

参考：

Electron 主进程繁忙阻塞渲染进程问题

C端进行文件解析测试时，使用了一个 node_modules 目录打包而成的压缩包，体积虽然不算很大，但小文件十分多。调用 DLL 解析时，大致耗时30分钟，后续程序处理又花了较久时间。在此期间，C端应用界面失去响应。

经过查询，原来在 chromium 中，页面渲染时，UI 进程需要和 main process 不断的进行 sync IPC ，若此时 main process 忙，则 UI process 就会在 IPC 时阻塞。

所以，不希望渲染进程被阻塞，就需要为主进程减负。如

在大量同步代码中间断地插入异步处理，将执行权暂时交出
使用多进程

参考：Electron的主进程阻塞导致UI卡顿的问题

中断同步代码

在一开始的实现中，文件解析后的结果处理是使用一个 for 循环，无任何异步操作，是一个 CPU 密集型的任务。

使用以下代码模拟该场景：

(async () => {
    setInterval(() => {
        console.log('=====');
    }, 60);
    while (true) {
        // 一些处理
    }
})();

为了解决这块的阻塞问题，我们可以进行如下改造：

(async () => {
    setInterval(() => {
        console.log('=====');
    }, 60);
    while (true) {
        await new Promise(resolve => {
            setImmediate(() => {
                // 一些处理
                resolve();
            });
        });
    }
})();

使用多进程

在 Electron 中实现多进程有很多选择，如 Web Workers、Node 的 child_process 模块、 cluster 模块、 worker_threads 模块等。

由于 Electron 项目安装的原生模块是经过重新编译的，且应用运行时，会出现环境变量上的差异，导致某些系统程序无法找到。因此，我们不能直接用 child_process.exec 等类似方式来启动我们子进程。

此次实践中，我们经过多种尝试，最终决定采用如下方式：

// 主进程
const bkWorker = child_process.spawn(process.execPath /* 1 */, ['./app.js'], {
    stdio: [0, 1, 2, 'ipc'], /* 2 */
    cwd: __dirname, /* 3 */
    env: process.env /* 4 */
});
bkWorker.on('message', (message) => {
    // ...
});

// 子进程
process.send(/* ... */); /* 5 */

说明：

指定要执行的程序路径，主进程中， process.execPath 代表的是 electron 程序路径
启动一个父子进程间的IPC通道方便我们使用 process.send 进行通信
设置子进程的当前工作目录
同步父进程的环境变量到子进程

参考：node文档-child_process.spawn

spawn 的子进程意外退出重启处理探究

主进程 index.js

const { spawn } = require('child_process');

let worker;

function serve () {
    worker = spawn(process.execPath, ['./test1.js'], {
        stdio: [0, 1, 2, 'ipc'],
        cwd: __dirname,
        env: process.env
    });
    worker.on('message', (...args) => {
        console.log('message', ...args);
    });
    worker.on('error', (...args) => {
        console.log('error', ...args);
    });
    worker.on('exit', (code, signal) => {
        console.log('exit', code, signal);
    });
    worker.on('disconnect', () => {
        console.log('disconnect');
    });
    // 基本子进程退出，都会触发 worker.on('close')
    // 因此可以在这里做一些子进程重启之类的事
    worker.on('close', (code, signal) => {
        console.log('close', code, signal);
        // serve();
    });

    // 先后触发 worker 的 disconnect exit close 事件， exit 参数为 null SIGTERM
    // setTimeout(() => {
    //     worker.kill();
    // }, 2000);
}

// process.exit ：主进程会马上退出，不会影响子进程，要退出子进程需要另做处理
// process.abort ：不会影响子进程，要退出子进程需要另做处理
// throw Error ：不会影响子进程，要退出子进程需要另做处理
// setTimeout(() => {
//     // process.exit();
//     // process.abort();
//     // throw new Error('1231');
// }, 10000);

setInterval(() => {
    console.log(process.pid, '===');
}, 1000);

serve();

子进程 test1.js

process.on('uncaughtException', (error) => {
    console.log('worker uncaughtException', error);
    process.send({
        type: 'error',
        msg: error
    });
});

process.send('connected');

setInterval(() => {
    console.log(process.pid, '---');
}, 1000);

// 会触发 worker.on('disconnect') ，主 子 进程都不会退出，但连接中断，不能使用 process.send ，会报错
// setTimeout(() => {
//     process.disconnect();
//     // process.send('hello?');
// }, 3000);

// process.abort ：先后触发 worker 的 disconnect exit close 事件， exit 及 close 参数为 null SIGABRT
// process.exit ：先后触发 worker 的 disconnect exit close 事件， exit 及 close 参数为 0 null
// setTimeout(() => {
//     // process.abort();
//     // process.exit();
// }, 10000);

// 用 process.on('uncaughtException') 处理
// setTimeout(() =>{
//     throw new Error('123');
// }, 1500);

打包后程序执行调试技巧

使用命令行运行程序

进入打包后程序所在目录，假设程序名为“Test”，则执行命令 ./Test 即可执行程序，并且程序中所有控制台输出都会打印在该终端中。我们可以借助输出信息进行调试。

asar

当 windows 打包开启 asar 时，打包后文件资源被归档到一个 asar 档案文件。如果刚好我们需要调试的话，可能需要更改代码后重新打包、安装、运行。但实际上有更方便的方式。

asar 提供命令行工具，通过命令行，我们可以打包、列出归档文件中的文件列表、解压某个单文件、解压整个档案文件等功能。

因此，我们的打包后调试过程可以被简化为：

关闭应用，解压打包后 asar 文件
修改代码，然后将修改后的文件整个重新打包，重启应用

参考：npm-asar

杂项

Linux 虚拟机的安装及常用环境搭建

虚拟机安装：http://note.youdao.com/notesh...

环境搭建：http://note.youdao.com/notesh...

VS Code 调试 Electron 配置文件

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Electron",
            "type": "node",
            "request": "launch",
            "cwd": "${workspaceRoot}",
            "program": "${workspaceFolder}/server/index.js",
            "runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron",
            "windows": {
                "runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron.cmd"
            },
            "args": [
                "."
            ],
            "outputCapture": "std",
            "env": {
                "NODE_ENV": "development"
            }
        }
    ]
}

使用硬链接管理文件资源引用关系

文件链接有两种：硬链接与符号链接。

硬链接直接指向数据，会增加该文件的 inode 计数，数据只会存在一份，所有指向该数据的链接是同步的。在文件系统中， inode 为 0 的数据会被删除。而符号链接是记录的该文件位置，并不会增加文件的 inode 计数，平时我们使用到的快捷方式就是符号链接，目标文件删除，链接并不会消失，但这个链接指向的资源却无法再找到。

在项目中有这样一个问题：整个系统是围绕着文件资源进行的业务处理，各个模块是串联进行，上游输出是下游输入。但各个流程的资源需要允许用户隔离管理，本模块对某个资源的依赖不影响其他模块的删除。

如果要做到相互不依赖，可能的办法有：每个环节都存一份文件。但是这种方式，会浪费大量的硬盘空间，数据同步也不好处理。因此最终我们选择使用硬链接来实现该部分需求。

硬链接操作起来非常简单，在 node 中主要有以下几个操作：

const fs = require('fs');
fs.link(existingPath, newPath, callback); // 创建硬链接
fs.unlink(path, callback); // 删除硬链接
fs.stat(path[, options], callback).nlink; // 查看 inode 数

参考：

postgre 数据导出

rm -f dlp.sql&&pg_dump -U 用户名 -d 数据库名 -f 文件名.sql -h 服务器host -p 端口 -s

参考：pg_dump

错误处理

事件相关

事件内抛出的错误会被外层捕获

const { EventEmitter } = require('events');
const event = new EventEmitter();
event.on('test', () => {
    // throw new Error('1');
    try {
        throw new Error('2');
    } catch (e) {
        event.emit('error', e);
    }
});
event.on('error', (e) => {
    console.log(e); // Error: 2
});
try {
    event.emit('test');
} catch (e) {
    console.log(e); // Error: 1
}

同步异步相关

Promise 中的错误处理

await 非常关键，没有 await，try 无法捕获到 catch 中 throw 的错误

(async () => {
    try {
        let res = await new Promise(() => {
            throw new Error(2);
        }).catch(error => {
            if (error.message === '1') {
                return Promise.resolve('haha');
            } else throw error;
        });
        console.log(res);
    } catch (e) {
        debugger;
    }
})();

跨盘符移动文件

function moveFileCrossDevice (source, target) {
    return new Promise((resolve, reject) => {
        try {
            if (!fs.existsSync(source)) reject(new BEKnownError('源文件不存在'));
            let readStream = fs.createReadStream(source);
            let writeStream = fs.createWriteStream(target);
            readStream.on('end',function(){
                fs.unlinkSync(source);
                resolve();
            });
            readStream.on('error', (error) => {
                reject(error);
            });
            writeStream.on('error', (error) => {
                reject(error);
            });
            readStream.pipe(writeStream);
        } catch (e) {
            reject(e);
        }
    });
}

docker 常用命令

http://note.youdao.com/notesh...

记一次 Electron + DLL/SO(node-ffi) + sqlite3 项目实践

背景

技术选型

开发环境搭建及问题排查

`DLL` 的使用

常见问题

使 DLL 或其依赖可全局访问

Windows 环境

Linux 环境

一个 Linux 开机脚本配合 ldconfig 应用实践

Electron 主进程繁忙阻塞渲染进程问题

中断同步代码

使用多进程

spawn 的子进程意外退出重启处理探究

主进程 index.js

子进程 test1.js

打包后程序执行调试技巧

使用命令行运行程序

asar

杂项

Linux 虚拟机的安装及常用环境搭建

VS Code 调试 Electron 配置文件

使用硬链接管理文件资源引用关系

postgre 数据导出

错误处理

事件相关

同步异步相关

跨盘符移动文件

docker 常用命令

1059802125

引用和评论

记一个笔试题

原生electron起步-从零到一完成构建和打包

Koa+Typescript起手式(空环境) 不用每次玩node都要搭环境了！

解决windows下安装electron 8.0.0 在node install.js卡住的问题

Nest.js中文文档上线啦！(最新V11版本)

7天撸完KTV点歌系统,含后台管理系统(完整版)

Node.js使用puppeteerjs提取网页中的视频地址

记一次 Electron + DLL/SO(node-ffi) + sqlite3 项目实践

背景

技术选型

开发环境搭建及问题排查

DLL 的使用

常见问题

使 DLL 或其依赖可全局访问

Windows 环境

Linux 环境

一个 Linux 开机脚本配合 ldconfig 应用实践

Electron 主进程繁忙阻塞渲染进程问题

中断同步代码

使用多进程

spawn 的子进程意外退出重启处理探究

主进程 index.js

子进程 test1.js

打包后程序执行调试技巧

使用命令行运行程序

asar

杂项

Linux 虚拟机的安装及常用环境搭建

VS Code 调试 Electron 配置文件

使用硬链接管理文件资源引用关系

postgre 数据导出

错误处理

事件相关

同步异步相关

跨盘符移动文件

docker 常用命令

1059802125

引用和评论

记一个笔试题

原生electron起步-从零到一完成构建和打包

Koa+Typescript起手式(空环境) 不用每次玩node都要搭环境了！

解决windows下安装electron 8.0.0 在node install.js卡住的问题

Nest.js中文文档上线啦！(最新V11版本)

7天撸完KTV点歌系统,含后台管理系统(完整版)

Node.js使用puppeteerjs提取网页中的视频地址

`DLL` 的使用