工具和资料
- QQ群 - Javascript高级爬虫 - 作者自建群,欢迎加入!
- awesome-java-crawler - 作者收集的爬虫相关工具和资料
正文
一些小的javascript片段可以很方便的直接使用ScriptEngine.eval()直接导入,但是如何使用require方法导入使用npm下载的javascript模块呢?
答案是使用jvm-npm这个项目。
- 首先,创建一个目录放置所有javascript文件,比如:
D:\\path\\to\\js_modules\\
- 从jvm-npm下载jvm-npm.js,放到上述目录中
- 使用
npm i <js_module> -g
下载你需要引用的npm模块,注意看最后的提示,即模块下载目录 - 到模块下载目录,通常为<User_Dir>\npm\node_modules\<js_module>,里面一般有个dist目录,从里面找到完整的模块js文件,复制到上述目录
- 见以下Kotlin示例代码:(注意把js_module换成你需要加载的模块名)
val JS_ROOT = "D:\\path\\to\\js_modules"
val JSE = ScriptEngineManager().getEngineByName("nashorn").apply {
System.setProperty("user.dir", JS_ROOT) // 设定jvm-npm的当前目录
eval(Util.readLocalUtfText("$JS_ROOT\\jvm-npm.js")) // 在ScriptEngine中加载jvm-npm.js
println(eval("typeof require")) // 验证require方法已正确引入
eval("var mylib = require('js_module')") // 这时候,就可以用require()方法来引入当前目录中的js模块了
println(eval("typeof mylib")) // 验证js模块已正确加载
}
...
val bar = JSE.eval("mylib.foo()") // js代码中可以使用加载的js模块了
注意:
- jvm-npm有个bug,如果你的js文件大于64K,则会导致文件截断。
这种情况下你需要编写一个能一次读取完整File或InputStream的java方法,替换掉下面这句:
return new Scanner(input).useDelimiter('\\A').next()
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。