Node.js深入学习之浅析require函数中怎么添加钩子

 3084

如何为 Node 的 require 函数添加钩子?下面本篇文章就来带大家了解一下require函数中添加钩子的方法,希望对大家有所帮助!


Node.js深入学习之浅析require函数中怎么添加钩子


Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行时环境。早期的 Node.js 采用的是 CommonJS 模块规范,从 Node v13.2.0 版本开始正式支持 ES Modules 特性。直到 v15.3.0 版本 ES Modules 特性才稳定下来并与 NPM 生态相兼容。


Node.js深入学习之浅析require函数中怎么添加钩子


本文将介绍 Node.js 中 require 函数的工作流程、如何让 Node.js 直接执行 ts 文件及如何正确地劫持 Node.js 的 require 函数,从而实现钩子的功能。接下来,我们先来介绍 require 函数。

require 函数

Node.js 应用由模块组成,每个文件就是一个模块。对于 CommonJS 模块规范来说,我们通过 require 函数来导入模块。那么当我们使用 require 函数来导入模块的时候,该函数内部发生了什么?这里我们通过调用堆栈来了解一下 require 的过程:


Node.js深入学习之浅析require函数中怎么添加钩子


由上图可知,在使用 require 导入模块时,会调用 Module 对象的 load 方法来加载模块,该方法的实现如下所示:

  1. // lib/internal/modules/cjs/loader.js
  2. Module.prototype.load = function(filename) {
  3.   this.filename = filename;
  4.   this.paths = Module._nodeModulePaths(path.dirname(filename));
  5.  
  6.   const extension = findLongestRegisteredExtension(filename);
  7.  
  8.   Module._extensions[extension](this, filename);
  9.   this.loaded = true;
  10.   // 省略部分代码
  11. };

注意:本文所引用 Node.js 源码所对应的版本是 v16.13.1

在以上代码中,重要的两个步骤是:

步骤一:根据文件名找出扩展名;

步骤二:通过解析后的扩展名,在 Module._extensions 对象中查找匹配的加载器。

在 Node.js 中内置了 3 种不同的加载器,用于加载 nodejson 和 js 文件。node 文件加载器

  1. // lib/internal/modules/cjs/loader.js
  2. Module._extensions['.node'] = function(module, filename) {
  3.   return process.dlopen(module, path.toNamespacedPath(filename));
  4. };

json 文件加载器

  1. // lib/internal/modules/cjs/loader.js
  2. Module._extensions['.json'] = function(module, filename) {
  3.     const content = fs.readFileSync(filename, 'utf8');
  4.     try {
  5.         module.exports = JSONParse(stripBOM(content));
  6.     } catch (err) {
  7.         err.message = filename + ': ' + err.message;
  8.         throw err;
  9.     }
  10. };

js 文件加载器

  1. // lib/internal/modules/cjs/loader.js
  2. Module._extensions['.js'] = function(module, filename) {
  3.   // If already analyzed the source, then it will be cached.
  4.   const cached = cjsParseCache.get(module);
  5.   let content;
  6.   if (cached?.source) {
  7.     content = cached.source;
  8.     cached.source = undefined;
  9.   } else {
  10.     content = fs.readFileSync(filename, 'utf8');
  11.   }
  12.   // 省略部分代码
  13.   module._compile(content, filename);
  14. };

下面我们来分析比较重要的 js 文件加载器。通过观察以上代码,我们可知 js 加载器的核心处理流程,也可以分为两个步骤:

步骤一:使用 fs.readFileSync 方法加载 js 文件的内容;

步骤二:使用 module._compile 方法编译已加载的 js 代码。

那么了解以上的知识之后,对我们有什么用处呢?其实在了解 require 函数的工作流程之后,我们就可以扩展 Node.js 的加载器。比如让 Node.js 能够运行 ts 文件。

  1. // register.js
  2. const fs = require("fs");
  3. const Module = require("module");
  4. const { transformSync } = require("esbuild");
  5.  
  6. Module._extensions[".ts"] = function (module, filename) {
  7.   const content = fs.readFileSync(filename, "utf8");
  8.   const { code } = transformSync(content, {
  9.     sourcefile: filename,
  10.     sourcemap: "both",
  11.     loader: "ts",
  12.     format: "cjs",
  13.   });
  14.   module._compile(code, filename);
  15. };

在以上代码中,我们引入了内置的 module 模块,然后利用该模块的 _extensions 对象来注册我们的自定义 ts 加载器。

其实,加载器的本质就是一个函数,在该函数内部我们利用 esbuild 模块提供的 transformSync API 来实现 ts -> js 代码的转换。当完成代码转换之后,会调用 module._compile 方法对代码进行编译操作。

看到这里相信有的小伙伴,也想到了 Webpack 中对应的 loader,想深入学习的话,可以阅读 多图详解,一次性搞懂Webpack Loader 这篇文章。

地址:https://mp.weixin.qq.com/s/2v1uhw2j7yKsb1U5KE2qJA

篇幅有限,具体的编译过程,我们就不展开介绍了。下面我们来看一下如何让自定义的 ts 加载器生效。要让 Node.js 能够执行 ts 代码,我们就需要在执行 ts 代码前,先完成自定义 ts 加载器的注册操作。庆幸的是,Node.js 为我们提供了模块的预加载机制:

  1. $ node --help | grep preload
  2.   -r, --require=... module to preload (option can be repeated)

即利用 -r, --require 命令行配置项,我们就可以预加载指定的模块。了解完相关知识之后,我们来测试一下自定义 ts 加载器。首先创建一个 index.ts 文件并输入以下内容:

  1. // index.ts
  2. const add = (a: number, b: number) => a + b;
  3.  
  4. console.log("add(a, b) = ", add(3, 5));

然后在命令行输入以下命令:

  1. node -r ./register.js index.ts

当以上命令成功运行之后,控制台会输出以下内容:

  1. add(a, b) =  8

很明显我们自定义的 ts 文件加载器生效了,这种扩展机制还是值得我们学习的。另外,需要注意的是在 load 方法中,findLongestRegisteredExtension 函数会判断文件的扩展名是否已经注册在 Module._extensions 对象中,若未注册的话,默认会返回 .js 字符串。

  1. // lib/internal/modules/cjs/loader.js
  2. Module.prototype.load = function(filename) {
  3.   this.filename = filename;
  4.   this.paths = Module._nodeModulePaths(path.dirname(filename));
  5.  
  6.   const extension = findLongestRegisteredExtension(filename);
  7.  
  8.   Module._extensions[extension](this, filename);
  9.   this.loaded = true;
  10.   // 省略部分代码
  11. };

这就意味着只要文件中包含有效的 js 代码,require 函数就能正常加载它。比如下面的 a.txt 文件:

  1. module.exports = "hello world";

看到这里相信你已经了解 require 函数是如何加载模块及如何自定义 Node.js 文件加载器。那么,让 Node.js 支持加载 tspng 或 css 等其它类型的文件,有更优雅、更简单的方案么?答案是有的,我们可以使用 pirates 这个第三方库。


pirates 是什么

pirates 这个库让我们可以正确地劫持 Node.js 的 require 函数。利用这个库,我们就可以很容易扩展 Node.js 加载器的功能。

pirates 的用法

你可以使用 npm 来安装 pirates:

  1. npm install --save pirates

在成功安装 pirates 这个库之后,就可以利用该模块导出提供的 addHook 函数来添加钩子:

  1. // register.js
  2. const addHook = require("pirates").addHook;
  3.  
  4. const revert = addHook(
  5.   (code, filename) => code.replace("@@foo", "console.log('foo');"),
  6.   { exts: [".js"] }
  7. );

需要注意的是调用 addHook 之后会返回一个 revert 函数,用于取消对 require 函数的劫持操作。下面我们来验证一下 pirates 这个库是否能正常工作,首先新建一个 index.js 文件并输入以下内容:

  1. // index.js
  2. console.log("@@foo")

然后在命令行输入以下命令:

  1. node -./register.js index.js

当以上命令成功运行之后,控制台会输出以下内容:

  1. console.log('foo');

观察以上结果可知,我们通过 addHook 函数添加的钩子生效了。是不是觉得挺神奇的,接下来我们来分析一下 pirates 的工作原理。


pirates 是如何工作的

pirates 底层是利用 Node.js 内置 module 模块提供的扩展机制来实现 Hook 功能。前面我们已经介绍过了,当使用 require 函数来加载模块时,Node.js 会根据文件的后缀名来匹配对应的加载器。 其实 pirates 的源码并不会复杂,我们来重点分析 addHook 函数的核心处理逻辑:

  1. // src/index.js
  2. export function addHook(hook, opts = {}) {
  3.   let reverted = false;
  4.   const loaders = []; // 存放新的loader
  5.   const oldLoaders = []; // 存放旧的loader
  6.   let exts;
  7.  
  8.   const originalJSLoader = Module._extensions['.js']; // 原始的JS Loader 
  9.  
  10.   const matcher = opts.matcher || null;
  11.   const ignoreNodeModules = opts.ignoreNodeModules !== false;
  12.   exts = opts.extensions || opts.exts || opts.extension || opts.ext 
  13.     || ['.js'];
  14.   if (!Array.isArray(exts)) {
  15.     exts = [exts];
  16.   }
  17.   exts.forEach((ext) { 
  18.     // ... 
  19.   }
  20. }

为了提高执行效率,addHook 函数提供了 matcher 和 ignoreNodeModules 配置项来实现文件过滤操作。在获取到 exts 扩展名列表之后,就会使用新的加载器来替换已有的加载器。

  1. exts.forEach((ext) => {
  2.     if (typeof ext !== 'string') {
  3.       throw new TypeError(`Invalid Extension: ${ext}`);
  4.     }
  5.     // 获取已注册的loader,若未找到,则默认使用JS Loader
  6.     const oldLoader = Module._extensions[ext] || originalJSLoader;
  7.     oldLoaders[ext] = Module._extensions[ext];
  8.  
  9.     loaders[ext] = Module._extensions[ext] = function newLoader(
  10.       mod, filename) {
  11.       let compile;
  12.       if (!reverted) {
  13.         if (shouldCompile(filename, exts, matcher, ignoreNodeModules)) {
  14.           compile = mod._compile;
  15.           mod._compile = function _compile(code) {
  16.             // 这里需要恢复成原来的_compile函数,否则会出现死循环
  17.             mod._compile = compile;
  18.             // 在编译前先执行用户自定义的hook函数
  19.             const newCode = hook(code, filename);
  20.             if (typeof newCode !== 'string') {
  21.               throw new Error(HOOK_RETURNED_NOTHING_ERROR_MESSAGE);
  22.             }
  23.  
  24.             return mod._compile(newCode, filename);
  25.           };
  26.         }
  27.       }
  28.  
  29.       oldLoader(mod, filename);
  30.     };
  31. });

观察以上代码可知,在 addHook 函数内部是通过替换 mod._compile 方法来实现钩子的功能。即在调用原始的 mod._compile 方法进行编译前,会先调用 hook(code, filename) 函数来执行用户自定义的 hook 函数,从而对代码进行处理。

好的,至此本文的主要内容都介绍完了,在实际工作中,如果你想让 Node.js 直接执行 ts 文件,可以利用 ts-node 或 esbuild-register 这两个库。其中 esbuild-register 这个库内部就是使用了 pirates 提供的 Hook 机制来实现对应的功能。


本文网址:https://www.zztuku.com/index.php/detail-10995.html
站长图库 - Node.js深入学习之浅析require函数中怎么添加钩子
申明:本文转载于《掘金社区》,如有侵犯,请 联系我们 删除。

评论(0)条

您还没有登录,请 登录 后发表评论!

提示:请勿发布广告垃圾评论,否则封号处理!!

    编辑推荐