标签: nodejs

Nodejs 模块规范 CJS 与 ESM 及其衍生后缀 .cjs 和 .mjs 文件

自 13.2.0 版本开始，Nodejs 在保留了 CommonJS（CJS）语法的前提下，新增了对 ES Modules（ESM）语法的支持。

天下苦 CJS 久已，Node 逐渐拥抱新标准的规划当然值得称赞，我们也会展望未来 Node 不再需要借助工具，就能打破两种模块化语法的壁垒……

但实际上，一切没有想象中的那么美好。

一、并不完美的 ESM 支持

1.1 在 Node 中使用 ESM

Node 默认只支持 CJS 语法，这意味着你书写了一个 ESM 语法的 js 文件，将无法被执行。

如果想在 Node 中使用 ESM 语法，有两种可行方式：

⑴ 在 package.json 中新增 "type": "module" 配置项。
⑵ 将希望使用 ESM 的文件改为 .mjs 后缀。

对于第一种方式，Node 会将和 package.json 文件同路径下的模块，全部当作 ESM 来解析。

第二种方式不需要修改 package.json，Node 会自动地把全部 xxx.mjs 文件都作为 ESM 来解析。

同理，如果在 package.json 文件中设置 "type": "commonjs"，则表示该路径下模块以 CJS 形式来解析。如果文件后缀名为 .cjs，Node 会自动地将其作为 CJS 模块来解析（即使在 package.json 中配置为 ESM 模式）。

我们可以通过上述修改 package.json 的方式，来让全部模块都以 ESM 形式执行，然后项目上的模块都统一使用 ESM 语法来书写。

如果存在较多陈旧的 CJS 模块懒得修改，也没关系，把它们全部挪到一个文件夹，在该文件夹路径下新增一个内容为 {"type": "commonjs"} 的 package.json 即可。

Node 在解析某个被引用的模块时（无论它是被 import 还是被 require），会根据被引用模块的后缀名，或对应的 package.json 配置去解析该模块。

1.2 ESM 引用 CJS 模块的问题

ESM 基本可以顺利地 import CJS 模块，但对于具名的 exports（Named exports，即被整体赋值的 module.exports），只能以 default export 的形式引入：

/** @file cjs/a.js **/

// named exports

module.exports = {

    foo: () => {

        console.log("It's a foo function...")

    }

}

/** @file index_err.js **/

import { foo } from './cjs/a.js'; 

// SyntaxError: Named export 'foo' not found. The requested module './cjs/a.js' is a CommonJS module, which may not support all module.exports as named exports.

foo();

/** @file index_err.js **/

import pkg from './cjs/a.js';  // 以 default export 的形式引入

pkg.foo();  // 正常执行

具体原因我们会在后续提及。

1.3 CJS 引用 ESM 模块的问题

假设你在开发一个供别人使用的开源项目，且使用 ESM 的形式导出模块，那么问题来了 —— 目前 CJS 的 require 函数无法直接引入 ESM 包，会报错：

let { foo } = require('./esm/b.js');

// Error [ERR_REQUIRE_ESM]: require() of ES Module BlogDemo3\220220\test2\esm\b.js from BlogDemo3\220220\test2\require.js not supported.

// Instead change the require of b.js in BlogDemo3\220220\test2\require.js to a dynamic import() which is available in all CommonJS modules.

//     at Object.<anonymous> (BlogDemo3\220220\test2\require.js:4:15) {

//   code: 'ERR_REQUIRE_ESM'

// }

按照上述错误陈述，我们不能并使用 require 引入 ES 模块（原因会在后续提及），应当改为使用 CJS 模块内置的动态 import 方法：

import('./esm/b.js').then(({ foo }) => {

    foo();

});

// or

(async () => {

    const { foo } = await import('./esm/b.js');

})();

开源项目当然不能强制要求用户改用这种形式来引入，所以又得借助 rollup 之类的工具将项目编译为 CJS 模块……

由上可见目前 Node.js 对 ESM 语法的支持是有限制的，如果不借助工具处理，这些限制可能会很糟心。

对于想入门前端的新手来说，这些麻烦的规则和限制也会让人困惑。

截至我落笔书写本文时， Node.js LTS 版本为 16.14.0，距离开始支持 ESM 的 13.2.0 版本已过去了两年多的时间。

那么为何 Node.js 到现在还无法打通 CJS 和 ESM？

答案并非 Node.js 敌视 ESM 标准从而迟迟不做优化，而是因为 —— CJS 和 ESM，二者真是太不一样了。

二、CJS 和 ESM 的不同点

2.1 不同的加载逻辑

在 CJS 模块中，require() 是一个同步接口，它会直接从磁盘（或网络）读取依赖模块并立即执行对应的脚本。

ESM 标准的模块加载器则完全不同，它读取到脚本后不会直接执行，而是会先进入编译阶段进行模块解析，检查模块上调用了 import 和 export 的地方，并顺腾摸瓜把依赖模块一个个异步、并行地下载下来。

在此阶段 ESM 加载器不会执行任何依赖模块代码，只会进行语法检错、确定模块的依赖关系、确定模块输入和输出的变量。

最后 ESM 会进入执行阶段，按顺序执行各模块脚本。

所以我们常常会说，CommonJS 模块是运行时加载，ES6 模块是编译时输出接口。

在上方 1.2 小节，我们曾提及到 ESM 中无法通过指定依赖模块属性的形式引入 CJS named exports：

/** @file cjs/a.js **/

// named exports

module.exports = {

    foo: () => {

        console.log("It's a foo function...")

    }

}

/** @file index_err.js **/

import { foo } from './cjs/a.js'; 

// SyntaxError: Named export 'foo' not found. The requested module './cjs/a.js' is a CommonJS module, which may not support all module.exports as named exports.

foo();

这是因为 ESM 获取所指定的依赖模块属性（花括号内部的属性），是需要在编译阶段进行静态分析的，而 CJS 的脚本要在执行阶段才能计算出它们的 named exports 的值，会导致 ESM 在编译阶段无法进行分析。

2.2 不同的模式

ESM 默认使用了严格模式（use strict），因此在 ES 模块中的 this 不再指向全局对象（而是 undefined），且变量在声明前无法使用。

这也是为何在浏览器中，<script> 标签如要启用原生引入 ES 模块能力，必须加上 type="module" 告知浏览器应当把它和常规 JS 区分开来处理。

查看 ESM 严格模式的更多限制：

https://es6.ruanyifeng.com/#docs/module#%E4%B8%A5%E6%A0%BC%E6%A8%A1%E5%BC%8F

2.3 ESM 支持“顶级 await”，但 CJS 不行。

ESM 支持顶级 await（top-level await），即 ES 模块中，无须在 async 函数内部就能直接使用 await：

// index.mjs

const { foo } = await import('./c.js');

foo();

在 CSJ 模块中是没有这种能力的（即使使用了动态的 import 接口），这也是为何 require 无法加载 ESM 的原因之一。

试想一下，一个 CJS 模块里的 require 加载器同步地加载了一个 ES 模块，该 ES 模块里异步地 import 了一个 CJS 模块，该 CJS 模块里又同步地去加载一个 ES 模块…… 这种复杂的嵌套逻辑处理起来会变得十分棘手。

2.4 ESM 缺乏 __filename 和 __dirname

在 CJS 中，模块的执行需要用函数包起来，并指定一些常用的值：

NativeModule.wrapper = [

  '(function (exports, require, module, __filename, __dirname) { ',

  '\n});'

];

所以我们才可以在 CJS 模块里直接用 __filename、__dirname。

而 ESM 的标准中不包含这方面的实现，即无法在 Node 的 ESM 里使用 __filename 和 __dirname。

参考：https://github.com/nodejs/node/blob/v4.0.0/src/node.js#L932

从上方几点可以看出，在 Node.js 中，如果要把默认的 CJS 切换到 ESM，会存在巨大的兼容性问题。

这也是 Node.js 目前，甚至未来很长一段时间，都难以解决的一场模块规范持久战。

如果你希望不借助工具和规则，也能放宽心地使用 ESM，可以尝试使用 Deno 替代 Node，它默认采用了 ESM 作为模块规范（当然生态没有 Node 这么完善）。

三、借助工具实现 CJS、ESM 混写

借助构建工具可以实现 CJS 模块、ES 模块的混用，甚至可以在同一个模块同时混写两种规范的 API，让开发不再需要关心 Node.js 上面的限制。另外构建工具还能利用 ESM 在编译阶段静态解析的特性，实现 Tree-shaking 效果，减少冗余代码的输出。

这里我们以 rollup 为例，先做全局安装：

pnpm i -g rollup

接着再安装 rollup-plugin-commonjs 插件，该插件可以让 rollup 支持引入 CJS 模块（rollup 本身是不支持引入 CJS 模块的）：

pnpm i --save-dev @rollup/plugin-commonjs

我们在项目根目录新建 rollup 配置文件 rollup.config.js：

import commonjs from 'rollup-plugin-commonjs';

export default {

  input: 'index.js',  // 入口文件

  output: {

    file: 'bundle.js',  // 目标文件

    format: 'iife'

  },

  plugins: [

    commonjs({

      transformMixedEsModules: true,

      sourceMap: false,

    })

  ]

};

plugin-commonjs 默认会跳过所有含 import/export 的模块，如果要支持如 import + require 的混合写法，需要带 transformMixedEsModules 属性。

接着执行 rollup --config 指令，就能按照 rollup.config.js 进行编译和打包了。

/** @file a.js **/

export let func = () => {

    console.log("It's an a-func...");

}

export let deadCode = () => {

    console.log("[a.js deadCode] Never been called here");

}

/** @file b.js **/

// named exports

module.exports = {

    func() {

        console.log("It's a b-func...")

    },

    deadCode() {

        console.log("[b.js deadCode] Never been called here");

    }

}

/** @file c.js **/

module.exports.func = () => {

    console.log("It's a c-func...")

};

module.exports.deadCode = () => {

    console.log("[c.js deadCode] Never been called here");

}

/** @file index.js **/

let a = require('./a');

import { func as bFunc } from './b.js';

import { func as cFunc } from './c.js';

a.func();

bFunc();

cFunc();

打包后的代码：

(function () {

    'use strict';

    function getAugmentedNamespace(n) {

        if (n.__esModule) return n;

        var a = Object.defineProperty({}, '__esModule', {value: true});

        Object.keys(n).forEach(function (k) {

            var d = Object.getOwnPropertyDescriptor(n, k);

            Object.defineProperty(a, k, d.get ? d : {

                enumerable: true,

                get: function () {

                    return n[k];

                }

            });

        });

        return a;

    }

    let func$1 = () => {

        console.log("It's an a-func...");

    };

    let deadCode = () => {

        console.log("[a.js deadCode] Never been called here");

    };

    var a$1 = /*#__PURE__*/Object.freeze({

        __proto__: null,

        func: func$1,

        deadCode: deadCode

    });

    var require$$0 = /*@__PURE__*/getAugmentedNamespace(a$1);

    var b = {

        func() {

            console.log("It's a b-func...");

        },

        deadCode() {

            console.log("[b.js deadCode] Never been called here");

        }

    };

    var func = () => {

        console.log("It's a c-func...");

    };

    let a = require$$0;

    a.func();

    b.func();

    func();

})();

可以看到，rollup 通过 Tree-shaking 移除掉了从未被调用过的 c 模块的 deadCode 方法，但 a、b 两模块中的 deadCode 代码段未被移除，这是因为我们在引用 a.js 时使用了 require，在 b.js 中使用了 CJS named exports，这些都导致了 rollup 无法利用 ESM 的特性去做静态解析。

常规在开发项目时，还是建议尽量使用 ESM 的语法来书写全部模块，这样可以最大化地利用构建工具来减少最终构建文件的体积。

细说后端模板渲染、客户端渲染、node 中间层、服务器端渲染（ssr）

前端与后端渲染方式的发展大致经历了这样几个阶段：后端模板渲染、客户端渲染、node 中间层、服务器端渲染（ssr）。

1. 后端模板渲染

前端与后端最初的渲染方式是后端模板渲染，就是由后端使用模板引擎渲染好 html 后，返回给前端，前端再用 js 去操作 dom 或者渲染其他动态的部分。

这个过程大致分成以下几个步骤：

说明：

前端请求一个地址 url
后端接收到这个请求，然后根据请求信息，从数据库或者其他地方获取相应的数据
使用模板引擎（如 java>jsp、 php>smarty）将这些数据渲染成 html
将 html 文本返回给前端

在这个过程中，前端的 html 代码需要嵌入到后端代码中（如 java、 php），并且在很多情况下，前端源代码和后端源代码是在一个工程里的。

所以，不难看出，这种方式的有这样的几个不足：

前后端杂揉在一起，不方便本地开发、本地模拟调试，也不方便自动化测试
前端被约束在后端开发的模式中，不能充分使用前端的构建生态，开发效率低下
项目难以管理和维护，也可能会有前后端职责不清的问题

尽管如此，但因为这种方式是最早出现的方式，并且这种渲染方式有一个好处，就是前端能够快速呈现服务器端渲染好的页面，而不用等客户端渲染，这能够提供很好的用户体验与 SEO 友好，所以当下很多比较早的网站或者需要快速响应的展示性网站仍然是使用这种方式。

2. 客户端渲染

随着前端工程化与前后端分离的发展，以及前端组件化技术的出现，如 react、vue 等，客户端渲染已经慢慢变成了主要的开发方式了。

与后端模板渲染刚好相反，客户端渲染的页面渲染都是在客户端进行，后端不负责任何的渲染，只管数据交互。

这个过程大致分成以下几个步骤：

CSR

说明：

前端请求一个地址 url
后端接收到这个请求，然后把相应的 html 文件直接返回给前端
前端解析 js 后，然后通过 ajax 向后台获取相应的数据
然后由 js 将这些数据渲染成页面

这样一来，前端与后端将完全解耦，数据使用全 ajax 的方式进行交互，如此便可前后端分离了。

其实，不难看出，客户端渲染与前后端分离有很大的好处：

前端独立出来，可以充分使用前端生态的强大功能
更好的管理代码，更有效率的开发、调试、测试
前后端代码解耦之后，能更好的扩展、重构

所以，客户端渲染与前后端分离现在已经是主流的开发方式了。

但这种方式也有一些不足：

首屏加载缓慢，因为要等 js 加载完毕后，才能进行渲染
SEO 不友好，因为 html 中几乎没有可用的信息

3. node 中间层

为了解决客户端渲染的不足，便出现了 node 中间层的理念。

传统的 B/S 架构中，是浏览器->后端服务器->浏览器，上文所讲的都是这种架构。

而加入了 node 中间层之后，就变成浏览器->node->后端服务器->node->浏览器。

这个过程大致分成以下几个步骤：

SSR

说明：

前端请求一个地址 url
node 层接收到这个请求，然后根据请求信息，向后端服务器发起请求，获取数据
后端服务器接收到请求，然后根据请求信息，从数据库或者其他地方获取相应的数据，返回给 node 层
node 层根据这些数据渲染好首屏 html
node 层将 html 文本返回给前端

一个典型的 node 中间层应用就是后端提供数据、node 层渲染模板、前端动态渲染。

这个过程中，node 层由前端开发人员掌控，页面中哪些页面在服务器上就渲染好，哪些页面在客户端渲染，由前端开发人员决定。

这样做，达到了以下的目的：

保留后端模板渲染、首屏快速响应、SEO 友好
保留前端后分离、客户端渲染的功能（首屏服务器端渲染、其他客户端渲染）

但这种方式也有一些不足：

增加了一个中间层，应用性能有所降低
增加了架构的复杂度、不稳定性，降低应用的安全性
对开发人员要求高了很多

4. 服务器端渲染（ssr）

大部分情况下，服务器端渲染（ssr）与 node 中间层是同一个概念。

服务器端渲染（ssr）一般特指，在上文讲到的 node 中间层基础上，加上前端组件化技术在服务器上的渲染，特别是 react 和 vue。

react、vue、angular 等框架的出现，让前端组件化技术深入人心，但在一些需要首屏快速加载与 SEO 友好的页面就陷入了两难的境地了。

因为前端组件化技术天生就是给客户端渲染用的，而在服务器端需要被渲染成 html 文本，这确实不是一件很容易的事，所以服务器端渲染（ssr）就是为了解决这个问题。

好在社区一直在不断的探索中，让前端组件化能够在服务器端渲染，比如 next.js、nuxt.js、razzle、react-server、beidou 等。

一般这些框架都会有一些目录结构、书写方式、组件集成、项目构建的要求，自定义属性可能不是很强。

以 next.js 为例，整个应用中是没有 html 文件的，所有的响应 html 都是 node 动态渲染的，包括里面的元信息、 css、js 路径等。渲染过程中， next.js 会根据路由，将首页所有的组件渲染成 html，余下的页面保留原生组件的格式，在客户端渲染。

5. SSR优缺点

1）优点：

更好的 SEO：因为 SPA 页面的内容是通过 Ajax 获取，而搜索引擎爬取工具并不会等待 Ajax 异步完成后再抓取页面内容，所以在 SPA 中是抓取不到页面通过 Ajax 获取到的内容；而 SSR 是直接由服务端返回已经渲染好的页面（数据已经包含在页面中），所以搜索引擎爬取工具可以抓取渲染好的页面；
首屏加载更快：SPA 会等待所有 Vue 编译后的 js 文件都下载完成后，才开始进行页面的渲染，文件下载等需要一定的时间等，所以首屏渲染需要一定的时间；SSR 直接由服务端渲染好页面直接返回显示，无需等待下载 js 文件及再去渲染等，所以 SSR 有更快的内容到达时间；

2）缺点：

更多的开发条件限制：例如服务端渲染只支持 beforCreate 和 created 两个钩子函数，这会导致一些外部扩展库需要特殊处理，才能在服务端渲染应用程序中运行；并且与可以部署在任何静态文件服务器上的完全静态单页面应用程序 SPA 不同，服务端渲染应用程序，需要处于 Node.js server 运行环境；
更多的服务器负载：在 Node.js 中渲染完整的应用程序，显然会比仅仅提供静态文件的 server 更加大量占用CPU 资源，因此如果你预料在高流量环境下使用，请准备相应的服务器负载，并明智地采用缓存策略。

6. spa & ssr选择

不需要首屏快速加载、SEO 友好的，用全客户端渲染。
需要首屏快速加载、SEO 友好的，如果用了如 react、 vue 等组件化技术，将不得不用 node 中间层与服务器端渲染。
如果技术团队不支持，不建议在需要首屏快速加载、SEO 友好的地方使用如 react、 vue 等组件化技术。
前后端分离之后也可以做后端模板渲染，这样前端的调试可以搭配 handlebars、ejs 等模板引擎进行本地调试，而后端的调试则需要到测试机了。

码农备忘录

一个程序员大叔的自留地

标签: nodejs

Nodejs 模块规范 CJS 与 ESM 及其衍生后缀 .cjs 和 .mjs 文件

一、并不完美的 ESM 支持

二、CJS 和 ESM 的不同点

三、借助工具实现 CJS、ESM 混写

细说后端模板渲染、客户端渲染、node 中间层、服务器端渲染（ssr）

1. 后端模板渲染

2. 客户端渲染

3. node 中间层

4. 服务器端渲染（ssr）

5. SSR优缺点

6. spa & ssr选择