Commonjs規范及Node模塊實現


前面的話

  Node在實現中並非完全按照CommonJS規范實現,而是對模塊規范進行了一定的取舍,同時也增加了少許自身需要的特性。本文將詳細介紹NodeJS的模塊實現

 

引入

  nodejs是區別於javascript的,在javascript中的頂層對象是window,而在node中的頂層對象是global

  [注意]實際上,javascript也存在global對象,只是其並不對外訪問,而使用window對象指向global對象而已

  在javascript中,通過var a = 100;是可以通過window.a來得到100的

  但在nodejs中,是不能通過global.a來訪問,得到的是undefined

  這是因為var a = 100;這個語句中的變量a,只是模塊范圍內的變量a,而不是global對象下的a

  在nodejs中,一個文件就是一個模塊,每個模塊都有自己的作用域。使用var來聲明的一個變量,它並不是全局的,而是屬於當前模塊下

  如果要在全局作用域下聲明變量,則如下所示

 

概述

  Node中模塊分為兩類:一類是Node提供的模塊,稱為核心模塊;另一類是用戶編寫的模塊,稱為文件模塊

  核心模塊部分在Node源代碼的編譯過程中,編譯進了二進制執行文件。在Node進程啟動時,部分核心模塊就被直接加載進內存中,所以這部分核心模塊引入時,文件定位和編譯執行這兩個步驟可以省略掉,並且在路徑分析中優先判斷,所以它的加載速度是最快的

  文件模塊則是在運行時動態加載,需要完整的路徑分析、文件定位、編譯執行過程,速度比核心模塊慢

  接下來,我們展開詳細的模塊加載過程

 

模塊加載

  在javascript中,加載模塊使用script標簽即可,而在nodejs中,如何在一個模塊中,加載另一個模塊呢?

  使用require()方法來引入

【緩存加載】

  再展開介紹require()方法的標識符分析之前,需要知道,與前端瀏覽器會緩存靜態腳本文件以提高性能一樣,Node對引入過的模塊都會進行緩存,以減少二次引入時的開銷。不同的地方在於,瀏覽器僅僅緩存文件,而Node緩存的是編譯和執行之后的對象

  不論是核心模塊還是文件模塊,require()方法對相同模塊的二次加載都一律采用緩存優先的方式,這是第一優先級的。不同之處在於核心模塊的緩存檢查先於文件模塊的緩存檢查

【標識符分析】

  require()方法接受一個標識符作為參數。在Node實現中,正是基於這樣一個標識符進行模塊查找的。模塊標識符在Node中主要分為以下幾類:[1]核心模塊,如http、fs、path等;[2].或..開始的相對路徑文件模塊;[3]以/開始的絕對路徑文件模塊;[4]非路徑形式的文件模塊,如自定義的connect模塊

  根據參數的不同格式,require命令去不同路徑尋找模塊文件

  1、如果參數字符串以“/”開頭,則表示加載的是一個位於絕對路徑的模塊文件。比如,require('/home/marco/foo.js')將加載/home/marco/foo.js

  2、如果參數字符串以“./”開頭,則表示加載的是一個位於相對路徑(跟當前執行腳本的位置相比)的模塊文件。比如,require('./circle')將加載當前腳本同一目錄的circle.js

  3、如果參數字符串不以“./“或”/“開頭,則表示加載的是一個默認提供的核心模塊(位於Node的系統安裝目錄中),或者一個位於各級node_modules目錄的已安裝模塊(全局安裝或局部安裝)

  [注意]如果是當前路徑下的文件模塊,一定要以./開頭,否則nodejs會試圖去加載核心模塊,或node_modules內的模塊 

//a.js
console.log('aaa');

//b.js
require('./a');//'aaa'
require('a');//報錯

【文件擴展名分析】

  require()在分析標識符的過程中,會出現標識符中不包含文件擴展名的情況。CommonJS模塊規范也允許在標識符中不包含文件擴展名,這種情況下,Node會先查找是否存在沒有后綴的該文件,如果沒有,再按.js、.json、.node的次序補足擴展名,依次嘗試

  在嘗試的過程中,需要調用fs模塊同步阻塞式地判斷文件是否存在。因為Node是單線程的,所以這里是一個會引起性能問題的地方。小訣竅是:如果是.node和.json文件,在傳遞給require()的標識符中帶上擴展名,會加快一點速度。另一個訣竅是:同步配合緩存,可以大幅度緩解Node單線程中阻塞式調用的缺陷

【目錄分析和包】

  在分析標識符的過程中,require()通過分析文件擴展名之后,可能沒有查找到對應文件,但卻得到一個目錄,這在引入自定義模塊和逐個模塊路徑進行查找時經常會出現,此時Node會將目錄當做一個包來處理

  在這個過程中,Node對CommonJS包規范進行了一定程度的支持。首先,Node在當前目錄下查找package.json(CommonJS包規范定義的包描述文件),通過JSON.parse()解析出包描述對象,從中取出main屬性指定的文件名進行定位。如果文件名缺少擴展名,將會進入擴展名分析的步驟

  而如果main屬性指定的文件名錯誤,或者壓根沒有package.json文件,Node會將index當做默認文件名,然后依次查找index.js、index.json、index.node

  如果在目錄分析的過程中沒有定位成功任何文件,則自定義模塊進入下一個模塊路徑進行查找。如果模塊路徑數組都被遍歷完畢,依然沒有查找到目標文件,則會拋出查找失敗的異常

 

訪問變量

  如何在一個模塊中訪問另外一個模塊中定義的變量呢? 

【global】

  最容易想到的方法,把一個模塊定義的變量復制到全局環境global中,然后另一個模塊訪問全局環境即可

//a.js
var a = 100;
global.a = a;

//b.js
require('./a');
console.log(global.a);//100

  這種方法雖然簡單,但由於會污染全局環境,不推薦使用

【module】

  而常用的方法是使用nodejs提供的模塊對象Module,該對象保存了當前模塊相關的一些信息

function Module(id, parent) {
    this.id = id;
    this.exports = {};
    this.parent = parent;
    if (parent && parent.children) {
        parent.children.push(this);
    }
    this.filename = null;
    this.loaded = false;
    this.children = [];
}
module.id 模塊的識別符,通常是帶有絕對路徑的模塊文件名。
module.filename 模塊的文件名,帶有絕對路徑。
module.loaded 返回一個布爾值,表示模塊是否已經完成加載。
module.parent 返回一個對象,表示調用該模塊的模塊。
module.children 返回一個數組,表示該模塊要用到的其他模塊。
module.exports 表示模塊對外輸出的值。

【exports】

  module.exports屬性表示當前模塊對外輸出的接口,其他文件加載該模塊,實際上就是讀取module.exports變量

//a.js
var a = 100;
module.exports.a = a;

//b.js
var result = require('./a');
console.log(result);//'{ a: 100 }'

  為了方便,Node為每個模塊提供一個exports變量,指向module.exports。造成的結果是,在對外輸出模塊接口時,可以向exports對象添加方法

console.log(module.exports === exports);//true

  [注意]不能直接將exports變量指向一個值,因為這樣等於切斷了exportsmodule.exports的聯系

 

模塊編譯

  編譯和執行是模塊實現的最后一個階段。定位到具體的文件后,Node會新建一個模塊對象,然后根據路徑載入並編譯。對於不同的文件擴展名,其載入方法也有所不同,具體如下所示

  js文件——通過fs模塊同步讀取文件后編譯執行

  node文件——這是用C/C++編寫的擴展文件,通過dlopen()方法加載最后編譯生成的文件

  json文件——通過fs模塊同步讀取文件后,用JSON.parse()解析返回結果

  其余擴展名文件——它們都被當做.js文件載入

  每一個編譯成功的模塊都會將其文件路徑作為索引緩存在Module._cache對象上,以提高二次引入的性能

  根據不同的文件擴展名,Node會調用不同的讀取方式,如.json文件的調用如下:

// Native extension for .json
Module._extensions['.json'] = function(module, filename) {
    var content = NativeModule.require('fs').readFileSync(filename, 'utf8'); 
    try {
        module.exports = JSON.parse(stripBOM(content));
    } catch (err) {
        err.message = filename + ': ' + err.message;
        throw err;
    }
};

  其中,Module._extensions會被賦值給require()的extensions屬性,所以通過在代碼中訪問require.extensions可以知道系統中已有的擴展加載方式。編寫如下代碼測試一下:

console.log(require.extensions);

  得到的執行結果如下:

{ '.js': [Function], '.json': [Function], '.node': [Function] }

  在確定文件的擴展名之后,Node將調用具體的編譯方式來將文件執行后返回給調用者

【JavaScript模塊的編譯】

  回到CommonJS模塊規范,我們知道每個模塊文件中存在着require、exports、module這3個變量,但是它們在模塊文件中並沒有定義,那么從何而來呢?甚至在Node的API文檔中,我們知道每個模塊中還有filename、dirname這兩個變量的存在,它們又是從何而來的呢?如果我們把直接定義模塊的過程放諸在瀏覽器端,會存在污染全局變量的情況

  事實上,在編譯的過程中,Node對獲取的JavaScript文件內容進行了頭尾包裝。在頭部添加了(function(exports, require, module, filename, dirname) {\n,在尾部添加了\n});

  一個正常的JavaScript文件會被包裝成如下的樣子

(function (exports, require, module,  filename,  dirname) {
    var math = require('math');
    exports.area = function (radius) {
        return Math.PI * radius * radius;
    };
});

  這樣每個模塊文件之間都進行了作用域隔離。包裝之后的代碼會通過vm原生模塊的runInThisContext()方法執行(類似eval,只是具有明確上下文,不污染全局),返回一個具體的function對象。最后,將當前模塊對象的exports屬性、require()方法、module(模塊對象自身),以及在文件定位中得到的完整文件路徑和文件目錄作為參數傳遞給這個function()執行

  這就是這些變量並沒有定義在每個模塊文件中卻存在的原因。在執行之后,模塊的exports屬性被返回給了調用方。exports屬性上的任何方法和屬性都可以被外部調用到,但是模塊中的其余變量或屬性則不可直接被調用

  至此,require、exports、module的流程已經完整,這就是Node對CommonJS模塊規范的實現

【C/C++模塊的編譯】

  Node調用process.dlopen()方法進行加載和執行。在Node的架構下,dlopen()方法在Windows和*nix平台下分別有不同的實現,通過libuv兼容層進行了封裝

  實際上,.node的模塊文件並不需要編譯,因為它是編寫C/C++模塊之后編譯生成的,所以這里只有加載和執行的過程。在執行的過程中,模塊的exports對象與.node模塊產生聯系,然后返回給調用者

  C/C++模塊給Node使用者帶來的優勢主要是執行效率方面的,劣勢則是C/C++模塊的編寫門檻比JavaScript高

【JSON文件的編譯】

  .json文件的編譯是3種編譯方式中最簡單的。Node利用fs模塊同步讀取JSON文件的內容之后,調用JSON.parse()方法得到對象,然后將它賦給模塊對象的exports,以供外部調用

  JSON文件在用作項目的配置文件時比較有用。如果你定義了一個JSON文件作為配置,那就不必調用fs模塊去異步讀取和解析,直接調用require()引入即可。此外,你還可以享受到模塊緩存的便利,並且二次引入時也沒有性能影響

 

CommonJS

  在介紹完Node的模塊實現之后,回過頭來再學習下CommonJS規范,相對容易理解

  CommonJS規范的提出,主要是為了彌補當前javascript沒有標准的缺陷,使其具備開發大型應用的基礎能力,而不是停留在小腳本程序的階段

  CommonJS對模塊的定義十分簡單,主要分為模塊引用、模塊定義和模塊標識3個部分

【模塊引用】

var math = require('math');

  在CommonJS規范中,存在require()方法,這個方法接受模塊標識,以此引入一個模塊的API到當前上下文中

【模塊定義】

  在模塊中,上下文提供require()方法來引入外部模塊。對應引入的功能,上下文提供了exports對象用於導出當前模塊的方法或者變量,並且它是唯一導出的出口。在模塊中,還存在一個module對象,它代表模塊自身,而exports是module的屬性。在Node中,一個文件就是一個模塊,將方法掛載在exports對象上作為屬性即可定義導出的方式:

// math.js
exports.add = function () {
    var sum = 0, i = 0,args = arguments, l = args.length;
    while (i < l) {
        sum += args[i++];
    }
    return sum;
};

  在另一個文件中,我們通過require()方法引入模塊后,就能調用定義的屬性或方法了

// program.js
var math = require('math');
exports.increment = function (val) {
    return math.add(val, 1);
};

【模塊標識】

  模塊標識其實就是傳遞給require()方法的參數,它必須是符合小駝峰命名的字符串,或者以.、..開頭的相對路徑,或者絕對路徑。它可以沒有文件名后綴.js

  模塊的定義十分簡單,接口也十分簡潔。它的意義在於將類聚的方法和變量等限定在私有的作用域中,同時支持引入和導出功能以順暢地連接上下游依賴。每個模塊具有獨立的空間,它們互不干擾,在引用時也顯得干凈利落

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM