關於代碼壓縮混淆加密整理;


我這里說的前端加密,是對瀏覽器端的js文件加密,不是傳輸過程中的加密,不涉及hash摘要等

1. 降低可讀性

1.1 壓縮(compression)

很好理解,就是去掉注釋、多於的空格、簡化標識符等等。工具很多,YUI Compressor、UglifyJS、Google Closure Compiler等等。

1.2 混淆(obfuscation)

保證不破壞代碼執行結果的情況下,讓代碼變得難以閱讀。常用混淆規則:拆分字符串、拆分數組、增加廢代碼、,壓縮其實也有一定混淆功能。本質就是改變輸入代碼字符串的抽象語法樹(AST)的結構。其他工具:v8就是一個,還有mozilla的SpiderMonkey, 知名的esprima,還有uglify;商業混淆服務有:jscramble。

1.3 加密(encryption)

這里的加密指文本可逆編碼,是狹義的加密,也就是我們常說的加密啦。這個部分依然是借助一些工具,如: Packer 、bcrypt等等。

2. 代碼不放置在JS文件中

將代碼放在非js文件中,增加定位難度。這里常用的方式有兩種:放置到png中,通過HTML Canvas 2D Context獲取二進制數據的特性,可以用圖片來存儲腳本資源;放置到css文件中,利用content樣式可以存放字符串的特性,同樣可以。

2.1 png

用png保存js代碼,首先需要對png進行編碼,然后使用的時候進行解碼。借助canvas及base64和二進制編碼。

編碼

1、字符串轉換成ascii碼; 
2、創建足夠存儲空間的canvas; 
3、將字符填入到像素中(忽略alpha值); 
4、獲取data url; 
canvas.toDataURL(“image/png”); 
5、存為png圖片。

function encodeUTF8(str) { return String(str).replace( /[\u0080-\u07ff]/g, function(c) { let cc = c.charCodeAt(0); return String.fromCharCode(0xc0 | cc >> 6, 0x80 | cc & 0x3f); } ).replace( /[\u0800-\uffff]/g, function(c) { let cc = c.charCodeAt(0); return String.fromCharCode(0xe0 | cc >> 12, 0x80 | cc >> 6 & 0x3f, 0x80 | cc & 0x3f); } ); } function request(url, loaded) { let xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange = function() { if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) loaded(xmlhttp); } xmlhttp.open("GET", url, true); xmlhttp.send(); } void function(){ let source = '../image/test.js'; request(source, function(xmlhttp){ let text = encodeUTF8(xmlhttp.responseText); let pixel = Math.ceil((text.length + 2) / 3); // 1一個像素存3個字節, let size = Math.ceil(Math.sqrt(pixel)); //console.log([text.length, pixel, size, size * size * 3]); let canvas = document.createElement('canvas'); canvas.width = canvas.height = size; let context = canvas.getContext("2d"), imageData = context.getImageData(0, 0, canvas.width, canvas.height), pixels = imageData.data; for(let i = 0, j = 0, l = pixels.length; i < l; i++){ if (i % 4 == 3) { // alpha會影響png還原 pixels[i] = 255; continue; } let code = text.charCodeAt(j++); if (isNaN(code)) break; pixels[i] = code; } context.putImageData(imageData, 0, 0); document.getElementById('base64').src = canvas.toDataURL("image/png"); }); }();

編碼后的圖片: 
這里寫圖片描述

解碼

1、加載png; 
2、將png原尺寸繪制到canvas中; 
3、讀取像素中的字符串; 
4、生成相應協議的data url使用。

void function(){ let source = '../image/test.png'; let img = document.createElement('img'); img.onload = function(){ let canvas = document.createElement('canvas'); canvas.width = img.width; canvas.height = img.height; let context = canvas.getContext("2d"); context.drawImage(img, 0, 0); let imageData = context.getImageData(0, 0, canvas.width, canvas.height), pixels = imageData.data; let script = document.createElement('script'); let buffer = []; for (let i = 0, l = pixels.length; i < l; i++) { if (i % 4 == 3) continue; // alpha會影響png還原 if (!pixels[i]) break; buffer.push(String.fromCharCode(pixels[i])); } script.src = 'data:text/javascript;charset=utf-8,' + encodeURIComponent(buffer.join('')); document.body.appendChild(script); script.onload = function(){ console.log('script is loaded!'); } img = null; } img.src = source; }();

這里需要手動下載編碼后的圖片,我沒有寫自動下載的函數,這又是另一個可以深入探討的問題了,所以不過多擴展。

2.2 css

使用content就簡單多啦。

let div = document.getElementById('content'); let content = window.getComputedStyle(div, ':before').content;

只需要和上面代碼一樣,新建一個srcript標簽,利用data協議,就可以執行content內保存的js代碼啦。

3. 防止代碼執行被截獲

  • 截獲 eval() / new Function() 的示例代碼
eval = function() { console.log('eval', JSON.stringify(arguments)); }; eval('console.log("Hello world!")'); Function = function() { console.log('Function', JSON.stringify(arguments)); return function() {}; }; new Function('console.log("Hello world!")')();

但是可能不是全局使用:

(function(){}).constructor('console.log("Hello world!")')()
  • 截獲 constructor 的示例代碼
Function.prototype.__defineGetter__('constructor', function () { return function () { console.log('constructor', JSON.stringify(arguments)); }; }); (function() {}).constructor('console.log("Hello world!")');

目前能想到的是判斷 eval 是否被重定向

示例,如果 eval 被重定向 z 變量不會被泄露

(function(x){ var z = 'console.log("Hello world!")'; eval('function x(){eval(z)}'); x(); })(function() { /* ... */ });

uglify介紹

概述:

 
        
  • 案例:Cesium打包流程,相關技術點和大概流程

  • 原理:代碼優化的意義:壓縮 優化 混淆

  • 優化:如何完善Cesium打包流程

 
        

關鍵字:Cesium gulp uglifyjs

 
        

字數:2330 | 閱讀時間:7min+

 
        

 

 
        

1 Cesium打包流程

 
        

       如果沒有記錯,Cesium從2016年初對代碼構建工具做了一次調整,從grunt改為gulp。作為一名業余選手,就不揣測兩者的差別了。個人而言,gulp和Ant的思路很相似,通過管道連接,都是基於流的構建風格,而且gulp更像是JS的編碼風格,自帶一種親切感。

 
        

gulp.task('task1',['task0'], function() {

    return fun_task1();

});

 
        

       Task語句是gulp中最常見的,懂了這句話,就等於你看懂腳本了。這句話的意思是,要執行task1,需要先執行task0,而task1的具體工作都在fun_task1方法中。這就是之前說的基於流的構建風格。有了這句話,在命令行中鍵入:gulp task1,回車執行該指令即可。

 
        

       先安裝Node,環境變量等,並安裝npm包后,即可使用gulp打包工具,這里推薦cnpm。環境搭建好后,命令行中鍵入gulp minify開始打包。完整的過程是build->generateStubs->minify。

 
        

1gulp

 
        

Cesium打包流程

 
        

       build:准備工作,創建Build文件夾;將glsl文件轉為js形式;最主要的是createCesiumJs方法,遍歷Source中所有js腳本,將所有Object記錄到Source/Cesium.js;其他的是范例,單元測試相關模塊。

 
        

       generateStubs:用於單元測試,略。

 
        

       minify; 首先combineJavaScript主要做了兩件事情,打包Cesium和Workers腳本,這是打包的最終結果。Gulp根據指令的不同,比如minify下采用uglify2優化,而combine對應的參數為none,生成路徑為CesiumUnminified。

 
        

       另外,細心的人會發現,combineCesium的實現中有這樣一句話path.relative('Source',require.resolve('almond')),這是一個小優化,almond是requirejs的精簡包,因此,最終的Cesium.js中包含'almond腳本,內置了requirejs的主要方法。

 
        

       如上是Cesium打包的主要流程,簡單說主要有3+1類個指令:

 
        
  • Clean

    • 清空文件

  • minify

    • 打包&壓縮

  • combine

    • 只打包,不壓縮

  • JScoverage

    • 單元測試覆蓋率,不了解

 
        

2 代碼優化

 
        

       對流程有了一個大概了解,下面,我們詳細了解一下uglify2過程都做了哪些代碼優化,一言以蔽之,壓縮,優化,混淆。

 
        

       uglify2主要有三個參數:-o,-c,-m,-o參數必選,指定輸出文件,-c壓縮,-m混淆變量名。如下分別為combine、(uglifyjs -o)、(uglifyjs –c -m -o)的文件對比,單位是k:

 
        

2file

 
        

uglify2的壓縮對比

 
        

       都在一個屋檐下,差距怎么就這么大呢?我們簡單說一下從1~2,2~3之間青取之於藍而勝於藍的過程。

 
        

       1~2的過程其實很簡單,就是干了三件事,去掉注釋, 去掉多余的空格(換行符),去掉不必要的分號(;)。就這三件事情,文件一下子小了一半多,換句話就是平時你寫的代碼有一大半都是廢話,此時你旁邊的AI程序員可能會喃喃道來“你們人類好愚蠢~”。

 
        

       2~3則是很多小細節的綜合應用:

 
        
  • 去掉一些實際沒有調用的函數(Dead code);

  • 將零散的變量聲明合並,比如 var a; var b;變為var a,b;

  • 邏輯函數的精簡,比如if(a) b(); else c()變為a ? b() : c();

  • 變量名的簡化,比如var strObject;變為var s;

  • ……

 
        

       這些小技巧有很多,具體要看不同的壓縮工具的考慮優劣,但有些壓縮高效的工具並不穩定,可能會破壞語法規范或語意,所以沒必要為了幾個kb承擔過多的風險,目前比較成熟的工具主要有三個uglify2,google closure以及yuicompressor,具體優劣得自己來體會了,我是按照自己的理解給出的先后順序。最終的效果如下:

 
        

3uglifyresult

 
        

Cesium腳本效果

 
        

       這樣的代碼只能用單位“坨”來形容了,人類是無法直接讀懂的,那瀏覽器能讀懂嗎?這是一個好問題!如下是V8引擎對JS語法解析的大概流程:

 
        

4parser

 
        

V8引擎解析JS腳本

 
        

       下面是在我本機Chrome解析Cesium.js腳本花費時間(腳本從下載完到瀏覽器解析完的時間差),單位毫秒,因為只測試了一次,可能會有誤差,但基本吻合期望值:

 
        

 5parser

 
        

JS腳本解析時間對比

 
        

       首先因為是本機測試,腳本無論是最大的8M還是最小的2.4M,下載速度都很快,因此我們不討論(但實際應用中要考慮)腳本下載所需時間。

 
        

其次,如上圖,多了一個source,這是源碼情況下,這個時間水分比較大,因為是零散的文件,可以做到按需下載,但因為文件比較瑣碎,性能也不高。

 
        

       結論是,這種JS腳本優化策略對瀏覽器的影響不大,瀏覽器看到優化后的代碼,可能會愣一會神,但很快就克服了。

 
        

3實戰

 
        

       知道了代碼優化的大概原理,回顧一下代碼優化的目的(壓縮,優化,混淆),匹配一下結果是否符合期望值。嗯,其一,腳本的大小小了,其二,代碼效率也優化了,其三,別人也看不懂了。似乎該做的都已經做了,這個腳本已經很完美了。

 
        

 6format

 
        

Format后的效果

 
        

       毛爺爺說,與人斗其樂無窮。確實,前兩點的目的達到了,但第三點,還差很多。如上,和剛才的腳本是同一個文件,我只是用Chrome的調試工具format而已。這就是理想和現實之間的差距。

 
        

       可見,Cesium默認打包工具在壓縮和優化上都沒有問題,但在混淆上並不充分,當然Cesium本身是開源的,也沒必要搞這些。客觀說,JS腳本是明碼的,所以反編譯只是時間和能力的問題,所以不妨換個態度來看待這個問題,增加反編譯的成本,當該成本大於購買成本即可

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM