博客園某開源主題暗藏私貨?


2020/05/13 14:50更新

在評論的驅使下我仔細去看了下,有幾處確實用到了后端接口

  loadBlogTalk: (page) => {
    return forwardXmlJsonp("https://ing.cnblogs.com/u/" + blogConst.blogAcc + "/" + page, parseTalkList);
  },
  loadBlogSearch: (keyword) => {
    return forwardXmlJsonp("https://zzk.cnblogs.com/s/blogpost?w=" + encodeURI("blog:" + blogConst.blogAcc + " " + keyword), parseSearchKeyWord);
  },
  loadFollowers: (page) => {
    let url = "https://home.cnblogs.com/u/" + blogConst.blogAcc + "/relation/followers/";
    if (page && page > 1) {
      url += "?page=" + page;
    }
    return forwardXmlJsonp(url, parseFollowers);
  },

這三個接口是走的php后端的api,理由是能自洽的,因為涉及到不同子域了,存在跨站請求,所以需要第三方后端來進行處理

不過百度統計我還是不太能理解


2020/05/12 22:14

首先說好本文只是我個人的猜測,如果有不對的地方請及時指正

背景

前些天朋友介紹,看到一個博客園主題,主題的思路很棒,具體怎么棒不表,只是后來看了看源碼,發現了一些秘密的東西。

源碼地址https://github.com/cjunn/cnblog_theme_atum

發現

神秘的后端請求

首先是這個主題會向主題作者的php服務器發送請求

這里我們可以看到是返回一個callback,這一般是解決跨域所采用的jsonp技術

那么jsonp的具體原理是啥?

jsonp原理

因為瀏覽器跨域機制的存在,如果在對方接口服務器上面並沒有做cors相關的操作,那么是請求不到ajax接口數據的,jsonp技術應運而生

瀏覽器是可以引入外域的js的,並且外域上不需要做任何跨域相關的設置,引入外域js后就可以調用該js里面的函數,所以在接口上傳遞一個callback,比如

<script src="http://a.com/a.php?callback=ttt"></script>

然后那邊返回一個js,js的內容為

ttt({'a': 1, 'b': 2})

那么調用ttt函數即可獲得這個json數據

后端請求問題點

是不是到現在為止你還是覺得,好像沒什么問題啊,他返回一下好像也沒問題啊?

但是試想一個,這個callback他是可以在后端任意替換的,比如給你加個js獲取你的一些信息,甚至還可以控制你的瀏覽器一些行為,比如幫他點擊一個啥啥啥,可以了解一下Beef

神秘的加密字符串

我看了這個主題占用cpu和內存比較低,所以花了幾分鍾時間翻了下源碼,發現了一些奇怪的東西

我在找上面所說的php請求的時候發現了這個

然后跟進去

繼續跟

有一串加密的東西

看名稱像是百度統計,但是你為什么加個密,跟進這個加密函數看看

/**
 *
 *  Base64 encode / decode
 *  http://www.webtoolkit.info
 *
 **/


  // private property
let _keyStr = ""
_keyStr += "AByz0r4wxs";

// public method for encoding
let encode = function (input) {
  var output = "";
  var chr1, chr2, chr3, enc1, enc2, enc3, enc4;
  var i = 0;

  input = _utf8_encode(input);

  while (i < input.length) {
    chr1 = input.charCodeAt(i++);
    chr2 = input.charCodeAt(i++);
    chr3 = input.charCodeAt(i++);

    enc1 = chr1 >> 2;
    enc2 = ((chr1 & 3) << 4) | (chr2 >> 4);
    enc3 = ((chr2 & 15) << 2) | (chr3 >> 6);
    enc4 = chr3 & 63;

    if (isNaN(chr2)) {
      enc3 = enc4 = 64;
    } else if (isNaN(chr3)) {
      enc4 = 64;
    }

    output = output +
      _keyStr.charAt(enc1) + _keyStr.charAt(enc2) +
      _keyStr.charAt(enc3) + _keyStr.charAt(enc4);
  } // Whend

  return output;
} // End Function encode
_keyStr += "KLMCDEtuTUVWX12NOPQk";


// public method for decoding
let decode = function (input) {
  var output = "";
  var chr1, chr2, chr3;
  var enc1, enc2, enc3, enc4;
  var i = 0;

  input = input.replace(/[^A-Za-z0-9\+\/\=]/g, "");
  while (i < input.length) {
    enc1 = _keyStr.indexOf(input.charAt(i++));
    enc2 = _keyStr.indexOf(input.charAt(i++));
    enc3 = _keyStr.indexOf(input.charAt(i++));
    enc4 = _keyStr.indexOf(input.charAt(i++));

    chr1 = (enc1 << 2) | (enc2 >> 4);
    chr2 = ((enc2 & 15) << 4) | (enc3 >> 2);
    chr3 = ((enc3 & 3) << 6) | enc4;

    output = output + String.fromCharCode(chr1);

    if (enc3 != 64) {
      output = output + String.fromCharCode(chr2);
    }

    if (enc4 != 64) {
      output = output + String.fromCharCode(chr3);
    }

  } // Whend

  output = _utf8_decode(output);

  return output;
} // End Function decode
_keyStr += "lmnopqYZabcdef";


// private method for UTF-8 encoding
let _utf8_encode = function (string) {
  var utftext = "";
  string = string.replace(/\r\n/g, "\n");

  for (var n = 0; n < string.length; n++) {
    var c = string.charCodeAt(n);

    if (c < 128) {
      utftext += String.fromCharCode(c);
    } else if ((c > 127) && (c < 2048)) {
      utftext += String.fromCharCode((c >> 6) | 192);
      utftext += String.fromCharCode((c & 63) | 128);
    } else {
      utftext += String.fromCharCode((c >> 12) | 224);
      utftext += String.fromCharCode(((c >> 6) & 63) | 128);
      utftext += String.fromCharCode((c & 63) | 128);
    }

  } // Next n

  return utftext;
} // End Function _utf8_encode
_keyStr += "35RSJFGHIvgh";
// private method for UTF-8 decoding
let _utf8_decode = function (utftext) {
  var string = "";
  var i = 0;
  var c, c1, c2, c3;
  c = c1 = c2 = 0;

  while (i < utftext.length) {
    c = utftext.charCodeAt(i);

    if (c < 128) {
      string += String.fromCharCode(c);
      i++;
    } else if ((c > 191) && (c < 224)) {
      c2 = utftext.charCodeAt(i + 1);
      string += String.fromCharCode(((c & 31) << 6) | (c2 & 63));
      i += 2;
    } else {
      c2 = utftext.charCodeAt(i + 1);
      c3 = utftext.charCodeAt(i + 2);
      string += String.fromCharCode(((c & 15) << 12) | ((c2 & 63) << 6) | (c3 & 63));
      i += 3;
    }

  } // Whend

  return string;
} // End Function _utf8_decode
_keyStr += "ij6789+/=";

export default {
  i: (message) => {
    return encode(message);
  },
  o: (ciphertext) => {
    return decode(ciphertext);
  },
}

這個函數自己跑一下,跑出來是 https://hm.baidu.com/hm.js?ae80cc662109a34c868ba6cbe3431c8d 這個百度統計地址

然后在初始化的時候,也就是你每次進網站的時候

每次進網站調用這個函數 initBaiduCount()

並且加了個路由守衛調用 pushBaiduCount()

可能有的人不理解路由守衛是什么,路由守衛就是一個hook鈎子,在你每次進入或離開路由,或者說該網站的頁面時調用,比如這里是進入一個新路由的時候就調用一下,跟進去看看

這里是插入了百度統計代碼

我的疑惑點

我不太懂百度統計是什么東西,一直認為就是一個管站點流量和訪問量的,也不知道有啥其他東西

我說下我覺得可疑的點

我姑且認為是為了給自己的博客進行統計,但是這其中為什么大費周章去加密解密,這個我不太理解

還有的是這個加密的js去掉了后綴js,這樣github就沒法檢索分析代碼了,不把代碼down下來應該是只能硬找

我看了下,其實並沒有用到自建php服務器上的東西,最開始以為是反代博客園轉化為接口,但是我看了下請求,全都是只有callback,返回的一個字符串,我實在想不到是有什么必要進行這個操作,目前看起來是沒有價值的

所以問題來了:

  1. 添加了百度統計,但是大費周章加解密,看起來並不是讓用戶可自定義的項或者不是大大方方給人看的東西?
  2. 這個php服務器主要用處是什么?目前的callback看起來是毫無意義的,還是真像我所想的,方便以后做一些事情?


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM