需求:
不知道大家有没有遇到过这样的需求:自己的服务器出于对数据库安全的保护,需要对存储的数据进行加密保护。这样万一数据库被人拿到,别人也不能拿到数据库里面的内容。这里还有一个前提:前端的展示页面是不对外公开的,需要验证才能进入。为什么提这个,就是因为前端所展现的内容一定是明文的,不然管理人员如何阅读查看呢(这也给爬虫留下了机会,不过关键还是在于你能够拿到管理人员的密码)。
背景介绍:
- 系统数据库采用的是Mongodb;
- 后台使用的语言是Python;
- python与数据库的交互主要借助于Pymongo。
寻找突破口:
从这里面我们大概可以发现有两个地方可以下手:
- 每次进行数据库操作的时候对数据进行加解密操作。具体来说就是:增删改查之前对数据进行加密(这样才能在数据库中找到),查找之后对数据进行解密(这样才能得到明文的内容进行展示);
- 修改与数据库进行交互的库Pymongo,让其实现加密存储,解密读取。
比较下两种方法的优缺点:
第一种方案:实现很简单,但不适合大项目。项目一旦大了,对数据库的操作不太可能完全通过某个数据库操作模块来实现,这样修改起来就很麻烦了;
第二种方案:对业务逻辑是透明的。并不需要对网站代码进行修改,但需要对pymongo的源码进行分析,找出增删改查相应的关键点,在这些关键点上进行加解密操作。
由于自己的项目确实不小,存在很多模块。所以选择了第二种方案。
具体步骤:
- 实现加解密函数库
既然需要用到加解密操作,那么显然需要实现自己的加解密函数。具体实现中我使用了pycrypto加密库,利用其中的AES加密算法对文档进行加解密。加解密过程不难,利用里递归实现,代码实现如下:

1 from Crypto.Cipher import AES 2 import bson 3 from bson.binary import Binary, UUIDLegacy 4 from pymongo import config 5
6 key = config.key 7
8 obj = AES.new(key) 9
10 def encrypt_helper(s): 11 length = 16 - (len(s) % 16) 12 s += chr(length) * length 13 s = obj.encrypt(s) 14 s = Binary(s, 1) 15 return s 16
17 def decrypt_helper(s): 18 s = obj.decrypt(s) 19 buf = bytearray(s) 20 length = buf[-1] 21 s = s[: -length] 22 return s 23
24 def encrypt_doc(doc): 25 if isinstance(doc, str): 26 return encrypt_helper(doc) 27 if isinstance(doc, dict): 28 for key in doc: 29 if cmp(key, "channel") != 0: 30 doc[key] = encrypt_doc(doc[key]) 31 return doc 32
33 if isinstance(doc, list): 34 for i in range(len(doc)): 35 doc[i] = encrypt_doc(doc[i]) 36 return doc 37 return doc 38
39
40 def decrypt_doc(doc): 41 if isinstance(doc, Binary): 42 return decrypt_helper(doc) 43 if isinstance(doc, dict): 44 temp_doc = {} 45 for key in doc: 46 #version 1
47 #doc[key] = decrypt_doc(doc[key])
48
49 #version 2
50 temp_doc[str(key)] = decrypt_doc(doc[key]) 51 doc = temp_doc 52 return doc 53
54 if isinstance(doc, list): 55 for i in range(len(doc)): 56 doc[i] = decrypt_doc(doc[i]) 57 return doc 58 return doc
2. 找到pymongo中进行增删改查操作的代码并插入加解密的操作
经过研读pymongo的代码发现,增删改查的操作主要是在两个文件里面进行的:collection.py,cursor.py。所以在实现过程中,我只对这两个文件的相关部分进行了修改(注意,我使用pymongo版本是2.7,如果使用其他版本的可能会有差别)。
我就简单列举一下我修改的函数吧,大家有兴趣可以上github具体查看下整个实现:
-
- collection.py:
- insert
- update
- find_one
- remove
- aggregate
- cursor.py
- __getitem__
- __send_message
- collection.py:
有兴趣的可以看看代码,github地址:https://github.com/ybAmazing/encrypt_pymongo
思考和总结
这个功能的必要性,我自己是持怀疑态度的。由于对黑客技术也不是很了解,也说不出个所以然来。大家如果有什么想法或建议的,可以留言,相互交流学习一下。