在Python中,String對象是定長對象,一旦創建,長度就不可變化,若是使用+號連接兩個字符串,則會新開辟一段長度總和長度的內存,再將兩個字符串memcpy進去。如果要連接N個String對象,則要進行N-1次內存申請和拷貝。
string_concat(register PyStringObject *a, register PyObject *bb) { register Py_ssize_t size; register PyStringObject *op; //................ op = (PyStringObject *)PyObject_MALLOC(PyStringObject_SIZE + size); if (op == NULL) return PyErr_NoMemory(); PyObject_INIT_VAR(op, &PyString_Type, size); op->ob_shash = -1; op->ob_sstate = SSTATE_NOT_INTERNED; Py_MEMCPY(op->ob_sval, a->ob_sval, Py_SIZE(a)); Py_MEMCPY(op->ob_sval + Py_SIZE(a), b->ob_sval, Py_SIZE(b)); op->ob_sval[size] = '\0'; return (PyObject *) op; #undef b }
官方推薦的是使用字符串的join方法,該方法對於連接一個list或tuple中的元素非常有效,他會先統計所有元素的長度,申請內存,然后拷貝。
''.join(['a', 'b', 'c']) //better 'a' + 'b' + 'c'