byte 等同於uint8,常用來處理ascii字符
rune 等同於int32,常用來處理unicode或utf-8字符
golang中string底層是通過byte數組實現的。中文字符在unicode下占2個字節,在utf-8編碼下占3個字節,而golang默認編碼正好是utf-8。
package main
import (
"fmt"
"unicode/utf8"
)
func main() {
var str = "你好 world"
//golang中string底層是通過byte數組實現的,直接求len 實際是在按字節長度計算 所以一個漢字占3個字節算了3個長度
fmt.Println("len(str):", len(str)) //結果是12
//以下兩種都可以得到str的字符串長度,而不是字節數
//golang中的unicode/utf8包提供了用utf-8獲取長度的方法
fmt.Println("RuneCountInString:", utf8.RuneCountInString(str)) //結果是8
//通過rune類型處理unicode字符
fmt.Println("rune:", len([]rune(str))) //結果是8
}