golang ---rune與byte

本文轉載自查看原文 2019-10-07 21:45 504 golang

golang內置類型有rune類型和byte類型。

rune類型的底層類型是int32類型，而byte類型的底層類型是int8類型，這決定了rune能比byte表達更多的數。

在unicode中，一個中文占兩個字節，utf-8中一個中文占三個字節，golang默認的編碼是utf-8編碼，因此默認一個中文占三個字節，但是golang中的字符串底層實際上是一個byte數組。因此可能會出現下面這種奇怪的情況

package main

import (
	"fmt"
)

func main() {
	str := "世界"
	fmt.Println(len(str)) //6
}

我們期望得到的結果應該是4，原因是golang中的string底層是由一個byte數組實現的，而golang默認的編碼是utf-8，因此在這里一個中文字符占3個字節，所以獲得的長度是6，想要獲得我們想要的結果也很簡單，golang中的unicode/utf8包提供了用utf-8獲取長度的方法

package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {
	str := "世界"
	fmt.Println(utf8.RuneCountInString(str))//2

}

結果是2

上面說了byte類型實際上是一個int8類型，int8適合表達ascii編碼的字符，而int32可以表達更多的數，可以更容易的處理unicode字符，因此，我們可以通過rune類型來處理unicode字符

package main

import (
	"fmt"
)

func main() {
	str := "hello 世界"
	str2 := []rune(str)
	fmt.Println(len(str2)) //8

}

這里將會申請一塊內存，然后將str的內容復制到這塊內存，實際上這塊內存是一個rune類型的切片，而str2拿到的是一個rune類型的切片的引用，我們可以很容易的證明這是一個引用

package main

import (

    "fmt"

func main() {

    str := "hello 世界"

    str2 := []rune(str)

    t := str2

    t[0] = 'w'

    fmt.Println(string(str2)) //“wello 世界”

    fmt.Println(string(str))  //“hello 世界”

通過把str2賦值給t，t上改變的數據，實際上是改變的是t指向的rune切片，因此，str2也會跟着改變，而str不會改變。

字符串的遍歷

對於字符串，看一下如何遍歷吧，也許你會覺得遍歷輕而易舉，然而剛接觸golang的時候，如果這樣遍歷字符串，那么將是非常糟糕的

package main

import (
	"fmt"
)

func main() {
	str := "hello 世界"

	for i := 0; i < len(str); i++ {
		fmt.Println(string(str[i]))
	}

}

輸出:

h
e
l
l
o
 
ä
¸

ç

如何解決這個問題呢？

第一個解決方法是用range循環

package main

import (
	"fmt"
)

func main() {
	str := "hello 世界"

	for _, v := range str {
		fmt.Println(string(v))
	}
}

　輸出

h
e
l
l
o
 
世
界

　原因是range會隱式的unicode解碼

第二個方法是將str 轉換為rune類型的切片

package main

import (
	"fmt"
)

func main() {
	str := "hello 世界"
	str2 := []rune(str)

	for i := 0; i < len(str2); i++ {
		fmt.Println(string(str2[i]))
	}

}

　輸出

h
e
l
l
o
 
世
界

rune和byte的區別

除開rune和byte底層的類型的區別，在使用上，rune能處理一切的字符，而byte僅僅局限在ascii

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Go 字節 (byte) & 文字符號 (rune) Go語言中的byte和rune區別、對比 Go 語言中的 byte 類型和 rune 類型 golang []byte轉string Golang的Json encode/decode以及[]byte和string的轉換 golang []byte 和 string 無拷貝轉換 Golang 結構體和[]byte相互轉換 Golang十六進制字符串和byte數組互轉 Go語言中的rune類型淺析 golang