在接觸Go這麼語言,可能你經常會聽到這樣一句話。對於字符串不能修改,可能你很納悶,日常開發中我們對字符串進行修改也是很正常的,為什麼又説Go中的字符串不能進行修改呢?
本文就來通過實際案例給大家演示,為什麼Go中的字符串不能進行修改。
在演示這個問題之前,我們先對字符串類型的基礎知識做個大致的演示,這樣便於大家對問題的進一步瞭解。
本文已收錄Gitee、Github。分享Go、PHP、MySQL、Redis等等技術乾貨。推薦訪問Gitee,速度快並且能夠正常解析文檔中的圖片文件。
字符串定義
字符串是一種用來表示字符的數據類型。在使用時,使用" "將字符內容包含起來。例如下面的形式:
package main
import "fmt"
func main() {
var str string = "Hello World!"
}
在Go中,字符串通常有三種定義方式:
// 第一種(全量定義)
var 變量名稱 string = "字符串內容"
// 類型推導
var 變量名稱 = "字符串內容"
// 短標記(只適用於局部變量)
變量名稱 := "字符串內容"
字符串的定義,其實也可以通過字節的方式。這裏羅列的方式是最為常見的方式。
字符串的組成
Go中的字符串符合Unicode標準,並且採用UTF-8編碼。字符串底層其實也是由byte組成(後面會仔細講解)。通過下面的示例,打印查看具體的字節內容:
s := "Hello World!"
for _, v := range s {
fmt.Print(v)
fmt.Print("\t")
}
// 72 101 108 108 111 32 87 111 114 108 100 33
上面代碼打印的內容,就是每一個字符所表示的字節碼。
字符串不能修改
通過上面的大致演示,我們對字符串有一個基本的瞭解。對於字符串不能修改,可能你很納悶,日常開發中我們對字符串進行重新賦值也是很正常的,為什麼又説Go中的字符串不能進行修改呢?
其實這裏要糾正這個説話,對於字符串修改並不等價於重新賦值。開發中常用的方式,其實是一種重新賦值的概念。
str := "Hello World!"
// 重新賦值
str = "Hello Go!"
// 字符串修改
str[0] = "I"
通常聽到的不能修改,其實就是指的上面代碼的第二種方式。並且通過這種方式修改會報錯::cannot assign to s[0] (value of type byte)
迴歸正題,為什麼Go中的字符串不能通過下標的方式來進行修改呢?
這是因為Go中的字符串的數據結構體是由一個指針和長度組成的結構體,該指針指向的一個切片才是真正的字符串值。Go中源碼有這樣一段定義:
type stringStruct struct {
str unsafe.Pointer // 指向一個byte類型的切片指針
len int // 字符串的長度
}
正是因為底層是一個[]byte類型的切片,當我們使用下標的方式去修改值,這時候將一個字符內容賦值給byte類型,肯定是不允許的。但是我們可以通過下標的方式去訪問對應的byte值。
fmt.Println(s[0]) // output:72
那我們要想通過下標的方式去修改值該怎麼辦呢?這時候,就需要通過切片的方式來定義,然後在轉成字符串。
package main
import (
"fmt"
)
func main() {
s1 := []byte{72, 101, 108, 108, 111, 32, 87, 111, 114, 108, 100, 33}
fmt.Println(string(s1))
// 將"H"修改為l
s1[0] = 108
fmt.Println(string(s1))
}
// output:
Hello World!
lello World!
字符串的賦值
上面分析了為什麼字符串不能使用下標去賦值,回過來解答一下日常開發中的賦值方式。
package main
import (
"fmt"
)
func main() {
// 聲明一個字符串,並給與初始值
s := "Hello World!"
// 對變量 s 進行重新賦值
s := "Hello Go!"
}
那為什麼這種場景下又可以給字符串重新賦值呢?
這是因為,在Go的底層其實是新創建了一個[]byte{}類型的切片,將變量s中的指針指向了新的內存空間地址(也就是這裏的Hello Go!)。原有的Hello World!內存空間會隨着垃圾回收機制被回收掉。
為什麼這麼設計
可能大家都會考慮到,為什麼一個普通的字符串要設計這麼複雜,還需要使用指針。暫時沒找到官方文檔的説明,
- 個人猜想,當遇到一個非常長的字符時,這樣做使得string變得非常輕量,可以很方便的進行傳遞而不用擔心內存拷貝。雖然在Go中,不管是引用類型還是值類型參數傳遞都是值傳遞。但指針明顯比值傳遞更節省內存。