上一篇(地址:https://www.vinanysoft.com/c-sharp-basics/data-types/fundamental-numeric-types/)只介紹了基本數值類型,本篇將介紹其他的一些類型: bool、char 和 string。
布爾類型(bool)
bool 關鍵字是 System.Boolean 的別名。 它用於聲明變量來存儲布爾值:true 和 false。
可將布爾值賦給 bool 變量。 也可以將計算結果為 bool 類型的表達式賦給 bool 變量。
public class BoolTest
{
static void Main()
{
bool b = true;
// WriteLine automatically converts the value of b to text.
Console.WriteLine(b);
int days = DateTime.Now.DayOfYear;
// Assign the result of a boolean expression to b.
b = (days % 2 == 0);
// Branch depending on whether b is true or false.
if (b)
{
Console.WriteLine("days is an even number");
}
else
{
Console.WriteLine("days is an odd number");
}
}
}
/* Output:
True
days is an <even/odd> number
*/
雖然理論上一個二進制位足以容納一個布爾類型的值,但 bool 實際大小是一個字節。
字符類型(char)
char 類型關鍵字是 System.Char 結構類型的別名,它表示 Unicode UTF-16 字符:
| 類型 | 范圍 | 大小 | .NET 類型 |
|---|---|---|---|
| char | U+0000 到 U+FFFF | 16 位 | System.Char |
輸入 char 字面量需要將字符放到一對單引號中,比如 'A'。所有鍵盤字符都可這樣輸入,包括字母、數字以及特殊符號。
有的字符不能直接插入源代碼,需進行特殊處理。首先輸入反斜杠(\)前綴,再跟隨一個特殊字符代碼。反斜杠和特殊字符代碼統稱為轉義序列(escape sequence)。
例如,\n 代表換行符,而 \t 代表制表符。由於反斜杠標志轉義序列開始,所以要用 \\ 表示反斜杠字符。
Console.Write("\'"); //輸出單引號(')
Console.Write("\\"); //輸出反斜杠(\)
char 類型字面量可以輸入字符、十六進制轉義序列或 Unicode 表示形式。 也可以將整型字面量強制轉換為相應的 char 值。 在下面的示例中,使用相同的字符 X 對 char 數組的四個元素進行初始化:
var chars = new char[4];
chars[0] = 'X'; // Character literal
chars[1] = '\x0058'; // Hexadecimal
chars[2] = (char)88; // Cast from integral type
chars[3] = '\u0058'; // Unicode
Console.Write(string.Join(" ", chars));
// Output: X X X X
下表列出了字符串轉義序列:
| 轉義序列 | 字符名稱 | Unicode 編碼 |
|---|---|---|
\' |
單引號 | 0x0027 |
\" |
雙引號 | 0x0022 |
\\ |
反斜杠 | 0x005C |
\0 |
null | 0x0000 |
\a |
警報 | 0x0007 |
\b |
退格 | 0x0008 |
\f |
換頁 | 0x000C |
\n |
換行 | 0x000A |
\r |
回車 | 0x000D |
\t |
水平制表符 | 0x0009 |
\v |
垂直制表符 | 0x000B |
\u |
Unicode 轉義序列 (UTF-16) | \uHHHH(范圍:0000 - FFFF;示例:\u00E7 =“ç”) |
\U |
Unicode 轉義序列 (UTF-32) | \U00HHHHHH(范圍:000000 - 10FFFF;示例:\U0001F47D =“👽”) |
\x |
除長度可變外,Unicode 轉義序列與“\u”類似 | \xH[H][H][H](范圍:0 - FFFF;示例:\x00E7、\x0E7 或 \xE7 =“ç”) |
字符串
零個或多個 Unicode 字符的序列稱為字符串,C# 的基本字符串類型是 string,string 是 System.String 在 .NET 中的別名。
字面量
為了將字面量字符串輸入代碼中,要將文本放入雙引號(")內。字符串由字符構成,所以轉義序列可嵌入字符串內。
using System;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
Console.WriteLine("這是一個字符串");
Console.WriteLine("這里使用\\n來換行\n這是第二行");
}
}
}
輸出
這是一個字符串
這里使用\n來換行
這是第二行
C# 允許在字符串前使用 @ 符號,指明轉義序列不被處理。結果是一個逐字字符串字面量(verbatim string literal),它不僅將反斜杠當作普通字符,還會逐字解釋所有空白字符。
using System;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
Console.WriteLine(@"開始
/\
/ \
/ \
/ \
--------
結束");
}
}
}
輸出
開始
/\
/ \
/ \
/ \
--------
結束
字符串插值
從 C# 6 開始,可以使用 $ 特殊字符將字符串文本標識為內插字符串。內插字符串是可能包含內插表達式的字符串文本。將內插字符串解析為結果字符串時,帶有內插表達式的項會替換為表達式結果的字符串表示形式。
using System;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
string name = "Mark";
var date = DateTime.Now;
Console.WriteLine($"Hello, {name}! Today is {date.DayOfWeek}, it's {date:HH:mm} now.");
}
}
}
輸出
Hello, Mark! Today is Monday, it's 10:33 now.
字符串插值內部工作原理
字符串插值是調用 string.Format() 方法的語法糖。例如以下語句:
Console.WriteLine($"Hello, {name}! Today is {date.DayOfWeek}, it's {date:HH:mm} now.");
會被轉換成以下形式的 C# 代碼:
object[] args = { name, date, time };
Console.WriteLine(string.Format("Hello, {0}! Today is {1}, it's {2} now.", args));
字符串格式化
無論使用 string.Format() 還是 C# 6.0 字符串插值來構造復雜格式的字符串,都可通過一組覆蓋面廣和復雜的格式化模式來顯示數字、日期、時間、時間段等。例如,給定 decimal 類型的 price 變量,則 string.Format("{ 0,20:C2}",price) 或等價的插值字符串 $"{ price,20:C2}" 都使用默認的貨幣格式化規則將 decimal 值轉換成字符串。
即添加本地貨幣符號,小數點后四舍五入保留兩位,整個字符串在 20 個字符的寬度內右對齊(要左對齊就為 20 添加負號。另外,寬度不夠只好超出)。
因篇幅有限,無法詳細討論所有可能的格式字符串,請在 MSDN 文檔中查閱 string.Format() 獲取格式字符串的完整列表。
string.Format() 的鏈接地址:https://docs.microsoft.com/zh-cn/dotnet/api/system.string.format?view=netcore-3.0
換行符
輸出換行所需的字符由操作系統決定。Microsoft Windows 的換行符是 \r 和 \n 這兩個字符的組合,UNIX 則是單個 \n。 為消除平台之間的不一致,一個辦法是使用 System.Console.WriteLine() 自動輸出空行。
為確保跨平台兼容性,可用 System.Environment.NewLine 代表換行符。換言之,System.Console.WriteLine("Hello World") 和 System.Console.Write("Hello World"+ System.Environment.NewLine) 等價。
注意在 Windows 上,System.WriteLine() 和 System.Console.Write(System.Environment.NewLine) 等價於 System.Console.Write("\r\n") 而非 System.Console.Write("\n")。
總之,要依賴 System.WriteLine() 和 System.Environment.NewLine 而不是 \n 來確保跨平台兼容。
字符串不可變
string 類型的一個關鍵特征是它不可變(immutable)。可為 string 變量賦一個全新的值,但出於性能考慮,沒有提供修改現有字符串內容的機制。
所以,不可能在同一個內存位置將字符串中的字母全部轉換為大寫。只能在其他內存位置新建字符串,讓它成為舊字符串大寫字母版本,舊字符串在這個過程中不會被修改,如果沒人引用它,會被垃圾回收。
public static void Main()
{
string text="abcdefg";
//UNEXPECTED: Does not convert text to uppercase
text.ToUpper();
System.Console.WriteLine(text);
}
輸出
abcdefg
從表面上看,text.ToUpper() 似乎應該將 text 中的字符轉換成大寫。但由於 string 類型不可變,所以 text.ToUpper() 不會進行這樣的修改。
相反,text.ToUpper() 會返回新字符串,它需要保存到變量中,或直接傳給 System.Console.WriteLine()。
正確的字符串處理:
public static void Main()
{
string text="abcdefg";
// Return a new string in uppercase
string uppercase = text.ToUpper();
System.Console.WriteLine(uppercase);
}
輸出
ABCDEFG
System.Text.StringBuilder
如有大量字符串需要修改,比如要經歷多個步驟來構造一個長字符串,可考慮使用 System.Text.StringBuilder 類型而不是 string。
StringBuilder 包含 Append()、AppendFormat()、Insert()、Remove() 和 Replace() 等方法。雖然 string 也提供了其中一些方法,但兩者關鍵的區別在於,在 StringBuilder 上,這些方法會修改 StringBuilder 本身中的數據,而不是返回新字符串。
總結
bool 類型在條件語句和表達式中表示真或假。允許的值是 true 和 false。
char 類型表示值介於 0 到 65535 之間的 16 位無符號整數。char 類型的值對應於 Unicode 字符集。
零個或多個字符的有限序列稱為字符串。允許使用逐字前綴 @ 指明轉義序列不被處理,允許用 $ 前綴進行字符串插值。 最后, string 是一種“不可變” 類型。
