Java--ASCII碼


ASCII(American Standard Code for Information Interchange, 美國標准信息交換代碼)是基於 拉丁字母的一套電腦編碼系統,主要用於顯示現代 英語和其他 西歐語言。它是現今最通用的單 字節 編碼系統,並等同於 國際標准ISO/IEC 646。
請注意,ASCII是American Standard Code for Information Interchange縮寫,而不是ASC2,有很多人在這個地方產生誤解。[1]
 

產生

在計算機中,所有的數據在 存儲和運算時都要使用 二進制數表示(因為計算機用高電平和低電平分別表示1和0),例如,像a、b、c、d這樣的52個字母(包括大寫)、以及0、1等數字還有一些常用的符號(例如*、#、@等)在計算機中存儲時也要使用 二進制數來表示,而具體用哪些二進制數字表示哪個符號,當然每個人都可以約定自己的一套(這就叫 編碼),而大家如果要想互相通信而不造成混亂,那么大家就必須使用相同的編碼規則,於是美國有關的標准化組織就出台了 ASCII編碼,統一規定了上述常用符號用哪些二進制數來表示。
美國標准信息交換代碼是由 美國國家標准學會(American National Standard Institute , ANSI )制定的,標准的單 字節字符 編碼方案,用於基於 文本的數據。起始於50年代后期,在1967年定案。它最初是美國國家標准,供不同計算機在相互通信時用作共同遵守的西文 字符編碼標准,它已被 國際標准化組織(International Organization for Standardization, ISO)定為國際標准,稱為ISO 646標准。適用於所有拉丁文字字母。
 

表述方式

ASCII 碼使用指定的7 位或8 位 二進制數組合來表示128 或256 種可能的 字符。標准ASCII 碼也叫基礎ASCII碼,使用7 位 二進制數來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊 控制字符。其中:
0~31及127(共33個)是 控制字符或通信專用字符(其余為可顯示字符),如控制符:LF(換行)、CR( 回車)、FF(換頁)、DEL( 刪除)、BS(退格)、BEL(響鈴)等;通信專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值為8、9、10 和13 分別轉換為 退格、制表、換行和回車字符。它們並沒有特定的圖形顯示,但會依不同的應用程序,而對 文本顯示有不同的影響。
32~126(共95個)是 字符(32是空格),其中48~57為0到9十個阿拉伯數字。
65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其余為一些標點符號、運算符號等。
同時還要注意,在標准ASCII中,其最高位(b7)用作 奇偶校驗位。所謂奇偶校驗,是指在代碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分 奇校驗和偶校驗兩種。 奇校驗規定:正確的代碼一個 字節中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個字節中1的個數必須是 偶數,若非偶數,則在最高位b7添1。
后128個稱為 擴展ASCII碼。許多基於 x86的系統都支持使用擴展(或“高”)ASCII。擴展ASCII 碼允許將每個字符的第8 位用於確定附加的128 個特殊符號字符、外來語字母和圖形符號。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM