字符序列(CharSequence)


字符序列(CharSequence)

1、相关接口

 

  • java.lang.CharSequence 接口

  • java.lang.Appendable接口

  • java.lang.Comparable接口

  • java.io.Seralization 接口

2、java.lang.String

 

2.1、概念:String 是个类 character strings 才是字符串

1、在 Java 语言中 直接使用 “” 引起来的多个字符就是 字符串 (character strings) 2、在 Java 源代码中 直接使用 “” 引起来的字符串 都是 java.lang.String 的实例 3、String 类 是个 不可变类 将来创建的 每个 String 实例 都是不可变的对象【Strings are constant】

[Java 8及之前] public final class String { private char[] value; // 使用 char 数组保存字符序列 }

[Java 9 之后] public final class String { private final byte[] value; // 使用 byte 数组保存字节序列 } 字节序列是字符序列根据某种编码转换而来

通过 "" 双引号来创建字符串

java.lang.String 类的主要字段 Java 11

 public final class String implements Serializable, Comparable<String>, CharSequence {
     
     private final byte[] value;
     private final byte coder;
     private int hash;
     
     
     public String(String original) {
         this.value = original.value;
         this.coder = original.coder;
         this.hash = original.hash;
    }
     
 }

 

String t = new String("abc123");

 

首先通过 "abc123" 来创建 String 的实例

这个实例在 String 常量池中

 // 三个字段
 byte[] value:0xA1B2C3 // 通过创建堆内存的 byte[] 来存取 "abc123" 数组变量value 存放数组的引用
 byte coder:0
 int hash:-1424436592

 

堆内存的 byte[]

 {97,98,99,49,50,51} // 假设地址为 0xA1B2C3

 

当我们在堆内存中 new String( s ) 这时调用 String 类的构造方法

 public String(String original) {
     this.value = original.value;
     this.coder = original.coder;
     this.hash = original.hash;
 }

将 常量池的值复制一份过来

但 String t = new String("abc123");

变量 t 存放的是 一个堆中的地址

如果 String s1 = "abc123"; 和 String s2 = "abc123";

这里的 s1 和 s2 存放的是常量池实例的地址 是相同的

2.2、new String( s ) 的内存图

 

image-20200529115916201

 

但凡是出现了 "" 引起来的内容,这部分内容一定放在 String 常量池中

String t = new String("abc123");

创建一个 “abc123” 对应 String 实例 并添加到常量池中

在堆内存创建 String 实例 并将 "abc123" 的 value / hash / coder 拷贝到新创建的 String 实例中

 

3、String 的部分实例变量

  • private final byte coder;

  • private int hsah;

  • private final byte[] value;

 

4、String 内部的一些方法

构造方法

  • public String(byte[] bytes)

  • public String(byte[] bytes, int offset, int length)

  • public byte[] getBytes()

等等一些重载方法

类变量

  • static final byte LATIN1 = 0;

  • static final byte UTF-16 = 1;

类方法

  • valueOf()

     将 基本数据类型的值 转化为 字符串形式 valueOf(boolean|int|long|float|double|char)
  • format

  • join

实例方法

 

1、char charAt(int) 获取指定索引的单个字符 2、int length() 获取字符串长度 3、public boolean contains(CharSequence s) 判断指定的字符序列是否存在于 当前字符串中 4、int indexOf(int ch) 查询指定字符 在当前字符串中 首次出现的位置 存在返回索引 不存在 -1 5、int indexOf(String s) 6、int lastIndexOf(int ch) 7、int lastIndexOf(String s)

 

 package CharSequence;
 /**
  * 1、char charAt(int) 获取指定索引的单个字符
  * 2、int length() 获取字符串长度
  * 3、public boolean contains(CharSequence s) 判断指定的字符序列是否存在于 当前字符串中
  * 4、int indexOf(int ch) 查询指定字符 在当前字符串中 首次出现的位置 存在返回索引 不存在 -1
  * 5、int indexOf(String s)
  * 6、int lastIndexOf(int ch)
  * 7、int lastIndexOf(String s)
  * */
 public class StringTestA {
    public static void main(String[] args) {
 
        final String s = "今天天气好晴朗处处好风光好风光";
        for (int i = 0; i < s.length(); i++) {
            char ch = s.charAt(i);
            System.out.print(ch);
            System.out.print(i<s.length() - 1 ? "," : "\n");
        }
        // 因为 String 类实现了 CharSequence接口
        CharSequence cs = "好风光"; // 所以用 CharSequence 类型的引用变量指向了 String 实例是可以的
        boolean z = s.contains(cs);
        System.out.println(z);
 
        // 整个字符串中的每个字符的索引 一样 从 ”左“ 开始统计 与数组相同
        int index = s.indexOf('天');// 获取 天 在变量 s 所指向的字符串首次出现的位置(索引)
        System.out.println(index);
 
        index = s.indexOf("好风光");
        System.out.println(index); // 获取 好风光 在变量 s 所指向的字符串首次出现的位置(索引) 好的位置
 
        int lastIndex = s.lastIndexOf('天'); // 获取 天 在变量 s 所指向的字符串最后出现的位置(索引)
        System.out.println(lastIndex);
 
        lastIndex = s.lastIndexOf("好风光"); // 获取 好风光 在变量 s 所指向的字符串最后出现的位置(索引) 还是好的位置
        System.out.println(lastIndex);
 
    }
 }
 

 

indexOf( int ch , int from )

int indexOf( String s , int from )

int lastIndexOf( int ch , int from )

int lastIndexOf( String s , int from )

 package CharSequence;
 
 /**
  * 1、 int indexOf( int ch , int from )
  * 从 当前字符串中 指定位置(from) 开始寻找 指定字符 ( ch ) 首次出现的位置,若存在即返回该索引,否则返回 -1
  * 2、int indexOf( String s , int from )
  * 从 当前字符串中 指定位置(from) 开始寻找 指定字符串 ( s ) 首次出现的位置,若存在即返回该索引,否则返回 -1
  * 3、int lastIndexOf( int ch , int from )
  * 从 当前字符串中 指定位置(from) 开始反向寻找 指定字符 ( ch ) 最后一次出现的位置,若存在即返回该索引,否则返回 -1
  *         即获取在 from 处及其之前 ch 最后一次出现的位置是什么
  *         ( 反向寻找的顺序是 from 、from - 1 、from - 2 、........ )
  * 4、int lastIndexOf( String s , int from )
  * 从 当前字符串中 指定位置(from) 开始反向寻找 指定字符串 ( s ) 最后一次出现的位置,若存在即返回该索引,否则返回 -1
  * 即获取在 from 处及其之前 s 最后一次出现的位置是什么
  */
 public class StringTestB {
 
  public static void main(String[] args) {
 
  final String s = "http://www.ecut.edu.cn:8080/soft/java/beginner/string/test.html" ;
 
  int index ;
  int last ;
 
  index = s.indexOf( '/' ) ;
  last = s.lastIndexOf( '/' );
  System.out.println( index + " , " + last );
 
  System.out.println( "~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~" );
 
  index = s.indexOf( '/' , 10 ); // 从 索引 10 开始 向后寻找 '/' 字符首次出现的位置
  last = s.lastIndexOf( '/' , 37 ); // 从 索引 37 处开始 反向寻找 '/' 字符 最后一次出现的位置
  System.out.println( index + " , " + last );
 
 
 
  }
 
 }
 

 

 

1、String concat(String) 将当前字符串 与 参数给定的字符串拼接起来 并返回一个新的 字符串 2、String toUpperCase() 3、String toLowerCase() 4、equalsIgnoreCase() 忽略大小写 5、a.contentEquals(b) 用于比较参数指定的 字符序列 是否与当前String

 

 package CharSequence;
 /**
  * 1、String concat(String) 将当前字符串 与 参数给定的字符串拼接起来 并返回一个新的 字符串
  * 2、String toUpperCase()
  * 3、String toLowerCase()
  * 4、equalsIgnoreCase() 忽略大小写
  * 5、a.contentEquals(b) 用于比较参数指定的 字符序列 是否与当前String
  */
 
 public class StringTestC {
     public static void main(String[] args) {
         String s = "abc";
 
         String x = s.concat("123");
         System.out.println(s); // "abc"
         System.out.println(x); // "abc123"
 
         System.out.println("~~~~~~~~");
 
         String t = s.toUpperCase();
 
         final String a = "hello";
         final String b = "Hello";
 
         System.out.println(a.equals(b)); // String 重写后的 equals 比较大小
         System.out.println(a.equalsIgnoreCase(b)); // true 忽略大小写
         System.out.println(a.contentEquals(b)); // 区分大小写
 
         System.out.println("~~~~~~~~~~~~");
         // 用于比较两个字符串的 “大小”
         System.out.println(a.compareTo(b)); //
         // 相等 返回 0 否则 非0整数
         System.out.println(a.compareToIgnoreCase(b)); //
    }
 }
 

 

1、int length() boolean isEmpty() 是否为空 value.length 是否为0 boolean isBlank() 用于判断 是否为空 (空白 仅仅包含了 空格 tab 等字符) String trim() 剔除首尾空白 不包括 中间的空白

 

 package CharSequence;
 /**
  * 1、int length()
  * boolean isEmpty() 是否为空 value.length 是否为0
  * boolean isBlank() 用于判断 是否为空 (空白 仅仅包含了 空格 tab 等字符)
  * String trim() 剔除首尾空白 不包括 中间的空白
  * */
 public class StringTestD {
     public static void main(String[] args) {
 
         String s = ""; // 空串 不是 空格 不是 制表符(Tab) 也不是 null 和 /u0000
         System.out.println(s);
         System.out.println("length:" + s.length());
         System.out.println("empty:" + s.isEmpty());
 
         System.out.println("~~~~~~~~~~~~~~");
         String t = "           "; // 有空格 和 tab
         System.out.println("length:" + s.length());
         System.out.println("empty:" + s.isEmpty());
         System.out.println("is blank" + t.isBlank());
 
         String x = "   ecut ";
         String trim = x.trim(); // 删除首尾空白 不包括中间的空白返回新的 String 实例
         System.out.println(x.length());
         System.out.println(trim.length());
 
    }
 }
 

1、boolean startsWith(String) 对应的字符串 是否以 参数 字符串 开始

2、boolean endsWith(String) 对应的字符串 是否以 参数 字符串 结束

 

 package CharSequence;
 
 import java.util.Arrays;
 
 /**
  * 1、boolean startsWith(String) 对应的字符串 是否以 参数 字符串 开始
  * 2、boolean endsWith(String) 对应的字符串 是否以 参数 字符串 结束
  *
  * */
 
 public class StringTestE {
    public static void main(String[] args) {
 
        String path = "D:/java-beginner/char-sequence/StringHelper.java";
 
        System.out.println(path.startsWith("D:")); // true path 对应的字符串 是否以 D: 开始
        System.out.println(path.endsWith(".java")); // true
        System.out.println("~~~~~~~~~~~");
 
        System.out.println(path.startsWith("/",10)); // 从 10 开始 是否 是 以 / 开始的
 
 
        char[] array = new char[10];
        String str = "沧海一声笑滔滔两岸潮";
        // 将 str 所指向的 String 实例中 所包含的字符串[5,10) 之间的字符 拷贝到 数组 array 中
        str.getChars(5,10,array,5);
        System.out.println(Arrays.toString(array));
 
        String substring = str.substring(5); // [5,length() - 1]
        System.out.println(substring);
 
    }
 }

 

5、代码解释 String 实例的创建过程

 

 package CharSequence;
 /**
  * 1、在 Java 语言中 直接使用 “” 引起来的多个字符就是 字符串 (character strings)
  * 2、在 Java 源代码中 直接使用 “” 引起来的字符串 都是 java.lang.String 的实例
  * 3、String 类 是个 不可变类 将来创建的 每个 String 实例 都是不可变的对象【Strings are constant】
  *
  *   [Java 8及之前]
  *   public final class String {
  *       private char[] value; // 使用 char 数组保存字符序列
  *   }
  *
  *   [Java 9 之后]
  *   public final class String {
  *       private final byte[] value; // 使用 byte 数组保存字节序列
  *   }
  *   字节序列是字符序列根据某种编码转换而来
  *
  * */
 
 public class StringTest2 {
     public static void main(String[] args) {
 
         // 变量 s 直接引用了 字符串常量池中的 String实例
         String s = "中国是世界上最伟大的国家,没有之一";
         // 变量 t 引用的是在 堆内存重新创建的 String 实例
         String t = new String("中国是世界上最伟大的国家,没有之一");
 
         System.out.println(s == t);
         System.out.println(s.equals(t)); // true String 重写后的 equals
 
    }
 }
 

 

6、编码 和 解码

编码(encode):将字符串按照某种字符集 转换成字节序列

例如:比如 “中国”==UTF-8==>{-28, -72, -83, -27, -101, -67}

解码( decode ):将字节序列按照某种字符集 转换成字符串

例如:比如 {-28, -72, -83, -27, -101, -67}==UTF-8==>“中国”

7、常用字符集

  • ISO-8859-1 别名:LATIN1

  • Big5:繁体中文

  • GBK:简体中文 每个字符占两个字节

Unicode:万国码

  • 范围是 U+0000-U+10FFFF

  • Java 语言中 char 类型的范围:U+0000-U+FFFF

  • UTF-8

    • UTF-8 是 Unicode 的一种可变长字符编码

    • 将字符串中的字符编码为字符序列后 每个字符占用 1 - 4个字节

    • 汉字节本都占用 3 个字节

    • 8位元指的是一个单位为 8 位

  • UTF-16

    • UTF-16

    • UTF-16BE

    • UTF-16LE

  • UTF-32

    • UTF-32

    • UTF-32BE

    • UTF-32LE

8、String 内部的 byte 数组编码格式

 

 package CharSequence;
 
 import java.nio.charset.Charset;
 import java.util.Arrays;
 /** 1、在 String 实例内部封装的 byte 数组中存储的字节序列是字符串 按照 UTF-16LE 编码 编码后的字节序列
  * 2、在通过 String 实例的 getBytes 方法获取字节序列时,可以确定任意字符集
  * 3、将一组字节序列构成 String 实例时 必须指定 将 字符串编码为字节序列时所采用的的字符串 才能保证不乱码
  *
  * */
 public class StringTest9 {
     public static void main(String[] args) {
         final String s = "中国威武";
 
         StringHelper.perspective(s);
         System.out.println("~~~~~~~~~~~");
         Charset utf = Charset.forName("UTF-16LE"); // 16 bit
 
         byte[] bytes = s.getBytes(utf); // UTF-16
         System.out.println(Arrays.toString(bytes));
 
         byte[] array = {45, 78, -3, 86, 1, 90, 102, 107};
         String x = new String(array,utf); //不使用 UTF-16LE 会乱码
         System.out.println(x);
 
 
    }
 }
 

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM