國際化組件 Unicode (ICU) 函數庫


ICU (International Components for Unicode)是為軟件應用提供Unicode和全球化支持的一套成熟、廣泛使用的C/C++、Java和.NET 類庫集,可在所有平台的C/C++、Java和C# 軟件上獲得一致的結果,用於支持軟件國際化的開源項目, 軟件開發者幾乎可以使用ICU 解決任何國際化的問題,根據各地的風俗和語言習慣,實現對數字、貨幣、時間、日期、和消息的格式化、解析,對字符串進行大小寫轉換、整理、搜索和排序等功能。ICU的主頁是http://www.icu-project.org/

ICU首先是由Taligent公司開發的,Taligent公司被合並為IBM公司全球化認證中心的Unicode研究組后,ICU由IBM和開源組織合作繼續開發。開始ICU只有Java平台的版本,后來這個平台下的ICU類被吸納入SUN公司開發的JDK1.1,並在JDK以后的版本中不斷改進。C++和C平台下的ICU是由JAVA平台下的ICU移植過來的,移植過的版本被稱為ICU4C,來支持這C/C++兩個平台下的國際化應用。ICU4J和ICU4C區別不大,但由於ICU4C是開源的,並且緊密跟進Unicode標准,ICU4C支持的Unicode標准總是最新的;同時,因為JAVA平台的ICU4J的發布需要和JDK綁定,ICU4C支持Unicode標准改變的速度要比ICU4J快的多。在Linux 操作系統上,.NET Core 使用ICU的全球化API, 從 .NET 5.0 開始,如果應用在 Windows 10 2019 年 5 月更新或更高版本上運行,.NET 庫將使用 ICU 全球化 API。.NET 5 統一使用ICU, 引入此更改的原因有兩個:

  • 應用跨平台(包括 Linux、macOS 和 Windows)具有相同的全球化行為。
  • 應用可以通過使用自定義 ICU 庫來控制全球化行為。

ICU的功能主要有:

  • 代碼頁轉換: 對文本數據進行Unicode、幾乎任何其他字符集或編碼的相互轉換。ICU的轉化表基於IBM過去幾十年收集的字符集數據,在世界各地都是最完整的。
  • 排序規則(Collation): 根據特定語言、區域或國家的管理和標准比較字數串。ICU的排序規則基於Unicode排序規則算法加上來自公共區域性數據倉庫(Common locale data repository)的區域特定比較規則。
  • 格式化: 根據所選區域設置的慣例,實現對數字、貨幣、時間、日期、和利率的格式化。包括將月和日名稱轉換成所選語言、選擇適當縮寫、正確對字段進行排序等。這些數據也取自公共區域性數據倉庫。
  • 時間計算: 在傳統格里歷基礎上提供多種歷法。提供一整套時區計算API。
  • Unicode支持: ICU緊密跟進Unicode標准,通過它可以很容易地訪問Unicode標准制定的很多Unicode字符屬性、Unicode規范化、大小寫轉換和其他基礎操作。
  • 正則表達式: ICU的正則表達式全面支持Unicode並且性能極具競爭力。
  • Bidi: 支持不同文字書寫順序混合文字(例如從左到右書寫的英語,或者從右到左書寫的阿拉伯文和希伯來文)的處理。
  • 文本邊界: 在一段文本內定位詞、句或段落位置、或標識最適合顯示文本的自動換行位置。

參考:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM