Международные компоненты для Unicode
-
Обзор ICU
- ICU — это проект с открытым исходным кодом для поддержки Unicode, интернационализации и глобализации.
- ICU широко используется в различных операционных системах и средах, обеспечивая согласованность результатов на разных языках программирования.
- Проект поддерживается IBM и другими компаниями, а также включен в Microsoft Windows.
-
Функции ICU
- ICU предоставляет широкий спектр функций, включая обработку текста, преобразование символов, регулярные выражения и поддержку различных языков и календарей.
- В версии 54 ICU была удалена поддержка сложной верстки текста для некоторых языков, а в версии 58 она была заменена на HarfBuzz.
-
Поддержка Unicode и языковых стандартов
- ICU поддерживает различные стандарты Unicode, включая UTF-16 для Java и UTF-8 для C/C++.
- ICU 73.2 и последующие версии внесли значительные улучшения в поддержку китайского языка и других языковых стандартов.
-
Изменения в версиях ICU
- ICU 74 обновлен до версии Unicode 15.1 с новыми символами и механизмами безопасности.
- ICU 72 обновлен до Unicode 15, а ICU 73.2 — до последней версии 15.1.
- ICU 71 добавил поддержку японского языка и хинди, а ICU 67 занимается поддержкой Brexit.
-
История и развитие ICU
- ICU был создан в 1996 году, когда IBM приобрела Taligent, и изначально был частью Java Development Kit.
- ICU4C и ICU4J были созданы для поддержки интернационализации на C++ и Java соответственно.
- ICU был выпущен как проект с открытым исходным кодом в 1999 году и присоединился к консорциуму Unicode в 2016 году.
-
Альтернативы ICU
- Boost.Locale — это оболочка C++ для ICU, но она не поддерживает популярные идиомы C++.
- ICU теперь поддерживает UTF-8, что устраняет аргумент о том, что он поддерживает только UTF-16.
-
Дополнительные ресурсы
- ICU включает класс MessageFormat для форматирования текста с множественным числом и выбором.
- В статье также упоминаются другие проекты и технологии, связанные с Unicode и интернационализацией.
Полный текст статьи: