Rosette Unicode対応ライブラリ
[このような方にお勧め]
|
Basis Technology の Rosette® Unicode 対応ライブラリ (RCLU: Rosette Unicode Core Library) をご利用いただくことにより、日本語アプリケーションのUnicode対応を適切かつ柔軟に実現することができます。
Basis Technology のRosette® Unicode 対応ライブラリは、常に最新のUnicode 標準に準拠し、UTF-16, UTF-7, UTF-8, およびUnicode 旧バージョン、世界で使用されている160 種類以上の文字コードをサポートしており、利用環境に適した文字コードで入出力が可能です。
また、日本では ISO-2022-JP(JIS) 、Shift-JIS 、EUC-JP などといった日本固有の文字コードでのデータ処理が必要となる場合が多くあります。 RCLU は、これら日本語固有の文字コードからUnicode への変換、あるいはその逆をおこなうためのツールとしてもご利用いただけます。Shift_JIS-2004 にも対応しております。携帯電話の絵文字対応にご関心のある方は、こちらまでお問い合わせ下さい。)
さらに日本語・中国語・朝鮮語の文字コード自動検出、テキスト文字列の正規化、文字プロパティの特定等の機能を有しています。
日本語テキストを対象とする主な文字列の正規化機能は下記のとおりです。
文字列変換機能一覧(日本語関連)
- 文字を全角/半角に変換
- 全角カタカナを半角に変換
- カタカナをひらがな/ひらがなをカタカナに変換
- 小文字のカタカナとひらがなを大文字に変換
- 大文字のカタカナとひらがなを小文字に変換
- アルファベット大文字を小文字/小文字を大文字に変換
- ローマ字を全角ひらがな/ローマ字をカタカナ表記に変換
- ひらがなと全角カタカナをヘボン式ローマ字に変換
- ひらがなと全角カタカナを訓令式ローマ字に変換
- 正規表記に変換
- バックスラッシュ記号を円記号に変換
- 円記号をバックスラッシュ記号に、オーバーバーを波型記号(チルダ)に変換
- 数字列を英数字に変換
- 組み合わせ法を分割法/分割法を組み合わせ法に変換
- SGML文字要素をUnicodeに変換
- 指定された文字を別の指定された文字に置き換える
- 指定された文字を取り除く
- 指定された文字だけ残して後の文字は取り除く
※ 中国の漢字文字コードGB18030とUnicode 相互のエンコーディング変換も可能です。GB18030 (GBK2K) は、中華人民共和国の情報処理製品に採用が義務付けられている国家標準の文字コードです。
Basis Technology は Unicode Consortium の メンバー企業です。

