Rosette 日本語形態素解析システム (組込み向け)キーワード抽出や索引生成に欠かせないツール
携帯電話、カーナビシステム、その他各種携帯端末での
キーワード抽出などに最適
主要検索エンジン等での豊富な採用実績を持つ弊社のRosette 形態素解析システム(サーバー用)と同等の機能を有する、組込機器向けの形態素解析システムを開発しました。形態素解析とは、テキストデータ(自然文)からのキーワード抽出のため、文を単語に分割「分節処理(分かち書き)」するもので、各種携帯端末からの入力テキストのキーワード抽出などに最適です。
Basis Technology の Rosette® 日本語形態素解析システム(組込み向け)は、メモリーフットプリントを低くおさえ、かつサーバー版とほぼ同等の性能を実現しています。豊富な語彙を収録した標準辞書と、絵文字の登録も可能な、柔軟で使い勝手のよいオプション辞書機能などを特長としています。
主な特長:-
分節(分かち書き)/トークン化 :
標準辞書:収録語数は最大50万語 (アプリケーション側のメモリー容量制限に応じて調節可能) -
オプション辞書:
-
ベンダー側で新語・複合語登録可 (用語辞書等)
※ 搭載機種のメモリ、ストレージ容量によってはご利用できない場合があります。 - トークンに辞書IDを付与 (フィルタリングやキーワード検出に利用可)
-
ベンダー側で新語・複合語登録可 (用語辞書等)
- 品詞情報の付与 、タグ付け
- 複合語の抽出・分解
- キーワード抽出、名詞句抽出
- 基本化(動詞・形容詞などの活用語の基本形を出力)
- ストップワード(「が」「を」「に」等)の検知
- ユーザー定義辞書に、顔文字などの特殊文字を含む語句の登録が可能
出力例:

