Rosette朝鮮語形態素解析システム


「中国語、日本語、朝鮮語版の検索エンジンを展開するために、 GoogleはBasis Technologyのもつ言語技術を利用しました。」


Google
Fellow and Vice President,
Urs Hölzle 様



朝鮮語は、特徴的な音韻と字母を組み合わせる表記形式のため、形態素解析を行う上で解決すべき問題が複数存在します。朝鮮語では、単語(語説)の音 韻的特徴のために、単語境界を識別するのが困難なことがよくあります。弊社のRosette 朝鮮語形態素解析システムは、朝鮮語テキストの分節処理に非常に優れた力を発揮します。Basis Technologyによる最先端の研究および専門知識に基づいたこのソリューションを素早く効率的にご利用いただけます。

Rosette 朝鮮語形態素解析システムは、朝鮮語テキストの正確な分節を素早くおこなうために、統計的な技法を利用し、さらに詳細辞書をベースとしています。統計的技 法には、語の頻度に関する情報、語形変化の法則を反映し、辞書データは定期的に更新しています。いずれも本システムの正確さを特徴づける重要な役割となっています。