Rosette 英語形態素解析システム
英語情報を適切に解析

英語には、特異な綴りと使用法をもつ外来語や新語など、膨大かつ多様な語彙が含まれているため、その解析をおこなうことは容易ではありません。テキ スト処理も同様で、動詞と前置詞で構成された熟語(例: Pick up )は、別の単語が間に入ってしまう場合もあり、適切な処理ができないと異なる意味あいになってしまう場合もあります。(例: John picked the newspaper up )。さらに、 "be" "have" "do" などの助動詞は、文章により助動詞と判断される場合と、動詞と判断される場合があるため、解析作業をさらに複雑にします。

Basis Technology の Rosette® 英語形態素解析システムは、このような複雑な英文テキストをも適切に処理するポータブルで高性能な言語解析エンジンです。ステミングおよび品詞解析などを含む、非常に優れたな英語形態素解析によりこれらの問題を解決します。

特長

  • 正規化短縮形のスペルアウト・分割、トークンの大文字から小文字への変換をおこないます。
  • 基本化・ステミング
    接辞を削除し、単語を原形または基本形へと変換します。
    例) Walked → Walk
    例) Went → go
    例) their → they
  • 品詞判別
    名詞、固有名詞、動詞、形容詞等の品詞を正確に判別します。