多言語対応 e-Discovery製品向けツール
More evidence, fewer surprises, stronger cases

グローバル化の時代、さまざまな国で言語を問わずに作成されるドキュメントの存在は、法律上の調査においても決して無視することができません。 裁判において弁護団は、母国語以外で書かれた膨大な量のドキュメントをフィルタリング、調査、分析しなければならないことがしばしばあります。

多言語対応ディスカバリーの重要性の高まりは、弁護士およびその技術担当者にとって新しい課題となります。e-Discoveryはただでさえ複雑で、異なった言語、表記方法、文字コードを含む場合、その複雑性は増大します。しかし、可能な限り最善の結果をクライアントに提供するためには、きめの細かい調査が依然極めて重要です。

弁護士とその支援者に朗報

Basis Technologyは、関係者が直面する多言語対応ディスカバリーの課題解決を支援します。テラバイト単位の非構造化多言語テキストに埋もれた証拠を、正確かつ迅速、コスト効率よく明らかにする総合的なe-Discovery製品向けツールを提供します。実質的に業界最先端の多言語対応検索エンジンと情報検索アプリケーションの中核をなす、業界トップクラスの言語学的ソフトウェアを使用しています。

弊社の多言語対応 e-Discovery 製品向けツールは、すでに多数の企業および政府機関にてその性能が立証されているRosette® 言語処理プラットフォーム(RLP) を基盤としています。 相互利用可能なRLPは、多言語対応 e-Discovery製品の構成要素として構築され、さまざまな言語および文字コードやデータソースを扱う際、ディスカバリー・ワークフローと情報検索アプリケーションにおいてスムーズに稼動します。

ディスカバリー・アプリケーションの多言語化

Basis Technology が誇る言語処理ソフトウェアは、データマイニング、レビュー、検索および弁護団が使用するその他のディスカバリー・アプリケーションを容易に一体化することが可能です。RLP APIをアプリケーションに導入することにより、アジア、ヨーロッパ、中東の主な言語をカバーする独自のe-Discovery 製品にて即時ご利用いただけます。 圧倒的な正確さと効率性を兼ね備えた多言語テキスト分析を可能にする、専門家にとっては欠かすことのできないツールとなるでしょう。

多言語対応e-Discovery製品用ツール:

Step1: 言語および文字コードを判別し、Unicodeに変換
使用コンポーネント: Rosette® 言語・文字コード判別システム(RLI)

ドキュメントの言語および文字コードを判別し、コンテンツを選別・処理します。また、Unicodeに変換することにより、言語に関わらず、ディスカバリーと情報検索アプリケーションでの単一データソースへのアクセスを可能にします。Rosette 言語の区切り位置検出 (RLBL:Rosette Language Boundary Locator) という機能を使用し、多言語のドキュメントを個別に処理するために言語領域にセグメント化します。RLIは、短い文字列であっても、正確に55種類の言語を判別します。

Step2: 語形、品詞および構文を判別するために言語インテリジェンスを応用
コンポーネント: Rosette®形態素解析システム(RBL)

Rosette®形態素解析システム(分かち書きツール) は、テキストを正確にフィルタリング、分析、検索するために、ドキュメントを分析し、完全な形態素解析を実行します。 アジア、ヨーロッパ、中東の主要言語で書かれた、ドキュメント内の品詞、文の区切り、単語の切れ目、トークンおよびその他の言語コンポーネントを判別します。RBLの技術と言語データは、ウェブやエンタープライズ・サーチエンジンの分野において、長年の開発・使用実績があります。

Step3: キーワード抽出 コンポーネント: Rosette®固有表現抽出システム(REX)

Rosette®固有表現抽出システム(キーワード抽出ツール)は、非構造化テキストから、人名、地名、日付やその他のキーワードを抽出し、詳細な分析を可能にします。特定の名前や電話番号、Eメールアドレスのように、ユーザが指定する固有表現も同様に抽出が可能です。統計的モデルの使用により、ドキュメント内に固有表現が存在するかどうかを決定する支援をおこないます。そのため、ユーザーが認識していないキーワードでも検出を可能にするのが固有表現抽出の技術です。