ljparser.

Web検索とマイニングのための現像プラットフォーム。
今すぐダウンロード

ljparser. ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • Freeware
  • 出版社名:
  • LING-JOIN Software
  • オペレーティングシステム:
  • Windows All
  • ファイルサイズ:
  • 17.5 MB

ljparser. タグ


ljparser. 説明

LJParserは、多言語の正確な検索、新しい単語の検出、テキスト要約、キーワード抽出などを含む強力なモジュールを提供するように設計された完全なツールです。 主な特徴: 中国語単語セグメンテーションSDKモジュール: 中国語単語セグメンテーションSDKモジュールは、中国語の情報処理コンポーネントの不可欠な中核の中国語の分割されたテキストを分割することができます。これにより、条件付きランダムフィールド技術(CRF)モデル、および99%に近い単語セグメントメント精度が高精度、速度、適応性、強い利点を使用しています。特徴は以下を含みます:穀物セグメンテーション調整可能な融合度。ユーザー定義の辞書をサポートするための20以上の業界固有の辞書。 POSタグ付けSDKモジュール: POS中国語のSDKモジュールを自動的にタグ付けすることができ、それは本当に中国語環境を理解することができ、それは「名詞」または「動詞」というラベル付けされた「建物」や「動詞」のような自動的に読むことができます。条件付きランダムモデル、高精度、スピード、適応性、その他の強力な利点がある99%に近いPOSタグ付け精度。 人物、場所、組織を含む中国の名前付きエンティティの認識SDKモジュール: 人物、場所、組織を含む中国の名前付きエンティティの認識SDKモジュールは、隠された名前、地名、中国語の組織名、言語と予測の深い理解として、自動的に調べることができます。辞書に。 97%の認識精度、および10m / sの速度を持つ条件付きランダムフィールドモデルを使用した継手は、さまざまな統計とさまざまな用途に基づいて構築できます。 文書からのキーワード抽出SDKモジュール: Documents SDKモジュールからのキーワード抽出は、単語やフレーズの数の抽出されたセマンティックコンテンツに基づいて、記事の中心的な概念を完全に把握することができます。関連する結果を使用して、読み取り、意味照会、および高速マッチングを絞り込むことができます。このモジュールベースの意味統計言語モデルでは、処理される文書は業界のフィールドに制限されず、最新の単語を識別できます。出力は単語の重さでマークされます ドメイン用語の自動抽出SDKモジュール: ドメイン用語の自動抽出SDKモジュールは、専門の文献分析の強力な武器です。それはキーワード抽出技術の上にありますが、専門的な文献を認識モデルの最大縁に組み合わせています。これは、文献に現れる用語を効果的にタップすることができます。 英語の語彙分析SDKモジュール: 英語の語彙分析SDKモジュールは、POSタグ付け、人物、場所、組織を含む、POSタグ付け、名前付きエンティティの認識を含む英語の情報処理のための不可欠なコアコンポーネントです。高精度、スピード、適応性、強力な利点があるため、このモジュールは組み合わせと機械学習モデルの確率を組み合わせました。 日本語語彙解析SDKモジュール: 日本語語彙解析SDKモジュールは、POSタグ付け、人物、場所、組織を含む名前付きエンティティの認識を含む日本語の情報処理のための不可欠なコアコンポーネントです。高精度、速度、適応性、強力な利点を持つ条件付きランダムフィールドモデルを使用して、99%に近い単語精度、およびPOSタグ付け精度が98%近く98%に近い。 テキストマイニングミドルウェア: テキストマイニングミドルウェアには、テキスト分析されたマイニングモジュール、サブシステム、およびAPIインタフェースが含まれています。これは、さまざまな複雑なクライアントアプリケーションにシームレスに統合できます。このミドルウェアは、Windows、Linux、FreeBSD、その他の異なるオペレーティングシステムと互換性があります。 Ling-Joinテキストマイニングミドルウェアには、次のSDKモジュールが含まれています。 テキスト集計ミドルウェア: テキスト集約ミドルウェアは、テキストコンテンツ、長い記事からキー文とキーの段落から抽出し、概要を構成することができます。 Ling-Joinテキスト要約ミドルウェアは、文書の概要に対してコヒーレントプロセスを生成するだけでなく、冗長性を削除し、簡潔な要約を生成することもできます。ユーザーは、要約、パーセント、その他のパラメータの長さを自由に設定できます。このミドルウェアは、英語と中国語の処理をサポートし、処理速度は毎秒20テキストであります。 テキスト分類ミドルウェア: コンテンツタイプ別の文献によると、テキスト分類ミドルワークチャンは、ニュース分類、プロファイルの分類、メール分類、オフィス文書の分類、エリア分類、その他多くのアプリケーションに使用されます。このミドルウェアはマルチレベルの分類を行い、分類率は1秒あたり100テキスト、平均精度が90%以上で、また英語と中国の混在分類に分類することができます。 テキストクラスタリングミドルウェア: テキストクラスタリングは、最も重要な教師な学習問題と見なすことができます。したがって、クラスタは、それらの間で「類似」なオブジェクトの集まりであり、他のクラスタに属するオブジェクトに「異なる」とされています。それは、ホットトピック、イベント追跡、データの視覚的分析、その他多くのアプリケーションの自動生成に使用できます。 Ling-Joinは、迅速で正確にはコアセマンティックテクノロジを使用します。それはまたクラスター間の進化的傾向を自動的に取得することができます。 テキストフィルタリングミドルウェア: テキストフィルタリングミドルウェアは、大量のテキストから必要な情報をすばやく識別でき、情報インテリジェントフィルタとコンテンツ監査またはその他のフィールドに使用できます。 Ling-Joinは、ルールベースのフィルタリングと学習ベースのフィルタリングの方法を組み合わせたものです。平均精度率は90%以上です。ユーザーはさまざまなフィールドの規則を設定する柔軟性を持っています。


ljparser. 関連ソフトウェア

.NETのspire.doc

すべての.NETプラットフォームから単語ファイルを作成、読み取り、書き込み、変換することができます。 ...

353 17741905

ダウンロード