wordtabulator.

UTF-8エンコーディングを備えたプロセステキストとワード要素のインデックスを作成します。
今すぐダウンロード

wordtabulator. ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • GPL
  • 価格:
  • Free
  • 出版社名:
  • By Sergey Logichev
  • オペレーティングシステム:
  • Windows 2000, Windows Vista, Windows, Windows 7, Windows XP
  • 追加要件:
  • None
  • ファイルサイズ:
  • 2.6 MB
  • 総ダウンロード数:
  • 83

wordtabulator. タグ


wordtabulator. 説明

WordTabulatorはテキスト分析を目的としています。 WordTabulatorの助けを借りて、定義されたテキストセットから抽出されたWord要素のインデックスを生成できます。 Word要素は、言葉、N-GRAM(定義されたサイズ)またはフレーズ(Syntagmes)であり得る。 プログラムは、マルチバイトUTF-8エンコーディングのように、通常の2バイトのエンコーディング(ANSI)のようにテキストを処理できます。 ソーステキストは、一連のフラットテキストファイルまたはHTML / XML / SGML文書として定義されています。 最後の場合、プログラムはマークアップからコンテンツをフィルタリングできます。 さらに、選択したペアタグ内の定義されたコンテンツのみを処理できます。 または、そのコンテンツを処理からスキップできます。 ロシア語、出力インデックスの3つの異なるフォーマット、3つの異なるタイプのワード要素(単語、Nグラム、フレーズ)、コンテキストのブラウザ、およびTRUEアルファベット順序付けが含まれます。


wordtabulator. 関連ソフトウェア