| wordtabulator. UTF-8エンコーディングを備えたプロセステキストとワード要素のインデックスを作成します。 |
今すぐダウンロード |
wordtabulator. ランキングとまとめ
- オペレーティングシステム:
- Windows 2000, Windows Vista, Windows, Windows 7, Windows XP
wordtabulator. タグ
wordtabulator. 説明
WordTabulatorはテキスト分析を目的としています。 WordTabulatorの助けを借りて、定義されたテキストセットから抽出されたWord要素のインデックスを生成できます。 Word要素は、言葉、N-GRAM(定義されたサイズ)またはフレーズ(Syntagmes)であり得る。 プログラムは、マルチバイトUTF-8エンコーディングのように、通常の2バイトのエンコーディング(ANSI)のようにテキストを処理できます。 ソーステキストは、一連のフラットテキストファイルまたはHTML / XML / SGML文書として定義されています。 最後の場合、プログラムはマークアップからコンテンツをフィルタリングできます。 さらに、選択したペアタグ内の定義されたコンテンツのみを処理できます。 または、そのコンテンツを処理からスキップできます。 ロシア語、出力インデックスの3つの異なるフォーマット、3つの異なるタイプのワード要素(単語、Nグラム、フレーズ)、コンテキストのブラウザ、およびTRUEアルファベット順序付けが含まれます。
wordtabulator. 関連ソフトウェア