pol pol

PoliqARPは、大型コーパスを検索するためのユーティリティです。
今すぐダウンロード

pol pol ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • GPL
  • 価格:
  • FREE
  • 出版社名:
  • Daniel Janus
  • 出版社のWebサイト:

pol pol タグ


pol pol 説明

PoliqARPは大型コーパスを検索するためのユーティリティです。 PoliqARPは大型コーパスを検索するためのユーティリティです。 "Poliqarp"の主な機能はいくつかあります。 タグ付きコーパスのサポート: ・検索コレクションには、生のテキストだけでなく、それを構成する単語やテキストに関する情報も含めることができます(文法の言葉の構造、著作物や書き込み日などのテキストに関するさまざまなメタ情報)。 表現的なクエリ言語: PoliQARPのクエリ言語は正規表現に基づいており、与えられた単語や単語のシーケンスだけでなく、次のためにも検索できます。 ・形容詞の後に名詞 ・行の5名詞 ・5,6、または7名の名詞 ・特定の単語は、特定の単語に閉じていますが、必ずしも次の単語に載っています。 ・19世紀に発行されたテキストで発生した「z」で始まる単語 ・100語を超える文 ・ ...などなど 位置タグセットのサポート: ・単語に割り当てられたタグは内部構造を持つことができ、この構造はクエリに組み込まれてもよい。たとえば、名詞には性別、番号、またはケースがある可能性があります。 ・ポーランドなどの変曲率が豊富な言語で特に便利です(実際には、PoliqARPはもともと開発され、Polish Corpusプロジェクト - IPI PAN CORPUSの中で使用されています)。 ・特定のタグセットには依存しません ・Unicodeのサポート ●ネイティブのスクリプトには、任意の言語で書かれたテキストのコーパスを作成できます - UTF-8形式でエンコードされている限り、英語、ポーランド語、日本語またはタイ語です。 あいまいさのサポート: ・単語のタグは必ずしも一意ではありません。単語がいくつかの方法で解釈できる状況が発生する可能性があります(したがって、それに割り当てられているいくつかのタグがあります)。 PoliqARPはそのような状況を処理し、あなたのクエリが可能な解釈またはそれらすべてのどれかと一致しなければならないかどうかを言うことができます。もしあれば、他の能力がこの能力を持っています。 マルチプラットフォーム: ・PoliqARPはJavaとPortable Cで書かれており、Linux、* BSD、Solarisなど、WindowsやほとんどのUNIXのようなシステムで利用できます。現在、それはリトルエンディアンアーキテクチャのみをサポートしていますが、それはそれをエンディアンニュートラルにするための仕事が進行中です。 効率的: ・クエリの構造に大きく依存するため、コーパスの検索の平均時間を推定するのは困難です。ただし、(単語やフレーズの場合)は、百百万を超える単語を含むコーパスでも数秒かかります(生のテキストの点では、それはタグやメタデータを含むいくつかのギガバイトです。)より複雑なクエリは実行に時間がかかりますが、それでも、あなたは彼らが見つけられるとすぐに結果を得るので、あなたは長く待つ必要はありません。 無料: ・PoliqARPは、GNU General Public Licenseの条項に基づく無料/オープンソースソフトウェアです。 要件: ・Java 2 Standard Editionランタイム環境 このリリースの新機能: ・データ損失につながる可能性があるBPUGPRADEの大幅な回帰は修正されました。


pol pol 関連ソフトウェア

MetaF2XML

MetaF2XMLは、METARおよびTAFメッセージを解析してデコードし、それらをXMLとして保存します。 ...

122

ダウンロード