テリア

検索エンジンを構築するための確率論的なJavaツールキット。
今すぐダウンロード

テリア ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • MPL
  • 価格:
  • FREE
  • 出版社名:
  • University of Glasgow
  • 出版社のWebサイト:
  • http://ir.dcs.gla.ac.uk/terrier/

テリア タグ


テリア 説明

検索エンジンを構築するための確率論的なJavaツールキット。 Terrier Projectは、検索エンジンを構築するための確率論的なJavaツールキットです。より一般的には、それは大規模な情報検索アプリケーションを構築するためのモジュール式プラットフォームであり、索引付けおよび確率的検索機能を提供する。それはデスクトップ検索アプリケーションに付属しています。逐次は、パラメータフリーの確率検索アプローチ(ランダム性モデルからの発散など)、自動クエリ拡張/再配合方法、そして効率的なデータ圧縮技術を含むさまざまな最先端の機能を持っています。テリアには、AP、WSJ、WT10G、.GOV、および.GOV2などの標準的なTRECコレクションをインデックス、クエリし、評価する機能を含む、強力な概念実証デスクトップ検索アプリケーションとフルトレック機能が付属しています。テリアはJava で書かれており、一元的または分散設定で、アドホック検索、Web検索、および相互言語検索に正常に使用されています。現在、さまざまなアプリケーションの実行にも使用されています。ここに「テリア」の主な機能がいくつかあります。 ・オープンソース(Mozilla Public License) ・クロスプラットフォームJavaで書かれています ・高圧縮ディスクデータ構造。 ・大規模な文書コレクションの取り扱い。 ・効率的なクエリ拡張のための直接ファイル。 ・モジュール式とオープンインデックス付けとAPIの照会 ・標準のTRECテストコレクションからの索引付けと検索のためにテストベッド。 ・対話型クエリアプリケーション。 ・さまざまな種類の文書を検索するためのデスクトップ検索アプリケーション。 ・流れやランダムアクセスファイルを圧縮するためのガンマ、単項符号化整数の入出力。 ・TRECアドホックの標準評価および既知の項目検索検索結果。 ・タグ付き文書コレクションのインデックス、およびHTML、PDF、またはMicrosoft Word、Excel、PowerPointファイルなどのさまざまな形式の文書。 ・フィールド情報のインデックス作成 ・単語上の位置情報の索引付け、またはブロックレベル。 ・TF-IDF、BM25、Ponte-Croft言語モデルなどの古典的な検索モデルのサポート、およびロッキオのクエリ拡張。 ・ランダム性(DFR)文書ランキングモデルからの多数の発散を提供します。 ・自動クエリ拡張のためにいくつかのパラメータを含まないDFR Termの重み付けモデルを提供します。 ・事業者、フレーズ、および近接検索をサポートしていない高度なクエリ言語。 ・ストップワードムラやステムなどの部品のパイプラインを通る用語の柔軟な処理。 このリリースの新機能: ・これは、主にHadoop Mapを縮小するための新しいサポートを含む実質的なアップデートです。 ・IIT CDIP1(TREC Legal Track)コレクションのサポート、およびさまざまなバグ修正など、さまざまなマイナーな改善が含まれています。 ・これは2.xシリーズの究極のリリースであることを目的としています。


テリア 関連ソフトウェア

e-GADS!

E-GADS! グランド検索とレスキューチームがメンバーシップを追跡できるようにするWebベースのデータベースです。 ...

376

ダウンロード