XAPIANとOMEGA

XAPIANは、GPLの下でリリースされたオープンソースの確率的情報検索ライブラリです。
今すぐダウンロード

XAPIANとOMEGA ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • GPL
  • 価格:
  • FREE
  • 出版社名:
  • Xapian Team
  • 出版社のWebサイト:
  • http://www.xapian.org/

XAPIANとOMEGA タグ


XAPIANとOMEGA 説明

XAPIANは、GPLの下でリリースされたオープンソースの確率的情報検索ライブラリです。 XAPIANは、GPLの下でリリースされたオープンソースの確率的情報検索ライブラリです。他の言語からの使用を可能にするためのバインディングで書かれたXAPIAN ISS(Perl、Java、Python、PHP、およびTCLは現在サポートされています。GuileとC#が機能しています).xapianは開発者を許可するための非常に適応できるツールキットになるように設計されています。簡単に索引付けと検索機能を自分のアプリケーションに追加するために。しかし、他のほとんどのウェブサイトの検索ソリューションとは異なり、Xapianの汎用性を使用すると、オメガを拡張することができます。 "XapianとOmega"の重要な機能は次のとおりです。 ・Free Software / Open Source - GPLの下でライセンスされています。 ・高度にポータブル - 多くのLinux、MacOS X、他の多くのUNIXプラットフォーム、およびMicrosoft Windowsで実行されます。 ・Cで書かれています。 Perlバインディングは、CPANのモジュールSearch :: XAPIANで入手できます。 Java JNIバインディングはXAPIAN-BINDINGSモジュールに含まれています。また、13の言語のバインディングを生成できるSWIGをサポートしています。現在、Python、PHP4、およびTclのためのものが機能しています。 GUILとC#が取り組んでいます。 ・ランク付けされた確率論的検索 - 重要な言葉は、重要でない単語よりも体重を増やすので、最も関連性のある文書は結果リストの上部近くに来る可能性が高いです。 ・関連性のフィードバック - 1つ以上の文書を考えると、XAPIANはクエリを拡張するための最も関連性のあるインデックス用語を提案し、関連文書を提案し、文書の分類などを提案することができます。 ・フレーズと近接検索 - ユーザーは、正確な句で、または指定された数の単語で、指定された順序で、または任意の順序で検索できます。 ・構造化ブール検索演算子の全範囲(「市場ではない」など)。ブール検索の結果は、確率論的重みによってランク付けされます。 Booleanフィルタは、確率探索を制限するために適用することもできます。 ・検索語のステムミングをサポートしています(例えば、「サッカー」の検索は、「サッカー」または「サッカー選手」について言及する文書と一致します。これは、そうでなければ逃しられるかもしれない関連文書を見つけるのに役立ちます。ステムは現在、デンマーク、オランダ語、英語、フィンランド語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、ロシア語、スペイン語、スウェーデン語に含まれています。 ・データベースファイルをサポート> 2GB - 大きな文書コレクションへの拡大縮小に不可欠です。 ・プラットフォームに依存しないデータフォーマット - 1台のマシンにデータベースを作成して別のマシンに検索できます。 ・同時更新と検索を許可します。新しい文書がすぐに検索可能になります。 ライブラリと同様に、いくつかの小さなサンプルプログラム、およびより大きなアプリケーション - OMEGAと呼ばれる索引付けとCGIベースのアプリケーションを提供します。 ・指定されたインデクサーは、HTML、PHP、PDF、PostScript、およびプレーンテキストをインデックスすることができます。他の形式を索引付けするためのサポートの追加は、変換フィルタが入手可能な場合(例えばMicrosoft Word)の容易さです。このインデクサーはファイリング・システムを使用して機能しますが、HTDIG Webクローラーを閉じ込めるためのスクリプトも提供し、リモートサイトをOMEGAを使用して検索することができます。 ・Perl DBIモジュールでサポートされているSQLまたはその他のRDBMSからデータを索引付けすることもできます。これにより、MySQL、PostgreSQL、SQLite、Sybase、MS SQL、LDAP、およびODBCが含まれます。 ・CGI検索フロントエンドは高度にカスタマイズ可能な外観を付いています。これは、XMLまたはCSVの結果を出力するようにカスタマイズすることもできます。 このリリースの新機能: API: ・XAPIAN ::文書は、空の値を明示的に格納しなくなりました。これは意図的な行動ではありませんでした、そしてこの事件がどのように処理されたかは文書化されていませんでした。修正された動作は、ユーザーメタデータの処理方法と一致しています。この変更はDocument :: Get_Value()を使用しては観察できませんが、Document :: values_count()を使用して、document :: values_count()を使用して、またはdocument :: remove_value()で値を削除しようとしているときに気付かれます。 テストスイート: ・TestCase Scaleweight4を-O0でコンパイルしたときにx86で失敗しないように修正しました。問題はテストケースコードにあり、中間FP値の過剰な精度によって引き起こされました。 ・operationがo(...)の動作を持っていることを確認するテストケースほとんどのプラットフォームでWallClock Timeの代わりにCPU時間を確認してください。 ・(チケット#308) ・SKIP_TEST_FOR_BACKEND( "INMEMORY")によるテストの失敗( "InMemory")は、CHAR文字列を比較して==(テストされている戻り値がconst char *ではなくstd :: stringです)でスキップされません。 ・いくつかのコーナーケースでテストカバレッジを向上させます。 ・実際に実行するためのTestCase Consportinency2を修正します(渡すことは幸い)。 ・生成されたテストケースで、各クラスのデフォルトの構築オブジェクトにGET_DESCROPTION()を呼び出して、それが機能するようにしてください(そして、nullを参照しようとしていたり、あるアサーションなどを失敗させてください)。現在チェックされているクラスはすべて問題ありません - これは将来の回帰や新しいクラスに関する問題を回避するためです。 ・テストカバレッジビルドでは、 "-fprofile-arcs -ftest-coverage"の代わりに "--coverage"を使用してください。 ・テストハーネスには、ユーザー指定のメタデータをサポートすると(メタデータキーの反復とは別に)InMemoryバックエンドがフラグを立てています。 マッチャー: ・照会に対戦副問合せが含まれている場合は、他の用語を確認する前に確認してください。 ・ORまたはANY_MAYBEがANに崩壊したとき、私たちは慎重に子供たちを最大限の効率で交換していましたが、条件は逆になりました。実際には物事を悪化させました。これは、より多くの結果が求められたときに同じクエリを実行しているのが速く実行されているため、これが注目されました。 ・それを再構築するのではなく、最初のサブデータベースのTermFreqとウェイトマップのみを作成するだけです。この地図をコピーして返却しないでください。これにより、複数のデータベースにわたる検索をスピードアップする必要があります。 ・サブマッタが失敗したが、ErrorHandlerは、特別なダミープレースホルダーオブジェクトを割り当てるのではなく、ヌルポインタを使用するだけです。 ・MusalAndPoStlistを支持して、andpostlistを削除します。 AndPostListは、(andmaybepostlistとorpostlistによって)ディケイ製品としてのみ使用され、より速いようには見えません。削除するとCPUキャッシュ圧力が低下し、維持するコードが少なくなります。 ・AND_MAYBEのオプションのブランチのSKIP_TO()の代わりにcall check()を呼び出します。 フリントバックエンド: ・Metadataキーを介してTermIterator :: Skip_to()のバグを修正しました。 リモートバックエンド: ・XAPIAN-TCPSRV - InterfaceオプションをMacOS Xで作業する(チケット#373)。 ・リモートマッチからの最大重みが最大の重みではなくDOCIDを返す原因となったTypoを修正してください。リモートバックエンドを持つ複数のデータベースを検索するとき、これは間違った結果をもたらしましたが、通常はBM25と同じように問題がありませんでした。 InMemoryバックエンド: ・InMemoryバックエンドはメタデータキーを繰り返すのをサポートしていません。空の反復を与えるためにそうしようとしていましたが、今や投げに修正されました ・UnImplementError(そしてこの制限は現在文書化されています)。 構築システム: ・未使用のヘッダーの包含と、未使用のコードをたくさん取り除き、ビルドをより早く、やや小さくする必要があります。 ・ - disable-backend-flint、--disable-backend-remote、およびdisable-backend-inmemoryの下でコンパイルするのを修正しました。 ・建てられたソースを「清潔」になっていない - メンテナモードでは、メンテナモードから離れてツリーを切り替えてください。./ configure ・設定:より多くのGCC警告 - すべてのバージョン、4.0以降の "-wstrict-null-sentinel"、4.3以降の "-Wlogical-op -wmissing-declarations"の "-woverloaded-virtual"。特に「-wmissing-宣言」は、Conspontency2が実行されていないことを捉えました。 ・内部的には、Const Referenceがわずかに速くなることがわずかに速く、GCCの参照カウントされたコードがわずかに速いほどコードが少ないほど、Const Referenceで渡すためにstd :: stringを渡す数の場所を修正します。 ::文字列実装 - 基準以外のカウントされた実装では、const参照ははるかに速くなければなりません。 (チケット#140) ドキュメンテーション: ・インストール:GCC 2.95.4を使用してプラグを定期的にテストしていないため、Xapian 1.1.xのために3.1に必要な最小GCCバージョンを上げています。 ・MaxItems = 0を渡すには、:: get_mset()を渡すには何を渡すかを文書化します。 ●docs / queryparser.html:フレーズまたはサブエクスプリッシュでプレフィックスを使用する例を追加します。 ・User Metadata関数のDoxygenコメントを正しくコメント:データベース:: get_metadata()UnImplementedErrorがスローしますが、writabledatabase :: set_metadata()ができます。 ・データベース:: metadata_keys_begin()がメタデータをサポートしていない場合は、エンドのイテレータを返します。 ・ハッキング:開発環境に必要なDebian / Ubuntuパッケージのリストを更新します。 デバッグコード: ・ - enable-debugでビルドを修正しました。 ・もう少しアサーションを追加しました。


XAPIANとOMEGA 関連ソフトウェア