Lemurプロジェクト

言語モデリングと情報検索アプリケーション
今すぐダウンロード

Lemurプロジェクト ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • Freeware
  • 価格:
  • FREE
  • 出版社名:
  • The Lemur Team
  • 出版社のWebサイト:
  • http://www.lemurproject.org/
  • オペレーティングシステム:
  • Mac OS X
  • ファイルサイズ:
  • 63.6 MB

Lemurプロジェクト タグ


Lemurプロジェクト 説明

言語モデリングと情報検索アプリケーション Lemur Toolkitは、言語モデリングと情報検索の研究を容易にするために設計された無料のオープンソースアプリケーションです。 Lemur Toolkitには、アドホックや分散検索、相互言語IR、要約、フィルタリング、および分類などの技術が含まれています。 "Lemur Project"の主な機能はいくつかあります。 ・洗練された構造化クエリ言語(inqueryとindriを使用) ・XMLおよび構造化文書検索のサポート ・幅広い研究試験コレクション(例えば、TREC CD 1-5、WT10G、RCV1、GOV、GOV2)で一般的に使用されています。 ・「箱入り」サイト検索機能でWebページに索引付け ・Windows、Linux、およびWeb用の対話型インターフェイス ・分散情報検索および文書クラスタリングアプリケーション ・C ++で書かれたクロスプラットフォーム、高速、モジュラコード ・C ++、Java、C#API ・無料でオープンソースのソフトウェア ・大規模で成長しているユーザーコミュニティによって6年以上にわたり使用中 インデックス作成: ・小型、中規模、大規模(Terabyte)コレクションのための複数の索引付け方法 ・英語、中国語、アラビア語のテキストの組み込みサポート ・ポーターとKrovetz Word Stemming ・インクリメンタルインデックス作成 ・TRECテキスト、TREC WEB、プレーンテキスト、HTML、XML、PDF、MBOX、Microsoft Word、Microsoft Word、およびMicrosoft Word、およびMicrosoft PowerPointの範囲外のインデックス作成サポート ・インラインおよびオフセットテキスト注釈(例えば、音声と名前付きエンティティ) ・ドキュメント属性をインデックス 検索: ・インドライやKL-Divigenceなどの主な言語モデリングアプローチ、およびベクトルスペース、TF.IDF、OKAPI、および照会 ・関連性と擬似関連性のフィードバック ・ワイルドカード用語拡張(インドリを使用) ・通過とXML要素の検索 ・クロスリング検索 ・ディリッキレットプライオールやマルコフチェーンを介したスムージング ・任意の文書プラリ(例えば、ページランク、URL深度)をサポート このリリースの新機能: ・Indriterminfolistによって返された2799440 Terminfoには位置がありません ・2794361 HarvestLinksは収穫ディレクトリを作成できません ・2788507 krovetzstemmerTransformationはバッファをオーバーフローする可能性があります ・2788504 AnchortextAnnotatorはバッファをオーバーフローする可能性があります ・リンクパスが悪い場合は、2787935 PageRank Dumpsコア ・2784994間違った記事 ・2783665 TextTokenizerは、引用符付きタグ属性を時期尚早に終了します ・2782954 Indri :: Parse :: HtmlParser :: HandleTagがバッファをオーバーフローする可能性があります ・2772914 Irevalgui.jarは狂った結果を与えます ・2772846 bin / ireval.jarは無効な.jarファイルです(Lemur V48) ・2770916複数のスレッドを使用したDocumentLengthバッファ破損 ・2747981 WarcDocumentIteratorはwarcファイルの文書をミスします ・2747707 TextTokenizerは、引用符付きのタグ属性を認識しません


Lemurプロジェクト 関連ソフトウェア

スカドック

無料およびオープンソースのコマンドラインユーティリティを作成、抽出、抽出、および確認するのに役立ちます。 ...

206 105 KB

ダウンロード