g g

Pythonフレームワーク
今すぐダウンロード

g g ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • LGPL
  • 価格:
  • FREE
  • 出版社名:
  • Radim Rehurek
  • 出版社のWebサイト:
  • http://nlp.fi.muni.cz

g g タグ


g g 説明

トピックモデリングのためのPythonフレームワーク Gensimは、未加工のデジタルテキストから教師なし学習のために、Pythonで書かれた図書館です。それは隠された(*遅刻*)コーパス構造を学ぶためのフレームワークを提供します。一度見つけられたら、この構造の観点から文書を簡潔に表現することができ、局所類似性などの照会された。 `Wikipedia ` _.Gensimのターゲットオーディエンスは、NLPの研究コミュニティであり、一般的な一般の人々です。 Gensimは商業環境のための製造ツールであることを意味していません。Gensimの事業は、トピックモデリングを実現する、および/またはそれらの圧倒的な内部複雑さを実現する、利用可能なスケーラブルなソフトウェアフレームワークの認識された不足によって動機付けられました。あなたは私たちの `LREC 2010ワークショップペーパー` `` `` `` _.開発者向けの直接的なインタフェースと低いAPI学習曲線、修正と迅速なプロトタイピングを容易にします。入力コーパスのサイズに対するメモリの独立性すべての中間ステップとアルゴリズムはストリーミング方式で動作し、一度に1つの文書を処理します。 "gensim"のいくつかの主な機能は次のとおりです。 ・メモリ独立 - テキストコーパス全体(または中間期間文書行列)全体が一度にRAMに完全に存在する必要はありません。 ・潜在的な意味解析(LSA、LSI)および潜在ディリクト割り当て(LDA)を含むいくつかの一般的なトピック推論アルゴリズムの実装を提供し、新しいものを簡単に追加できます。 ・複数の一般的なデータフォーマットの周囲のI / Oラッパーとコンバータを含みます。 ・潜在的な局所表現で文書間で類似性の問い合わせを許可します。 要件: ・Python


g g 関連ソフトウェア