大規模データセットを分析するためのプラットフォーム
今すぐダウンロード

豚 ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • Other/Proprietary Li...
  • 価格:
  • FREE
  • 出版社名:
  • Yahoo! Inc.
  • 出版社のWebサイト:
  • http://del.icio.us/help/firefox/bookmarks/quicktour

豚 タグ


豚 説明

大きなデータセットを分析するためのプラットフォーム 豚は、これらのプログラムを評価するためのインフラストラクチャと結合された、データ分析プログラムを表現するための高レベル言語で構成される大きなデータセットを分析するためのプロジェクトです。豚のプログラムの顕著な性質は、それらの構造が実質的な並列化に適していることであり、それはそれらが非常に大きなデータセットを取り扱えることを可能にする。現在の時間、豚のインフラストラクチャ層は、Map Reductプログラムのシーケンスを生成するコンパイラで構成されています。どの大規模並列実装がすでに存在しています(例:Hadoopサブプロジェクト)。 PIGの言語レイヤーは現在、Pig Latinと呼ばれるテキスト言語で構成されています。これには、次の主要なプロパティがあります。*プログラミングの容易さ。単純な「恥ずかしい並列」データ分析タスクの並列実行を達成するのは簡単です。複数の相互に関連したデータ変換からなる複雑なタスクは、データフローシーケンスとして明示的にエンコードされ、それらを簡単に書くこと、理解し、そして維持することができます。 *最適化の機会タスクがエンコードされる方法は、システムが自動的に実行を最適化することを許可し、ユーザーが効率的ではなくセマンティクスに集中することを可能にします。 *拡張性ユーザーは特殊な目的の処理を行うために独自の機能を作成できます。このリリースの新機能: ・パフォーマンスとメモリの使用上の改善は、UDFSのアキュムレータインタフェースを追加し、多くのバグ修正を含みます。 ・このリリースはHadoop 0.20で動作します。


豚 関連ソフトウェア