| パラバッシュ コンピュータクラスタでのテキスト処理を目的としたBASHの変更バージョン |
今すぐダウンロード |
パラバッシュ ランキングとまとめ
- 出版社のWebサイト:
- http://cloud-dev.blogspot.com/
パラバッシュ タグ
パラバッシュ 説明
コンピュータクラスタでのテキスト処理を目的としたBASHの修正版 Parbashは、分散システムまたはマルチコアシステムを使用して大規模データを介してスケーラブルなテキスト処理を可能にするために、Bashスクリプト言語へのオープンソース拡張です。 Parbashは、コンピュータクラスタのマップ軽減ミドルウェアであるApache Hadoopを使用して、マルチプロセッサまたは複数のマシンで処理パイプラインを透過的に配布することで、おなじみのシェルテキスト処理コマンドを使用して大規模なファイルを処理します。パラバッシュの主なタスクは面倒なインターフェースギャップを管理することです。 プログラマがテキスト処理を作成することに焦点を当てている間に、Hadoop(Map-Reduce)とBashの間で、Scripts.Parbashは、特にマルチギガバイト(または大きい)ファイルを介して行われなければならない場合に、計算上高価な処理に最適です。 書き込み時に、Hadoop Frameworkのオーバーヘッドが大きいため、Hadoopで小さなファイルを処理することは実用的ではありません。
パラバッシュ 関連ソフトウェア