擦り傷

マルチページWebサイトをクロールして削り取るためのフレームワーク
今すぐダウンロード

擦り傷 ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • Freeware
  • 価格:
  • FREE
  • 出版社名:
  • Peter Jones
  • 出版社のWebサイト:
  • http://rubyforge.org/users/pjones/
  • オペレーティングシステム:
  • Mac OS X
  • ファイルサイズ:
  • 38 KB

擦り傷 タグ


擦り傷 説明

マルチページのWebサイトをクロールして削り取るためのフレームワーク 他のスクレイディングフレームワークとは異なり、スクラップフレームワークは「ダーティ」Webサイトで動作できるように設計されています。すなわち、プログラムで抽出されたデータを抽出するように設計されていなかったWebサイトには、スクレーパーの初期開発の両方の機能、およびそのスクレーパーの継続的なメンテナンスが含まれます。 Xコンソーシアムライセンス。 「スクラップ」の重要な機能は次のとおりです。 ・CSSセレクタまたは疑似XPATH式を使用できるデータのルールベースの選択とデータの抽出 ・キャッシングシステムでは、開発中にセレクタや抽出器を試しながらWebサーバーからページを継続的にダウンロードする必要はありません。 ・抽出規則を無効にするであろうWebサイトの変更を検出するのに役立つ検証システム ・Webサーバーとのセッションを開始するためのサポート、およびセッションCookieをWebサーバーに渡すためのサポート ・他のすべてが失敗した場合は、XSLTPROC XSLTプロセッサを介してWebページを実行して、ルールベースのパーサーを介して実行できるXML文書を生成できます。 ・Normalize_nameなどの有用な後処理方法のセット このリリースの新機能: ・最初の公開リリース。


擦り傷 関連ソフトウェア

赤外線

PHPでサービス指向アーキテクチャを設定するように設計されたスクリプトのオープンソースパッケージ ...

149 301 KB

ダウンロード