| HTMLパーサー HTML Parserは、LINEARまたはNESTED FAISIONでHTMLを解析するために使用されるJavaライブラリです。 |
今すぐダウンロード |
HTMLパーサー ランキングとまとめ
- 出版社のWebサイト:
- http://htmlparser.org
HTMLパーサー タグ
HTMLパーサー 説明
HTMLパーサーは、線形または入れ子になった方法でHTMLを解析するために使用されるJavaライブラリです。 HTMLParserは、実際のHTMLのための超高速リアルタイムパーサーです。ほとんどの開発者をHTMLParserに引き付けたのは、ストリーミング実世界のHTMLを処理するデザイン、スピード、および能力がシンプルさでした。パーサーによって処理される2つの基本的なユースケースが抽出と変換(HTMLの使用のためのものです。ページはスクラッチから作成され、データのソースに近い他のツールによって処理されます)。以前のバージョンがWebページからのデータ抽出に集中している間、HTMLParserのバージョン1.4は、Webページを変換する領域が簡単になり、簡素化されたタグ作成と編集、および逐語的TOHTML()Method Output.IN HTMLParserを使用する必要があります。 Javaプログラミング言語でコードを書くことができるようにすること。スタンドとして有用である可能性があるプログラムのいくつかの例示的なプログラムが提供されていますが、あなた自身のプログラムを作成するか、あなたの意図したアプリケーションに一致するように提供されたものを修正すること(または望んでいる)を必要とする可能性が高いです。コンパイルと実行中に、htmllexer.jarまたはhtmlparser.jarをクラスパスに追加します。 htmllexer.jarは、線形文字列、備考、およびタグノードへの低レベルのアクセスを線形、フラット、順次式で提供します。 htmllexer.jarにあるクラスを含むhtmlparser.jarは、文字列、remother、およびその他のタグノードを含むネストされた微分タグのシーケンスとしてページへのアクセスを提供します。そのため、Lexer NextNode()メソッドへの呼び出しからの出力が次の場合には次のとおりです。
"welcome" など...パーサーNoditeratorからの出力タグをその子として、その他のノード(ここではインデントで表されます)にネストします。
"welcome" comper>のバランスを試みますページの構造を提示するために終了タグを持つタグを開くと、レクサーは単にノードを吐き出します。あなたのアプリケーションがページの控えめな構造的知識のみを必要とし、主に個人の孤立したノードに関心があるならば、あなたは軽量のレキシャーを使うことを検討するべきです。ただし、アプリケーションのネストされた構造に関する知識が必要な場合は、たとえば処理表など、おそらくFull Parser.extrActionExtractionを使用することをお勧めします。ソースページを保存することを意図していないすべての情報検索プログラムを含めます。このカバーは次のように使用します。あるいはブラウザのフロントエンド、ページ表示の予備段階・リンクチェック、リンクチェック、リンクの確保・サイト監視、Simplistic DiffSthereを超えたページの違いの確認は、フィルタ、訪問者などの抽出に役立つHTMLParser CodeBaseのいくつかの施設です。 JavaBeans.StransformationStransformationは、入力と出力がHTMLページであるすべての処理を含みます。いくつかの例は以下のとおりです。広告を参照するURL・XMLへの変換、既存のWebページへの変換、ページ内での読み込み後、ノードの操作は「in plind」を実行することができます。これはTOHTML()メソッドで出力できます。アプリケーションの目的に応じて、PrototyPicalNodefactoryと組み合わせてノードのデコレータ、訪問者、またはカスタムタグを調べたいと思うでしょう.HTMLパーサーは、基本的にあなたがいると言うGNU reserger一般公衆ライセンスの下でリリースされたオープンソースライブラリです。ライブラリ「AS IS」を他の(独自の)製品の中で無料で使用することは、著者にデュークレジットが与えられ、HTMLParserのソースコードが他の製品で含まれているか利用可能である限り。変更または埋め込み使用の場合は、LGPLライセンスを参照してください。
HTMLパーサー 関連ソフトウェア