HTMLCleaner. ランキングとまとめ
HTMLCleaner. タグ
HTMLCleaner. 説明
無料でオープンソースのHTMLパーサー HTMLCleanerは、Javaで書かれた無料のオープンソースのオープンソースのHTMLパーサーです。 Web上で見つかったHTMLは通常汚れていて、さらなる処理には不適切です。そのような文書の重大な消費のためには、最初に混乱を整理してタグ、属性、通常のテキストに注文する必要があります。与えられたHTML文書の場合、HTMLCleanerは個々の要素を並べ替えて、よく形成されたXMLを生成します。デフォルトでは、HTMLCleanerはDocument Objectモデルを作成するためにほとんどのWebブラウザが使用する類似の規則に従います。ただし、ユーザーはタグフィルタリングとバランスを取得するためのカスタムタグとルールセットを提供することがあります。要件: ・Java 1.6以降 このリリースの新機能: ・クリーンアッププロセス中に指定されたタグや属性を簡単にスキップまたは変更するために、解析変換が開発されています。 ・Class HtmlCleanerに追加されたコンストラクタは、複数のクリーナーインスタンスで同じクリーナープロパティを再利用する可能性を与えます。 ・コードクリーンアップ。
HTMLCleaner. 関連ソフトウェア