jsoup 是一款 JavaHTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

jsoup的主要功能如下:

  1. 从一个URL,文件或字符串中解析HTML;

  2. 使用DOM或CSS选择器来查找、取出数据;

  3. 可操作HTML元素、属性、文本;

jsoup是基于MIT协议发布的,可放心使用于商业项目。

示例代码:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "HTTP://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

 

jsoup 1.11.2 发布,Java 的 HTML 解析器
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。jsoup的主要功能如下:从一个URL,文件或字符串中解析HTML;使用DOM或CSS选择器来查找、取出数据;可操作HTML元素、属性、文本;jsoup是基于MIT协议发布的

发布于 2017-11-20 07:17:55 | 166 次阅读

jsoup 1.10.3 发布,Java 的 HTML 解析器
jsoup 1.10.3 发布了,该版本带来了更好的 CSS 选择器性能,Jsoup.Connection 改进和其他 bug 修复。详情包括:ImprovementsAdded Elements.eachText() and Elements.eachAttr(), which return a list of an Element's text or attribute values, respectively. This makes it simpler to for

发布于 2017-06-12 04:57:13 | 185 次阅读

jsoup 1.10.2 发布,Java 的 HTML 解析器
jsoup 1.10.2 发布了,该版本带来了更快的启动时间,扩展 DOM 树的遍历,提升了 HTTP 兼容性以及修复了一些 bug。详情包括:ImprovementsImproved startup time, particularly on Android, by reducing garbage generation and CPU execution time when loading the HTML entity files. About 1.72x faster in this area.Ad

发布于 2017-01-05 02:18:43 | 171 次阅读

Jsoup 1.10.1 发布,Java 的 HTML 解析器
Jsoup 1.10.1 发布了,Jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。更新内容如下:改进Improved support for extended HTML entities, including supplemental characters and multiple character refe

发布于 2016-10-24 02:17:33 | 156 次阅读

jsoup 1.9.2 发布,Java 的 HTML 解析器
jsoup 1.9.2 发布,改进内容包括:改进:1. In XML documents, detect the charset from the XML prolog -- Bug 修复1. Fixed an issue where tag names that contained non-ascii characters but started with an ascii character would cause the parser to get stuck in an inf

发布于 2016-05-18 03:47:37 | 195 次阅读

jsoup 1.9.1 发布,HTML 解析器
jsoup 1.9.1 发布。更新日志:改进:Added support for HTTP and SOCKS request proxies, specifiable per connection. See Connection.proxy(String, int).Added support for sending plain HTTP request bodies in POST and PUT requests, with Connection.requestBody(String).Added support in Jsoup.Connect() for HEA

发布于 2016-04-18 03:17:17 | 147 次阅读


Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务