PyQuery是一个Python实现的XML/HTML解析类库, 可以让你使用 jQuery 的风格来遍历 XML 文档,它使用了 lxml 来处理 XML 乃至 HTML 文档。
你可以直接从字符串、URL或者文件中加载文档:
>>> from pyquery import PyQuery as pq >>> from lxml import etree >>> import urllib >>> d = pq("<html></html>") >>> d = pq(etree.fromstring("<html></html>")) >>> d = pq(url='HTTP://Google.com/') >>> # d = pq(url='http://Google.com/', opener=lambda url: urllib.urlopen(url).read()) >>> d = pq(filename=path_to_html_file)
然后使用 $ 进行遍历:
>>> d("#hello") [<p#hello.hello>] >>> p = d("#hello") >>> print(p.html()) Hello world ! >>> p.html("you know <a href='http://python.org/'>Python</a> rocks") [<p#hello.hello>] >>> print(p.html()) you know <a href="http://python.org/">Python</a> rocks >>> print(p.text()) you know Python rocks
发布于 2016-10-31 15:35:53 | 172 次阅读
发布于 2016-10-31 15:34:55 | 347 次阅读
发布于 2014-10-05 13:16:35 | 247 次阅读
发布于 2014-10-20 23:58:49 | 281 次阅读