PyQuery是一个Python实现的XML/HTML解析类库, 可以让你使用 jQuery 的风格来遍历 XML 文档,它使用了 lxml 来处理 XML 乃至 HTML 文档。

你可以直接从字符串、URL或者文件中加载文档:

>>> from pyquery import PyQuery as pq
>>> from lxml import etree
>>> import urllib
>>> d = pq("<html></html>")
>>> d = pq(etree.fromstring("<html></html>"))
>>> d = pq(url='HTTP://Google.com/')
>>> # d = pq(url='http://Google.com/', opener=lambda url: urllib.urlopen(url).read())
>>> d = pq(filename=path_to_html_file)

然后使用 $ 进行遍历:

>>> d("#hello")
[<p#hello.hello>]
>>> p = d("#hello")
>>> print(p.html())
Hello world !
>>> p.html("you know <a href='http://python.org/'>Python</a> rocks")
[<p#hello.hello>]
>>> print(p.html())
you know <a href="http://python.org/">Python</a> rocks
>>> print(p.text())
you know Python rocks
Python中PyQuery库的使用总结
pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,我个人写过的一些抓取网页数据的脚本就是用它来解析html获取数据的。他的官方文档地址是:http://packages.python.org/pyquery/。今天重新看了一遍整个文档,把它的一些使用方法整理了一下,做个记录。

发布于 2016-10-31 15:35:53 | 172 次阅读

pyquery使用示例
最近由于公司业务上的需求,要网络采集一些数据,并格式化以供应用的调取,前期想到用正则表达式来对网页格式串进行过滤和抓取,在进行了一系列尝试之后放弃, 原因是太繁琐了,而且对于每种网页都需要写特定的表达式,不可通用。

发布于 2016-10-31 15:34:55 | 347 次阅读

python使用pyquery解析html示例
本文为大家讲解了python下使用pyquery解析html文件的示例,感兴趣的同学参考下.

发布于 2014-10-05 13:16:35 | 247 次阅读

Python中的jquery:PyQuery库使用示例
本文为大家讲解的是Python中的jquery: PyQuery库使用小结,需要的朋友可以参考下

发布于 2014-10-20 23:58:49 | 281 次阅读

windows下pyquery安装及入门教程
本文为大家讲解的是windows下pyquery安装及入门教程感兴趣的同学参考下。

发布于 2014-12-23 08:32:28 | 865 次阅读


Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务