发布于 2015-06-21 10:40:17 | 453 次阅读 | 评论: 0 | 来源: 网络整理
字符串类型在Python中是最流行的。可以通过在引号包围的字符简单地创建它们。Python使用单引号和双引号来表示字符串是一样的。
创建字符串很简单,只要将值分配给一个变量。例如:
var1 = 'Hello World!'
var2 = "Python Programming"
Python不支持字符类型;这些都被视为一个长度的字符串,因此也被认为是一个子串。
要访问子字符串,用方括号随着指数或索引来获得子切片。下面是一个简单的例子:
#!/usr/bin/python
var1 = 'Hello World!'
var2 = "Python Programming"
print "var1[0]: ", var1[0]
print "var2[1:5]: ", var2[1:5]
当执行上面的代码中,产生以下结果:
var1[0]: H
var2[1:5]: ytho
可以在“更新”现有的由(重新)分配一个变量赋值给另一个字符串的字符串。新的值可以与它以前的值或一个串完全不同。下面是一个简单的例子:
#!/usr/bin/python
var1 = 'Hello World!'
print "Updated String :- ", var1[:6] + 'Python'
当执行上面的代码中,产生以下结果:
Updated String :- Hello Python
下表是未转义非打印字符的列表,可以用反斜线符号来表示。
转义字符被解释;在一个单引号和双引号字符串。
反斜线
符号
|
十六进制
字符
|
描述 |
---|---|---|
a | 0x07 | 铃声或警报 |
b | 0x08 | 退格键 |
cx | Control-x | |
C-x | Control-x | |
e | 0x1b | 转义 |
f | 0x0c | 换页 |
M-C-x | Meta-Control-x | |
n | 0x0a | 新一行 |
nnn | 八进制表示法,其中n的范围为0.7 | |
r | 0x0d | 回车 |
s | 0x20 | 空格 |
t | 0x09 | Tab键 |
v | 0x0b | 垂直制表 |
x | 字符x | |
xnn | 十六进制表示法,其中n的范围是从0.9,a.f,或AF |
假设字符串变量中保存'Hello'和变量b持有'Python':
操作符 | 描述 | 例子 |
---|---|---|
+ | 串联- 对操作符的两侧值增加 | a + b 的值为 HelloPython |
* | 重复 - 创建新的字符串,链接相同的字符串的多个副本 | a*2 的值为 -HelloHello |
[] | 切片- 从给定的索引字符指定 | a[1] 的值为 e |
[ : ] | 范围切片 - 给定的范围内的字符 | a[1:4] 的值为 ell |
in | 成员 - 如果一个字符存在给定的字符串中,则返回true | H in a 结果值为 1 |
not in | 成员 - 如果输入的字符不给定的字符串中不存在,则返回true | M not in a 结果值为 1 |
r/R | 原始字符串- 禁止转义字符的实际意义。语法原始字符串是完全一样的普通字符串,除了原始的字符串运算符,字母“r”,这之前的引号。在“r”可以小写(r)或大写字母(R)的,必须立即放置在第一引号前面。 | print r'n' 打印 n 并且 print R'n' 打印 n |
% | 格式 - 执行字符串格式化 | 请参阅下一节 |
Python最酷的功能是字符串格式运算符%。这种操作是唯一的字符串,弥补了C语言的printf()系列函数功能。下面是一个简单的例子:
#!/usr/bin/python
print "My name is %s and weight is %d kg!" % ('Zara', 21)
当执行上面的代码中,产生以下结果:
My name is Zara and weight is 21 kg!
下面是完整的,它可以与%符号使用列表:
格式符号 | 转换 |
---|---|
%c | 字符 |
%s | 通过str() 字符串转换来格式化 |
%i | 有符号十进制整数 |
%d | 有符号十进制整数 |
%u | 无符号十进制整数 |
%o | 八进制整数 |
%x | 十六进制整数(小写字母) |
%X | 十六进制整数(大写字母) |
%e | 索引符号(小写'e') |
%E | 索引符号(大写“E”) |
%f | 浮点实数 |
%g | %f和%e 的简写 |
%G | %f和%E的简写 |
其他支持的符号和功能如下表:
符号 | 功能 |
---|---|
* | 参数指定宽度和精度 |
- | 左对齐 |
+ | 显示符号 |
<sp> | 一个正数前留一个空格 |
# | 添加前导零('0')或十六进制前导0x“或”0X“,取决于”x“或”X“是否使用八进制。 |
0 | 从键盘左边添加零(而不是空格) |
% | '%%'给留下一个文字'%' |
(var) | 映射变量(字典参数) |
m.n. | m是最小的总宽度和n是数字,显示小数点后的位数(如果appl) |
Python三重引号允许字符串跨越多行,包括逐字换行符,制表符和其他特殊字符。
三重引号语法由三个连续的单引号或双引号。
#!/usr/bin/python
para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print para_str;
当执行上面的代码中,产生以下结果。请注意如何每一个特殊字符被转换到打印形式,一直到最后的换行符之间的字符串“up”结束闭三重引号。还要注意的是发生或者使用显式回车在一行或它的转义代码( n)的尾部的换行:
this is a long string that is made up of
several lines and non-printable characters such as
TAB ( ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
], or just a NEWLINE within
the variable assignment will also show up.
原始字符串不把反斜杠作为一个特殊字符。把一个原始字符串的每个字符保持写的方式:
#!/usr/bin/python
print 'C:nowhere'
当执行上面的代码中,产生以下结果:
C:nowhere
现在利用原始的字符串。我们表达如下:
#!/usr/bin/python
print r'C:nowhere'
当执行上面的代码中,产生以下结果:
C:nowhere
在Python普通字符串在内部存储为8位ASCII,而Unicode字符串被作为16位Unicode存储。这使得一组字符更加多样化,包括大多数语言在世界上的特殊字符。限制处理Unicode字符串,注意以下几点:
#!/usr/bin/python
print u'Hello, world!'
当执行上面的代码,产生以下结果:
Hello, world!
正如你所看到的,Unicode字符串使用前缀 u,就像原始字符串使用前缀 r
Python的包括以下内建的方法操作字符串:
SN | 方法及描述 |
---|---|
1 | capitalize() 字符串的第一个字母大写 |
2 | center(width, fillchar) 返回一个空格填充字符串为中心,以总宽度列的原始字符串 |
3 | count(str, beg= 0,end=len(string)) 开始索引beg和结束索引结束str多少次出现在字符串或字符串的子串 |
4 | decode(encoding='UTF-8',errors='strict') 使用注册编码的编解码器的字符串进行解码。编码默认为默认的字符串编码。 |
5 | encode(encoding='UTF-8',errors='strict') 返回编码字符串的字符串版本;对错误,默认是引发ValueError除非错误被赋予了“ignore”或“replace”。 |
6 | endswith(suffix, beg=0, end=len(string)) 判断字符串或字符串的一个子串(如果起始索引beg和给出end结束索引)与后缀结尾;如果是则返回true,否则为false, |
7 | expandtabs(tabsize=8) 扩展选项卡中的字符串多个空格;如果未提供tab大小默认为每片8位 |
8 | find(str, beg=0 end=len(string)) 确定str开始索引beg和end索引并返回索引,如果找到出现在字符串或字符串的子串,否则返回-1 |
9 | index(str, beg=0, end=len(string)) 与find()一样,但会引发一个异常如果str没找到 |
10 | isalnum() 如果string至少有1个字符,所有字符为字母数字则返回true,否则为false |
11 | isalpha() 如果string至少有1个字符,所有字符都是字母,否则为false,则返回true |
12 | isdigit() 如果字符串只包含数字则返回true,否则为false |
13 | islower() 如果字符串至少有1个字符,所有字符是小写则返回true,否则为false |
14 | isnumeric() 如果一个Unicode字符串只包含数字字符则返回true,否则为false。 |
15 | isspace() 如果字符串只包含空格字符则返回true,否则返回false, |
16 | istitle() 返回true如果字符串是正确的“首字母大写”,否则为false |
17 | isupper() 返回true如果字符串至少有一个小写字符,所有字符符为大写字母,否则返回false。 |
18 | join(seq) 合并(会连接)序列seq元素连接成一个字符串的字符串表示形式,用分隔符的字符串 |
19 | len(string) 返回字符串的长度 |
20 | ljust(width[, fillchar]) 返回一个空格填充字符串,原始字符串左对齐,以总宽列 |
21 | lower() 将所有大写字母的字符串转化为小写 |
22 | lstrip() 删除字符串中的所有前导空格 |
23 | maketrans() 返回要用于转换功能的转换表 |
24 | max(str) 从字符串str返回的最大字母字符 |
25 | min(str) 从字符串str返回最小字母字符 |
26 | replace(old, new [, max]) 取代了旧的所有出现在字符串使用新的或max,如果给定max |
27 | rfind(str, beg=0,end=len(string)) 与find()一样,但反向搜索字符串 |
28 | rindex( str, beg=0, end=len(string)) 与index()一样,但反向搜索字符串 |
29 | rjust(width,[, fillchar]) 返回一个空格填充字符串右对齐,以原始字符串总宽度列。 |
30 | rstrip() 删除字符串的所有行尾空白 |
31 | split(str="", num=string.count(str)) 根据分隔符str (如果没有提供空间)和子字符串返回分割字符串列表;分成最多num子字符串。 |
32 | splitlines( num=string.count('n')) Splits string at all (or num) NEWLINEs and returns a list of each line with NEWLINEs removed |
33 | startswith(str, beg=0,end=len(string)) 判断字符串或字符串的一个子串(如果起始索引beg和end索引)开始字符串str;如果是则返回true,否则为false |
34 | strip([chars]) 在字符串执行两种lstrip()和rstrip() |
35 | swapcase() 反转大小写,在字符串中的所有字母 |
36 | title() 返回“标题大字”版本字符串,也就是所有的字以大写,其余为小写 |
37 | translate(table, deletechars="") 根据转换表str(256字)转换字符串,删除那些del字符串 |
38 | upper() 字符串小写转换为大写字母 |
39 | zfill (width) 返回leftpadded零合共宽字符原字符串;用于数字zfill()保留给予任何迹象(减去一个零) |
40 | isdecimal() 如果一个Unicode字符串只包含十进制字符则返回true,否则返回false |