4内置数据结构_元组_字符串

创新互联建站是一家专注于成都做网站、成都网站设计、成都外贸网站建设与策划设计,廉江网站建设哪家好?创新互联建站做网站,专注于网站建设十载,网设计领域的专业建站公司;建站业务涵盖:廉江等地区。廉江做网站价格咨询:18980820575

tuple元组：...1

字符串：...3

字符串定义、初始化：...3

字符串元素访问：...3

字符串连接：...4

字符串分割：...5

字符串大小写：...7

字符串排版：...7

字符串修改：...8

字符串查找：...8

字符串判断：...9

is系列：...10

字符串格式化：...10

内置数据结构

tuple元组：

一个有序的元素组成的集合；

使用()小括号表示；

元组是不可变对象；

tuple定义初始化：

tuple()-->empty tuple；

tuple(iterable)-->tuple initialized from iterables items；

例：

In [1]: t=tuple() #工厂方法

In [2]: t=()

In [3]: t=tuple(range(1,7,2))

In [4]: t=(2,4,6,8)

In [17]: t=(1,) #1个tuple元素的定义，若用t=(1)，该()为优先级

In [18]: t

Out[18]: (1,)

In [19]: type(t)

Out[19]: tuple

In [20]: t=(1)

In [21]: type(t)

Out[21]: int

In [23]: t=(1,)*5

In [24]: t

Out[24]: (1, 1, 1, 1, 1)

In [25]: t=(1,2,3)*6

In [26]: t

Out[26]: (1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3)

tuple元素访问：

通过index访问tuple，tuple[index]；

正索引，从左至右，从0开始，为列表中的每一个元素编号；

负索引，从右至左，从-1开始；

正负索引不可以超界，否则引发异常IndexError；

tuple查询：

index(value,[start,[step]])，通过value，从指定区间内查找tuple内的元素是否匹配；匹配第一个就立即返回索引号；匹配不到，抛异常ValueError；

count(value)，返回tuple中匹配value的次数；

时间复杂度：

index()和count()都是O(n)，随着tuple数据规模的增大而效率下降；

len(tuple)，返回元素的个数，在外面计数的属性，O(1)；

tuple其它操作：

tuple只读，所以增改删方法都没有；

namedtuple命名元组：

帮助文档中，查阅namedtuple，有使用例程；

namedtuple(typename,field_names,verbose=False,rename=False)

命名元组，返回一个元组的子类，并定义了字段；

field_names可以是空格或逗号分割的字段的字符串，或字段的列表；

面向对象中的坐标用到namedtuple；

例：

In [5]: from collections import namedtuple

In [6]: Point=namedtuple('Point',['x','y'])

In [7]: type(Point)

Out[7]: type

In [8]: p=Point(11,22)

In [9]: p

Out[9]: Point(x=11, y=22)

In [10]: p.x

Out[10]: 11

In [11]: p.y

Out[11]: 22

In [12]: Student=namedtuple('Student','name age')

In [13]: tom=Student('tom',20)

In [14]: jerry=Student('jerry',18)

In [15]: tom.name

Out[15]: 'tom'

In [16]: jerry.age

Out[16]: 18

字符串：

一个个字符组成的有序的序列，是字符的集合；

使用单引号、双引号、三引号引住的字符序列；

是不可变对象；

python3起，字符串就是unicode类型（utf-8），在网络上传输时平均码率很高效；

例：

In [1]: a='ab'

In [2]: id(a)

Out[2]: 139712705444752

In [3]: a='ab'+'c'

In [4]: id(a)

Out[4]: 139712709234168

字符串定义、初始化：

In [5]: s1='strting'

In [6]: s2='string2'

In [7]: s3='''this's a "string"'''

In [8]: s4='hello \nmagedu.com'

In [9]: s5=r'hello\nmagedu.com' #r用于不转义引号中的转义符，常用于路径；

In [10]: s6='c:\windows\nt'

In [11]: s7=R'c:\windows\nt'

In [12]: s8='c:\windows\\nt'

In [13]: sql="""select * from user where name='tom'"""

In [14]: s5

Out[14]: 'hello\\nmagedu.com'

In [16]: print(s4)

hello

magedu.com

In [17]: print(s5)

hello\nmagedu.com

字符串元素访问：

字符串支持使用索引访问；

有序的字符集合，字符序列；

可迭代；

例：

In [18]: sql[4]

Out[18]: 'c'

In [19]: sql[4]='o' #不可以，只读类型

---------------------------------------------------------------------------

TypeError Traceback (most recent call last)

in ()

----> 1 sql[4]='o'

TypeError: 'str' object does not support item assignment

In [21]: for c in sql:

...: print(c)

...:

……

In [24]: type(c)

Out[24]: str

In [25]: lst=list(sql)

In [26]: type(lst)

Out[26]: list

In [27]: lst=tuple(sql)

In [28]: type(lst)

Out[28]: tuple

字符串连接：

"string".join(iterable)-->str，将可迭代对象连接起来，使用string作为分隔符；可迭代对象本身元素都是字符串；返回一个新字符串；

+-->str，+连接，将两个字符串连接在一起；

*，序列都可用*；

例：

In [29]: lst=['1','2','3']

In [30]: print('\"'.join(lst))

1"2"3

In [31]: print(' '.join(lst))

1 2 3

In [32]: print('\n'.join(lst))

In [35]: lst=['1',['2','3'],'4']

In [36]: ' '.join(lst) #不可以是复杂结构

---------------------------------------------------------------------------

TypeError Traceback (most recent call last)

in ()

----> 1 ' '.join(lst)

TypeError: sequence item 1: expected str instance, list found

In [37]: a='abc'

In [38]: b=a*3

In [39]: b

Out[39]: 'abcabcabc'

字符串分割：

分两类，split系和partition系；

区别如下：

In [1]: 'name:str'.split(':') #split返回除分隔符外，两边有的字符，若右边没有则不会为空字串，而是仅左边单个元素

Out[1]: ['name', 'str']

In [2]: 'name:'.split(':')

Out[2]: ['name', '']

In [3]: 'name'.split(':') # 项目中这样用会报错，只返回id，取不到type，s2 = '/student/{name:}/xxx/{id}'，name, type = kv.strip('/{}').split(':')

Out[3]: ['name']

In [4]: 'name:str'.partition(':') #partition始终返回三个元素，就算分隔符没有也返回空字串

Out[4]: ('name', ':', 'str')

In [5]: 'name:'.partition(':')

Out[5]: ('name', ':', '')

In [6]: 'name'.partition(':')

Out[6]: ('name', '', '')

split系，将字符串按照分隔符分割成若干字符串，并返回列表；

split(sep=None,maxsplit=-1)-->list of strings，sep指定分割字符串，默认以空白字符作为分隔符；maxsplit指定分割的次数，-1表示遍历整个字符串；

rsplit(sep=None,maxsplit=-1)-->list of strings，reverse split，从右向左（找的顺序是从右向左，输出的顺序不变）；

splitlines([keepends])-->list of strings，按照行来切分字符串；keepends指是否保留行分隔符；行分隔符包括\n,\r'n,\r等；

inputlist = input('>>> ').split(',')

print(inputlist)

例：

In [40]: s1="I'm\ta super sutdent."

In [41]: s1.split()

Out[41]: ["I'm", 'a', 'super', 'sutdent.']

In [42]: s1.split('s')

Out[42]: ["I'm\ta ", 'uper ', 'utdent.']

In [43]: s1.split('super')

Out[43]: ["I'm\ta ", ' sutdent.']

In [44]: s1.split(' ')

Out[44]: ["I'm\ta", 'super', 'sutdent.']

In [45]: s1.split('\t',2)

Out[45]: ["I'm", 'a super sutdent.']

In [46]: s1.rsplit('super',1)

Out[46]: ["I'm\ta ", ' sutdent.']

In [47]: str1='ab c\n\n de fg\rhijk\rl\n'

In [48]: str1.splitlines()

Out[48]: ['ab c', '', ' de fg', 'hijk', 'l']

In [49]: str1.splitlines(True)

Out[49]: ['ab c\n', '\n', ' de fg\r', 'hijk\r', 'l\n']

In [50]: s1='''I'm a super student.

...: You're a super teacher.'''

In [51]: s1.splitlines()

Out[51]: ["I'm a super student.", "You're a super teacher."]

In [52]: s1.splitlines(True)

Out[52]: ["I'm a super student.\n", "You're a super teacher."]

partition系，将字符串按分隔符分割成2段，返回这两段和分隔符的元组；

partition(sep)-->(head,sep,tail)

rpartition(sep)，reverse partition，从右至左，适用于切路径取文件名；

例：

In [55]: s1="I'm a super student"

In [56]: s1.partition('s')

Out[56]: ("I'm a ", 's', 'uper student')

In [56]: s1.partition('s')

Out[56]: ("I'm a ", 's', 'uper student')

In [57]: s1.partition('stu')

Out[57]: ("I'm a super ", 'stu', 'dent')

In [59]: s1.partition(' ')

Out[59]: ("I'm", ' ', 'a super student')

In [60]: s1.partition('abc') #找不到分隔符时，sep和tail为空

Out[60]: ("I'm a super student", '', '')

In [63]: s1=r'c:\windows\nt'

In [64]: s1.rpartition('\\')

Out[64]: ('c:\\windows', '\\', 'nt')

字符串大小写：

upper()，全大写；

lower()，全小写，大小写，作判断的时候用；

swapcase()，交互大小写，小-->大，大-->小；

例：

In [70]: s1='Test'

In [71]: s1.upper()

Out[71]: 'TEST'

In [72]: s1.lower()

Out[72]: 'test'

In [73]: s1.swapcase()

Out[73]: 'tEST'

字符串排版：

title()-->str，标题的每个单词都大写；

capitalize()-->str，首个单词大写；

center(width[,fillchar])-->str，width打印宽度，fillchar填充的字符；

zfill(width)-->str，zero fill，width打印宽度，居右，左边用0填充；

ljust(width[,fillchar])-->str，左对齐；

rjust(width[,fillchar])-->str，右对齐；

例：

In [74]: s1='abc'

In [75]: s1.center(50)

Out[75]: ' abc '

In [76]: s1.center(50,'#')

Out[76]: '#######################abc########################'

In [77]: s1.zfill(50)

Out[77]: '00000000000000000000000000000000000000000000000abc'

In [78]: s1.ljust(50,'#')

Out[78]: 'abc###############################################'

In [79]: s1.ljust(50,'#')

Out[79]: 'abc###############################################'

字符串修改：

replace(old,new[,count])-->str，字符串中找到旧字串替换为新字串，最终返回新字符串，count表示替换几次，不指定即全部替换；

例：

In [80]: s1='www.magedu.com'

In [81]: s1.replace('www','ftp')

Out[81]: 'ftp.magedu.com'

In [82]: s1.replace('w','p',2)

Out[82]: 'ppw.magedu.com'

In [83]: s1.replace('ww','p',1)

Out[83]: 'pw.magedu.com'

In [84]: s1.replace('www','python',1)

Out[84]: 'python.magedu.com'

strip([chars])-->str，从字符串两端去除指定的字符集chars中的所有字符；如果chars不指定，去除两端的空白字符；

lstrip([chars])-->str，从左开始；

rstrip([chars])-->str，从右开始；

例：

In [85]: s1="I am very very sorry"

In [86]: s1.strip('r y') #3个字符

Out[86]: 'I am very very so'

字符串查找：

find(sub[,start[,end]])-->int，在指定的区间[start,end)，从左至右，查找子串sub，找到返回索引，没找到返回-1；

rfind(sub[,start[end]])-->int，reverse find，在指定的区间[start,end)，从右至左，查找子串sub，找到返回索引，没找到返回-1；

查找时最好用find，若用index，异常未捕获到时程序全崩，而且异常未必能测试出来；

例：

In [87]: s1="I am very very sorry"

In [88]: s1.find('very')

Out[88]: 5

In [92]: s1.find('very',6,13)

Out[92]: -1

In [93]: s1.rfind('very',10)

Out[93]: 10

In [94]: s1.rfind('very',10,15)

Out[94]: 10

In [95]: s1.rfind('very',-10,-1)

Out[95]: 10

index(sub[,start[,end]])-->int，在指定的区间[start,end)，从左至右，查找子串sub，找到返回索引，没找到抛异常ValueError；

rindex(sub[,start],end]])-->int，从右至左；

count(sub[,start],end]])-->int，在指定的区间[start,end)，从左至右，统计子串sub出现的次数；若查找某段文本中某个单词的个数，用dict；

注：

index()和count()方法都是O(n)，随着序列数据规模的增大而效率下降；

len(string)，返回字符串长度，即字符的个数，O(1)；

字符串判断：

endswith(suffix[,start[,end]])-->bool，在指定的区间[start,end)，字符串是否是suffix结尾；

startswith([prefix[,start[,end]])-->bool，prefix开头；

例：

In [96]: s1.startswith('very')

Out[96]: False

In [97]: s1.startswith('very',5,9)

Out[97]: True

In [99]: s1.endswith('very',5,9)

Out[99]: True

In [99]: s1.endswith('very',5,9)

Out[99]: True

In [100]: s1.endswith('very',5)

Out[100]: False

In [101]: s1.endswith('very',5,-1)

Out[101]: False

In [102]: s1.endswith('very',5,100)

Out[102]: False

In [104]: for x in s1:

...: print(str(i)+x,end=' ')

...: i+=1

...:

0I 1 2a 3m 4 5v 6e 7r 8y 9 10v 11e 12r 13y 14 15s 16o 17r 18r 19y

is系列：

isalnum()-->bool，是否是字母和数字组成；

isalpha()，是否是字母；

isdecimal()，是否只包含十进制数字；

isdigit()，是否全部是数字0-9；

isidentifier()，是否字母和下划线开头，其它都是字母、数字、下划线，应用场景（昵称是否与python的标识符一致）；

islower()，是否都是小写；

isupper()，是否全部大写；

isspace()，是否只包含空白字符；

字符串格式化：

字符串的格式化是一种拼接，字符串输出样式的手段，更灵活方便；

join拼接只能使用分隔符，且要求被拼接的是iterable对象；

+拼接字符串运算方便，但非字符串需要先转换为字符串才能拼接；

2.5版本之前，只能使用printf-style风格的print输出，printf-style formatting来自于C语言的printf函数，格式要求：

占位符，使用%和格式字符组成，如%s、%d等，s调用str()，r调用repr()，所有对象都可被这两个转换；

占位符中还可插入修饰字符，如%03d表示打印3个位置，不够前面补0；

format % values，格式字符串和被格式的值之间用%分隔；

values只能是一个对象，或是一个和格式字符串占位符数目相等的元组，或一个字典；

%%，表示打印%；

例：

In [1]: 'I am %03d' % (20,)

Out[1]: 'I am 020'

In [2]: 'I like %s' % 'python'

Out[2]: 'I like python'

In [6]: 'I am %s%%' % 20

Out[6]: 'I am 20%'

In [8]: '%3.2f%%, 0x%x,0x%02X' % (89.7654,10,15)

Out[8]: '89.77%, 0xa,0x0F'

In [9]: 'I am %-5d' % (20,) #左对齐，默认右对齐

Out[9]: 'I am 20 '

format()函数格式字符串语法（python鼓励使用此种）：

'{} {xxx}'.format(*args,**kwargs)-->str

args是位置参数，是一个元组或列表；

kwargs是关键字参数，是一个字典；

花括号表示占位符；

{}表示按顺序匹配位置参数，{n}表示取位置参数索引为n的值；

{xxx}表示在关键字参数中搜索名称一致的；

{{}}表示打印花括号；

{:>{}}，表示右对齐；

{:<{}}，表示左对齐；

'{:.{}}'.format('xylophone', 7) #'xylopho'

print('{:.2f}'.format(2)) #保留2位小数

例：

print('{:>{}}'.format(' '.join([str(j) for j in range(i,0,-1)]),width))

例：

In [10]: '{}:{}'.format('192.168.1.100',8888) #按位置顺序用位置参数，替换到前面的格式字符串的占位符中

Out[10]: '192.168.1.100:8888'

In [12]: '{server} {1}:{0}'.format(8888,'192.168.1.100',server='web server info:') #关键字参数或命名参数，位置参数按序号匹配，关键字参数按名词匹配；

Out[12]: 'web server info: 192.168.1.100:8888'

In [13]: '{0[0]}.{0[1]}'.format(('magedu','com')) #访问元素

Out[13]: 'magedu.com'

In [15]: '{}'.format(('magedu','com'))

Out[15]: "('magedu', 'com')"

In [16]: '{}.{}'.format('magedu','com')

Out[16]: 'magedu.com'

In [17]: t=('magedu','com')

In [19]: '{}.{}'.format(t[0],t[1]) #访问元素

Out[19]: 'magedu.com'

例：

In [20]: from collections import namedtuple

In [21]: Point=namedtuple('Point','x y')

In [22]: p=Point(4,5)

In [23]: '{{{0.x},{0.y}}}'.format(p) #对象属性访问

Out[23]: '{4,5}'

In [24]: '{0}*{1}={2:<2}'.format(3,2,3*2) #对齐

Out[24]: '3*2=6 '

In [25]: '{}*{}={:<2}'.format(3,2,3*2)

Out[25]: '3*2=6 '

In [26]: '{:^30}'.format('centered') #^表示居中

Out[26]: ' centered '

In [27]: '{:*^30}'.format('centered') #^前的字符为填充字符

Out[27]: '***********centered***********'

In [29]: 'int:{0:d};hex:{0:x};oct:{0:o};bin:{0:b}'.format(42) #进制

Out[29]: 'int:42;hex:2a;oct:52;bin:101010'

In [30]: 'int:{0:d};hex:{0:#x};oct:{0:#o};bin:{0:#b}'.format(42)

Out[30]: 'int:42;hex:0x2a;oct:0o52;bin:0b101010'

In [31]: ip=[192,168,0,1]

In [32]: '{:02x}{:02x}{:02x}{:02x}'.format(*ip) #点分四段十进制表示ipv4法，*ip参数解构

Out[32]: 'c0a80001'

In [33]: '{:02X}{:02X}{:02X}{:02X}'.format(*ip)

Out[33]: 'C0A80001'

网页题目：4内置数据结构_元组_字符串
网址分享：http://myzitong.com/article/jpppde.html