关于 python 分片赋值

最近在看 http://book.douban.com/subject/486693...这本书。看到第二章分片赋值的时候不是很理解,google之后,也没得到想要的答案,

故想问,python 分片赋值 想求个详细的讲解,愿前辈帮个小忙。

阅读 11.5k
2 个回答

首先你要理解什么是分片,也有的书叫切片(slice)。当你需要一个序列的子串的时候,你就可以使用切片操作

a = ['a','b','c','d','e','f','g']

在a这个序列中,如果你想截取里面['c','d','e']这个子序列,那么你就可以使用切片a[2:5]
它的语法形式是a[start:end],这里有一个区间边沿取值的问题。首先你要明确序列的索引是从0开始的,a[2:5]取值的范围是[2,5),前面是闭区间,后面是开区间,也就是2<=索引值<5这段区间里的元素。所以如果这样来切的话:a[1:1],得到的就是[],空序列。试问在序列a中,哪里有元素的索引是既>=1又<1的呢?

上面切片出来出来(a[2:5])的值是['c','d','e']。但是它返回的并不是一个值,而是一个引用,换句话说,a[2:5]之后所得到的子序列,如果你对它进行修改
那么它的修改就会反馈到原来的序列当中,你可以尝试一下:

a[2:5] = ['x','y','z']
print a
a = ['a','b','x','y','z','f','g']

你对切片进行赋值已经反映到源序列当中。但是,如果我不赋值三个元素,我赋值两个,或者四个,那会发生什么情况呢?
看看下面的代码:

>>> a = ['a','b','c','d','e','f','g']
>>> a[2:5] = ['1','2']
>>> print a
['a', 'b', '1', '2', 'f', 'g']
>>> a = ['a','b','c','d','e','f','g']
>>> a[2:5] = ['1','2','3','4']
>>> print a
['a', 'b', '1', '2', '3', '4', 'f', 'g']

答案显而易见,就算你赋值元素个数和原来切片出来元素的个数不一样,它所反映到源序列的都是['c','d','e']这个子序列被改变。
也就是:a[2:5] = ['1','2']之后得到的不是想当然的['a', 'b', '1', '2', 'e','f', 'g']而是,['a','b','1','2','f','g']
如果你把一个空序列赋值给切片对象a[2:5] = [],那么反映到序列中的就是2<=索引<5的元素被删除了。和上面一样,再来看看代码,算是作为结束:

>>> a = ['a','b','c','d','e','f','g']
>>> a[2:5] = []
>>> print a
>>> ['a','b','f','g']
>>> print len(a)
4
>>> a = ['a','b','c','d','e','f','g']
>>> print len(a)
7
>>> a[2:5] = ['1','2','3','4','5','6','7']
>>> print a
['a', 'b', '1', '2', '3', '4', '5', '6', '7', 'f', 'g']
>>> print len(a)
11

我还想说说几种切片的方法,因为它们实在太有趣了。

上面我们用到的索引一直都是正值,但是在python中,序列的索引值可以是负值。从最后一个元素索引开始计算,分别是-1,-2,-3,.....

我想换个字符串来测试,不要再abcd,1234的了。就用segmentfault.com吧!

>>> a = list('segmentfault.com')
>>> print a
['s', 'e', 'g', 'm', 'e', 'n', 't', 'f', 'a', 'u', 'l', 't', '.', 'c', 'o', 'm'] #最后一个'm'的索引是-1,然后依次向前递减
>>> print a[-16:-4]
['s', 'e', 'g', 'm', 'e', 'n', 't', 'f', 'a', 'u', 'l', 't']

要注意区间的选取。-16<=索引值<-4

除此之外,我还可以在'segmentfault'中每隔两个字符地将截取到的字符组成序列。试试:

>>>print a[-16:-4:3]
>>>['s', 'm', 't', 'u'] #隔了两个字符

在这里的3被称作步进值,步进切片的语法形式就是:seq[start:end:step],在start<=索引值<end中,隔step-1个字符来截取元素。(step >= 1)。

而且,这个步进值同样可以是负数,对应的形式就是seq[end:start:step],在start<=索引值<end中,隔|step|-1个字符来截取元素。我是这样来理解步进值的,它是规定了切片操作的方向,正值代表的是正方向(从左向右)切片,负值代表的是反方向切片。
所以a[-4:-16:-3]的意思就是:反方向从-16<=索引值<-4的元素中,隔两个元素来截取。
所以当你想要把这个序列反转的时候,你就可以从反方向截取所有元素a[::-1]

通过这几种方法切片出来的对象,你都可以进行赋值,具体的你就自己尝试一下吧!

其实还有一种切片方式,叫缩略切片,因为我对它不是很了解,所以不打算写了。如果你有兴趣可以google一下。

总结一下:

  1. 当step为正值的时候,seq[start:end:step]表示的是在seq中,每隔step-1个字符,截取start<=索引值<end中的元素
  2. 当step为负值的时候,seq[end:start:step]表示的是在seq中,每隔|step|-1个字符,截取start<=索引值<end中的元素

注意是从哪边开始!

这样看还是挺混乱的,关键还是多练!

Ps:时间很紧,下午还要考试,可能会有错误。所以还是以官方文档和书本的为准吧。我的python版本是2.7.3。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
logo
101 新手上路
子站问答
访问
宣传栏