Python实战教程|基础数据类型之集合

    /    2018-07-05

  set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key,所以说集合是天然去重的也不为过,我们现在就来定义一个集合吧,来看看他和字典的区别。

  一. 定义集合

s = {1,2,3,4}
# 这是集合
d = {'user':'guo','age':18}
# 这是字典


  我们可以通过已有的数据类型转换成集合,例如将列表转换成集合

li =[2,3,4,5,6]
s = set(li)
print(s)
运行结果:
{2, 3, 4, 5, 6}


  二. 集合增加

  通过add(key)方法可以添加元素到set中,可以重复添加,但不会有效果:

s = {1,2,3,4}
s.add(5)
print(s)
s.add(5)
print(s)
运行结果:
{1, 2, 3, 4, 5}
{1, 2, 3, 4, 5}


  三. 集合删除

  通过remove(key)方法可以删除元素:

s = {1,2,3,4}
s.remove(4)
# 如果元素不存在,这个删除会报错
s.discard(4)
# 如果元素不存在,这个删除不会报错
s.pop()
# 随机删除


  set可以看成数学意义上的无序和无重复元素的集合,因此,两个set可以做数学意义上的交集、并集等操作:

  交集

linux = {1,2,3,4,56}
python = {4,5,6,98,42,2}
print(linux.intersection(python))
print(linux & python)
运行结果:
{2, 4}
{2, 4}


  并集

linux = {1,2,3,4,56}
python = {4,5,6,98,42,2}
print(linux.union(python))
print(linux | python)
运行结果:
{1, 2, 3, 4, 98, 5, 6, 42, 56}
{1, 2, 3, 4, 98, 5, 6, 42, 56}


  差集

linux = {1,2,3,4,56}
python = {4,5,6,98,42,2}
print(linux.symmetric_difference(python))
print(python ^ linux)
运行结果:
{1, 98, 3, 5, 6, 56, 42}
{1, 3, 98, 5, 6, 56, 42}


  set和dict的唯一区别仅在于没有存储对应的value,但是,set的原理和dict一样,所以,同样不可以放入可变对象,因为无法判断两个可变对象是否相等,也就无法保证set内部“不会有重复元素”。试试把list放入set,看看是否会报错。

  四. 不可变对象

  上面我们讲了,str是不变对象,而list是可变对象。

  对于可变对象,比如list,对list进行操作,list内部的内容是会变化的,比如:

a = ['c', 'b', 'a']
a.sort()
print(a)
运行结果:
['a', 'b', 'c']


  而对于不可变对象,比如str,对str进行操作呢:

a = 'abc'
print(a.replace('a', 'A'))
print(a)
运行结果:
'Abc'
'abc'


  虽然字符串有个replace()方法,也确实变出了'Abc',但变量a最后仍是'abc',应该怎么理解呢?

  我们先把代码改成下面这样:

a = 'abc'
b = a.replace('a', 'A')
print(b)
print(a)
运行结果:
'Abc'
'abc'


  要始终牢记的是,a是变量,而'abc'才是字符串对象!有些时候,我们经常说,对象a的内容是'abc',但其实是指,a本身是一个变量,它指向的对象的内容才是'abc':

  当我们调用a.replace('a', 'A')时,实际上调用方法replace是作用在字符串对象'abc'上的,而这个方法虽然名字叫replace,但却没有改变字符串'abc'的内容。相反,replace方法创建了一个新字符串'Abc'并返回,如果我们用变量b指向该新字符串,就容易理解了,变量a仍指向原有的字符串'abc',但变量b却指向新字符串'Abc'了:

  所以,对于不变对象来说,调用对象自身的任意方法,也不会改变该对象自身的内容。相反,这些方法会创建新的对象并返回,这样,就保证了不可变对象本身永远是不可变的。

(8)

分享至