什么是数据类型?我们人类可以很容易的分清数字与字符的区别,但是计算机并不不能呀,计算机虽然很强大,但从某种角度上看也很傻,除非你明确的告诉它,1 是数字,‘汉’是文文字,否则它是分不不清 1 和‘汉’的区别的,因此,在每个编程语言里都会有一个叫数据类型的东东,其实就是对常用的各种数据类型进行了明确的划分,你想让计算机进行数值运算,你就传数字给它,你想让他处理文字,就传字符串类型给它。
变量的赋值
Python 中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量就会被创建。
在 Python 中,变量就是变量,它没有类型,我们所说的"类型"是变量所指向的内存中对象的类型。
在 Python 中也是使用等号 =
用来给变量赋值,等号 =
运算符左边是一个变量名,等号 =
运算符右边是存储在变量中的值。例如:
counter = 100 # 整型变量
miles = 1000.0 # 浮点型变量
name = "runoob" # 字符串
print (counter) # 100
print (miles) # 1000.0
print (name) # runoob
多个变量赋值
Python 允许你同时为多个变量赋值。例如:
a = b = c = 1
以上实例,创建一个整型对象,值为 1,从后向前赋值,三个变量被赋予相同的数值。
您也可以为多个对象指定多个变量。例如:
a, b, c = 1, 2, "runoob"
以上实例,两个整型对象 1
和 2
的分配给变量 a
和 b
,字符串对象 "runoob"
分配给变量 c。
基本数据类型
Python3 中有六个基本数据类型:
- Number(数字)
- String(字符串)
- List(列表)
- Tuple(元组)
- Set(集合)
- Dictionary(字典)
Python3 的六个基本数据类型中:
- 不可变数据类型(3 个):Number(数字)、String(字符串)、Tuple(元组);
- 可变数据类型(3 个):List(列表)、Dictionary(字典)、Set(集合)。
Number(数字)
Python3 支持 int
、float
、bool
、complex
(复数)。
在 Python3 里,只有一种整数类型 int
,表示为长整型,没有 python2 中的 Long
。
像大多数语言一样,数值类型的赋值和计算都是很直观的。
内置的
type()
函数可以用来查询变量所指的对象类型。
>>> a, b, c, d = 20, 5.5, True, 4+3j
>>> print(type(a), type(b), type(c), type(d))
<class 'int'> <class 'float'> <class 'bool'> <class 'complex'>
注意:在 Python2 中是没有布尔型的,它用数字
0
表示False
,用1
表示True
。到 Python3 中,把True
和False
定义成关键字了,但它们的值还是1
和0
,它们可以和数字相加。
当你指定一个值时,Number 对象就会被创建:
var1 = 1
var2 = 10
您也可以使用 del
语句删除一些对象引用。
del
语句的语法是:
del var1[,var2[,var3[....,varN]]]
您可以通过使用 del
语句删除单个或多个对象。例如:
del var
del var_a, var_b
数值运算
>>>5 + 4 # 加法
9
>>> 4.3 - 2 # 减法
2.3
>>> 3 * 7 # 乘法
21
>>> 2 / 4 # 除法,得到一个浮点数
0.5
>>> 2 // 4 # 除法,得到一个整数
0
>>> 17 % 3 # 取余
2
>>> 2 ** 5 # 乘方
32
注意:
- Python 可以同时为多个变量赋值,如 a, b = 1, 2。
- 一个变量可以通过赋值指向不同类型的对象。
- 数值的除法包含两个运算符:/ 返回一个浮点数,// 返回一个整数。
- 在混合计算时,Python 会把整型转换成为浮点数。
String(字符串)
Python中的字符串用单引号 '
或双引号 "
括起来,同时使用反斜杠 \
转义特殊字符。
字符串的截取的语法格式如下:
变量[头下标:尾下标]
索引值以 0
为开始值,-1
为从末尾的开始位置。
加号 +
是字符串的连接符,星号 *
表示复制当前字符串,紧跟的数字为复制的次数。实例如下:
str = 'Runoob'
print (str) # 输出字符串
print (str[0:-1]) # 输出第一个到倒数第二个的所有字符
print (str[0]) # 输出字符串第一个字符
print (str[2:5]) # 输出从第三个开始到第五个的字符
print (str[2:]) # 输出从第三个开始的后的所有字符
print (str * 2) # 输出字符串两次
print (str + "TEST") # 连接字符串
执行以上程序会输出如下结果:
Runoob
Runoo
R
noo
noob
RunoobRunoob
RunoobTEST
Python 使用反斜杠 \
转义特殊字符,如果你不想让反斜杠发生转义,可以在字符串前面添加一个 r
,表示原始字符串:
>>> print('Ru\noob')
Ru
oob
>>> print(r'Ru\noob')
Ru\noob
>>>
另外,反斜杠 \
可以作为续行符,表示下一行是上一行的延续。也可以使用 """..."""
或者 '''...'''
跨越多行。
注意,Python 没有单独的字符类型(char
),一个字符就是长度为 1 的字符串。
>>>word = 'Python'
>>> print(word[0], word[5])
P n
>>> print(word[-1], word[-6])
n P
与 C 字符串不同的是,Python 字符串不能被改变。向一个索引位置赋值,比如word[0] = 'm'
会导致错误。
注意:
- 反斜杠可以用来转义,使用
r
可以让反斜杠不发生转义。 - 字符串可以用
+
运算符连接在一起,用*
运算符重复。 - Python 中的字符串有两种索引方式,从左往右以 0 开始,从右往左以 -1 开始。
- Python 中的字符串不能改变。
字符串还内置了一些常用的方法,使用示例如下:
letterStr = 'abcdefg';
#重复输出
print(letterStr*2);#result:abcdefgabcdefg
#切片
print(letterStr[2:]);#result:cdefg
#判断是否存在
print('abc' in letterStr);#result:True
#格式化输出
print('abcd%s'%'efg');
#string的内置方法
#获取元素个数
print(letterStr.count('c'));#result:1
#字符串首字母大写
print(letterStr.capitalize());#result:Abcdefg
#指定长度居中
print(letterStr.center(20,'-'));#result:------abcdefg-------
#是否以指定元素结尾
print(letterStr.endswith("g"));#result:True
#是否以指定元素开头
print(letterStr.startswith("a"));#result:True
#指定tab空格长度
print("a\tb".expandtabs(tabsize=10));#result:a b
#返回指定第一个元素索引值
print(letterStr.find('c'));#result:2
#格式化
print("hello {next}".format(next="world"));#result:hello world
print("name:{name};{age} years old".format_map({"name":"zhangsan","age":12}));#result:name:zhangsan;12 years old
#返回指定元素索引 不存在时会报错
print(letterStr.find('c'));#result:2
#判断只包含数字或字母
print("deqad#".isalnum());#result:False;
#判断是否是整形数字
print('12'.isdigit());#result:True
#判断是否不是非法命名
print("123a".isidentifier());#result:False
#判断是否小写
print(letterStr.islower());#result:True
#判断是否大写
print(letterStr.isupper());#result:False
#判断是否是个空格
print(letterStr.isspace());#result:False
#判断是否每个单词首字母大写
print(letterStr.istitle())#result:False
#转小写
print(letterStr.lower());#result:abcdefg
#转大写
print(letterStr.upper());#result:ABCDEFG
#大小写反转
print(letterStr.swapcase());#result:ABCDEFG
#左填充
print(letterStr.ljust(20,'*'));#abcdefg*************
#右填充
print(letterStr.rjust(20,'*'));#*************abcdefg
#去首尾空白字符
print(" ade \n".strip());#result:ade
#去首部空白字符
print(" ade ".lstrip());#result:ade
#去尾部空白字符
print(" ade \n".rstrip());#result: ade
#替换
print(letterStr.replace('g','ghi'));#result:abcdefghi
#从右往左查找 返回实际位置
print("acbbbbcss".rfind('c'));#result:6
#切割字符串 返回列表
print(letterStr.split('d'));#result:['abc', 'efg']
#字符串内每个单词首字母大写
print('hello world'.title());#result:Hello World
格式化输出
现在有以下需求,让用户输入 name
、age
、job
、hobby
然后输出如下所示:
-------- info of tom -------------
Name : tom
Age : 22
job : teacher
Hobbie: girl
------------- end -----------------
你怎么实现呢?你会发现,用字符拼接的方式还难实现这种格式的输出,所以一起来学一下新姿势 只需要把要打印的格式先准备好, 由于里面的一些信息是需要用户输入的,你没办法预先知道,因此可以先放置个占位符,再把字符串里的占位符与外部的变量做个映射关系就好啦。如下:
name = input("Name:")
age = input("Age:")
job = input("Job:")
hobby = input("Hobbie:")
# 这里的每个 %s 就是一个占位符
info = '''
-------- info of %s -------------
Name : %s
Age : %s
job : %s
Hobbie: %s
------------- end -----------------
''' % (name, name, age, job, hobby) # 这行的 % 号就是把前面的字符串与括号后面的变量关联起来
print(info)
%s
就是代表字符串占位符,除此之外,还有 %d
是数字占位符,如果把上面的 age
后面的 %s
换成 %d
,就代表你必须只能输入数字啦,这时对应的数据必须是 int
类型,否则程序会报错,使用时,需要进行类型转换:
age = int(input("Age:"))
类似这样的操作在后面还有很多,如果你头铁,就不想转换,觉着转换很麻烦,也可以全部都用 %s
,因为任何东西都可以直接转换成字符串
现在⼜来新问题了,如果想输出:
我叫 xxx, 今年 xx 岁了,我们已经学习了 20% 的 python 基础了
这里的问题出在哪里呢?没错 20%
,在字符串中如果使用了 %s
这样的占位符,那么所有的 %
都将变成占位,我们的 2%
也变成了占位符,这里我们需要使用 %%
来表⽰字符串中的 %
。如下:
print("我叫 %s, 今年 %s 岁了,我们已经学习了 20%% 的 python 基础了" % ('王尼玛', 22)) # 有%占位符
print("我叫 王尼玛, 今年 22 岁了,我们已经学习了 20% 的 python 基础了") # 没有占位符
字符串格式化除了使用上面的 %
的形式,还可以使用 format
函数来完成,其占位符为 {}
,示例如下:
print("我叫 {}, 今年 {} 岁了,我们已经学习了 20% 的 python 基础了".format('王尼玛', 22)) # 按 {} 顺序格式化
print("我叫 {1}, 今年 {0} 岁了,我们已经学习了 20% 的 python 基础了".format(22, '王尼玛')) # 按 {} 中指定的关键字格式化
print("我叫 {name}, 今年 {age} 岁了,我们已经学习了 20% 的 python 基础了".format(age=22, name='王尼玛')) # 按 {} 中指定的关键字格式化
List 列表
List(列表) 是 Python 中使用最频繁的数据类型。
列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。
列表是写在方括号 []
之间、用逗号分隔开的元素列表。
和字符串一样,列表同样可以被索引和截取,列表被截取后返回一个包含所需元素的新列表。
列表截取的语法格式如下:
变量[头下标:尾下标]
索引值以 0
为开始值,-1
为从末尾的开始位置。
加号 +
是列表连接运算符,星号 *
是重复操作。如下实例:
list = [ 'abcd', 786 , 2.23, 'runoob', 70.2 ]
tinylist = [123, 'runoob']
print (list) # 输出完整列表
print (list[0]) # 输出列表第一个元素
print (list[1:3]) # 从第二个开始输出到第三个元素
print (list[2:]) # 输出从第三个元素开始的所有元素
print (tinylist * 2) # 输出两次列表
print (list + tinylist) # 连接列表
以上实例输出结果:
['abcd', 786, 2.23, 'runoob', 70.2]
abcd
[786, 2.23]
[2.23, 'runoob', 70.2]
[123, 'runoob', 123, 'runoob']
['abcd', 786, 2.23, 'runoob', 70.2, 123, 'runoob']
与 Python 字符串不一样的是,列表中的元素是可以改变的:
>>> a = [1, 2, 3, 4, 5, 6]
>>> a[0] = 9
>>> a[2:5] = [13, 14, 15]
>>> a
[9, 2, 13, 14, 15, 6]
>>> a[2:5] = [] # 将对应的元素值设置为 []
>>> a
[9, 2, 6]
List 内置了有很多方法,例如 append()
、pop()
等等,下面是常用函数的使用示例:
# append():尾部追加
letter_list = ['a', 'b', 'c']
letter_list.append('d')
print(letter_list) # ['a', 'b', 'c', 'd']
# insert():在指定位置插入
letter_list = ['a', 'b', 'c']
letter_list.insert(2, 'd')
print(letter_list) # ['a', 'b', 'd', 'c']
# count():返回指定元素出现的次数
letter_list = ['a', 'b', 'c', 'c'];
count = letter_list.count('c')
print(count); # 2
# index():获取元素索引,有多个则返回第一个
letter_list = ['a', 'b', 'c', 'c']
index = letter_list.index('c')
print(index) # 2
# pop():移除指定索引处元素并返回
letter_list = ['a', 'b', 'c', 'c']
element = letter_list.pop(2)
print(letter_list) # ['a', 'b', 'c']
print(element) # c
# remove():移除列表中出现的第一个指定的元素
letter_list = ['a', 'b', 'c', 'c']
letter_list.remove('c')
print(letter_list) # ['a', 'b', 'c']
# reverse():反转顺序
letter_list = ['a', 'b', 'c']
letter_list.reverse()
print(letter_list) # ['c', 'b', 'a']
# sort():排序
letter_list = ['b', 'a', 'c']
letter_list.sort()
print(letter_list) # ['a', 'b', 'c']
# extend():批量追加
letter_list = ['b', 'a', 'c']
letter_list.extend(['d', 'e', 'f'])
print(letter_list); # ['b', 'a', 'c', 'd', 'e', 'f']
注意:
- List 写在方括号之间,元素用逗号隔开。
- 和字符串一样,list 可以被索引和切片。
- List 可以使用
+
操作符进行拼接。 - List 中的元素是可以改变的。
Python 列表截取可以接收第三个参数,参数作用是截取的步长,以下实例在索引 1
到索引 4
的位置并设置为步长为 2
(间隔一个位置)来截取字符串:
如果第三个参数为负数表示逆向读取。
Tuple(元组)
元组(tuple)与列表类似,不同之处在于元组的元素不能修改。元组写在小括号 ()
里,元素之间用逗号隔开。
元组中的元素类型也可以不相同:
tuple = ( 'abcd', 786 , 2.23, 'runoob', 70.2 )
tinytuple = (123, 'runoob')
print (tuple) # 输出完整元组
print (tuple[0]) # 输出元组的第一个元素
print (tuple[1:3]) # 输出从第二个元素开始到第三个元素
print (tuple[2:]) # 输出从第三个元素开始的所有元素
print (tinytuple * 2) # 输出两次元组
print (tuple + tinytuple) # 连接元组
以上实例输出结果:
('abcd', 786, 2.23, 'runoob', 70.2)
abcd
(786, 2.23)
(2.23, 'runoob', 70.2)
(123, 'runoob', 123, 'runoob')
('abcd', 786, 2.23, 'runoob', 70.2, 123, 'runoob')
元组与字符串类似,可以被索引且下标索引从 0
开始,-1
为从末尾开始的位置。也可以进行截取(看上面,这里不再赘述)。
其实,可以把字符串看作一种特殊的元组。
>>>tup = (1, 2, 3, 4, 5, 6)
>>> print(tup[0])
1
>>> print(tup[1:5])
(2, 3, 4, 5)
>>> tup[0] = 11 # 修改元组元素的操作是非法的
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment
>>>
虽然 tuple 的元素不可改变,但它可以包含可变的对象,比如 list 列表。
构造包含 0 个或 1 个元素的元组比较特殊,所以有一些额外的语法规则:
tup1 = () # 空元组
tup2 = (20,) # 一个元素,需要在元素后添加逗号
string、list 和 tuple 都属于 sequence(序列)。
注意:
- 与字符串一样,元组的元素不能修改。
- 元组也可以被索引和切片,方法一样。
- 注意构造包含 0 或 1 个元素的元组的特殊语法规则。
- 元组也可以使用+操作符进行拼接。
Set(集合)
集合(set)是由一个或数个形态各异的大小整体组成的,构成集合的事物或对象称作元素或是成员。
基本功能是进行成员关系测试和删除重复元素。
可以使用大括号 { }
或者 set()
函数创建集合,注意:创建一个空集合必须用 set()
而不是 { }
,因为 { }
是用来创建一个空字典。
创建格式:
parame = {value01,value02,...}
# 或者
set(value)
看如下实例:
student = {'Tom', 'Jim', 'Mary', 'Tom', 'Jack', 'Rose'}
print(student) # 输出集合,重复的元素被自动去掉
# 成员测试
if 'Rose' in student :
print('Rose 在集合中')
else :
print('Rose 不在集合中')
# set可以进行集合运算
a = set('abracadabra')
b = set('alacazam')
print(a)
print(a - b) # a 和 b 的差集
print(a | b) # a 和 b 的并集
print(a & b) # a 和 b 的交集
print(a ^ b) # a 和 b 中不同时存在的元素
以上实例输出结果:
{'Mary', 'Jim', 'Rose', 'Jack', 'Tom'}
Rose 在集合中
{'b', 'a', 'c', 'r', 'd'}
{'b', 'd', 'r'}
{'l', 'r', 'a', 'c', 'z', 'm', 'b', 'd'}
{'a', 'c'}
{'l', 'r', 'z', 'm', 'b', 'd'}
Set 也有一些常用函数,示例如下:
# set():列表去重
num_list = [1, 2, 2, 3, 3, 4]
print(set(num_list)) # {1, 2, 3, 4}
# union():并集
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
print(num_set1 | num_set2) # {1, 2, 3, 4, 5, 6}
print(num_set1.union(num_set2)) # {1, 2, 3, 4, 5, 6}
# intersection():交集
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
print(num_set1 & num_set2) # {3, 4}
print(num_set1.intersection(num_set2)) # {3, 4}
# difference():差集
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
print(num_set1 - num_set2) # {1, 2}
print(num_set1.difference(num_set2)) # {1, 2}
print(num_set2.difference(num_set1)) # {5, 6}
# symmetric_difference():对称差集,即双方并集后去除交集
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
print(num_set1 ^ num_set2) # {1, 2, 5, 6}
print(num_set1.symmetric_difference(num_set2)) # {1, 2, 5, 6}
# update():并集并赋值
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
num_set1.update(num_set2)
# 或 num_set1 |= num_set2
print(num_set1) # {1, 2, 3, 4, 5, 6}
print(num_set2) # {3, 4, 5, 6}
# intersection_update():交集并赋值
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
num_set1.intersection_update(num_set2)
# 或 num_set1&=num_set2
print(num_set1) # {3, 4}
print(num_set2) # {3, 4, 5, 6}
# symmetric_difference_update():对称差集并赋值
num_set1 = {1, 2, 3, 4}
num_set2 = {3, 4, 5, 6}
num_set1.symmetric_difference_update(num_set2)
# 或 num_set1 ^= num_set2
print(num_set1) # {1, 2, 5, 6}
# add():添加
num_set1 = {1, 2, 3, 4}
num_set1.add(5)
print(num_set1) # {1, 2, 3, 4, 5}
# remove():不存在则引发 KeyError
num_set1 = {1, 2, 3, 4}
num_set1.remove(2)
print(num_set1) # {1, 3, 4}
# discard():存在则移除
num_set1 = {1, 2, 3, 4}
num_set1.discard(2)
print(num_set1) # {1, 3, 4}
# pop():随机删除并返回
num_set1 = {1, 2, 3, 4}
removeItem = num_set1.pop()
print(num_set1) # {2, 3, 4}
print(removeItem) # 1
# clear():清空
num_set1 = {1, 2, 3, 4}
num_set1.clear()
print(num_set1) # set()
Dictionary(字典)
字典(dictionary)是 Python 中另一个非常有用的内置数据类型。
列表是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
字典是一种映射类型,字典用 { }
标识,它是一个无序的 键(key) : 值(value)
的集合。
键(key)
必须使用不可变类型。
在同一个字典中,键(key)
必须是唯一的。
dict = {}
dict['one'] = "1 - Java"
dict[2] = "2 - Python"
tinydict = {'name': 'zze','code':1, 'site': 'www.zze.xyz'}
print (dict['one']) # 输出键为 'one' 的值
print (dict[2]) # 输出键为 2 的值
print (tinydict) # 输出完整的字典
print (tinydict.keys()) # 输出所有键
print (tinydict.values()) # 输出所有值
以上实例输出结果:
1 - Java
2 - Python
{'name': 'zze', 'code': 1, 'site': 'www.zze.xyz'}
dict_keys(['name', 'code', 'site'])
dict_values(['zze', 1, 'www.zze.xyz'])
构造函数 dict()
可以直接从键值对序列中构建字典如下:
>>>dict([('Runoob', 1), ('Google', 2), ('Taobao', 3)])
{'Taobao': 3, 'Runoob': 1, 'Google': 2}
>>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}
>>> dict(Runoob=1, Google=2, Taobao=3)
{'Runoob': 1, 'Google': 2, 'Taobao': 3}
另外,字典类型也有一些内置的函数,例如 clear()
、keys()
、values()
等。
注意:
- 字典是一种映射类型,它的元素是键值对。
- 字典的关键字必须为不可变类型,且不能重复。
- 创建空字典使用
{ }
。
补充
Python数据类型转换
有时候,我们需要对数据内置的类型进行转换,数据类型的转换,你只需要将数据类型作为函数名即可。
以下几个内置的函数可以执行数据类型之间的转换。这些函数返回一个新的对象,表示转换的值。
| 函数 | 描述 |
| --- | --- |
| int(x [,base])
| 将 x
转换为一个整数 |
| float(x)
| 将 x
转换到一个浮点数 |
| complex(real [,imag])
| 创建一个复数 |
| str(x)
| 将对象 x
转换为字符串 |
| repr(x)
| 将对象 x
转换为表达式字符串 |
| eval(str)
| 用来计算在字符串中的有效 Python 表达式,并返回一个对象 |
| tuple(s)
| 将序列 s
转换为一个元组 |
| list(s)
| 将序列 s
转换为一个列表 |
| set(s)
| 转换为可变集合 |
| dict(d)
| 创建一个字典。d
必须是一个 (key, value)
元组序列。 |
| frozenset(s)
| 转换为不可变集合 |
| chr(x)
| 将一个整数转换为一个字符 |
| ord(x)
| 将一个字符转换为它的整数值 |
| hex(x)
| 将一个整数转换为一个十六进制字符串 |
| oct(x)
| 将一个整数转换为一个八进制字符串 |
Queen 队列
队列并不是 Python 的基本数据类型,所以需要导入后才能使用,简单示例如下:
import queue
q = queue.Queue()
q.put(1)
q.put(2)
q.put(3)
print(q.qsize()) # 3 查看队列元素个数
print(q.get()) # 1
print(q.get()) # 2
print(q.get()) # 3
print(q.qsize()) # 0
print(q.get()) # 阻塞
练习
dic1 = {
'name': ['bob', 2, 3, 5],
'job': 'student',
'zze': {'tom': ['python1', 'python2', 100]}
}
# 1、将 name 对应的列表追加一个元素 jerry
dic1['name'].append('jerry')
print(dic1)
# 2、将 `name` 对应的列表中第一个元素的首字母大写
first_char = dic1['name'][0][0]
dic1['name'][0] = dic1['name'][0].replace(first_char, first_char.upper(), 1)
print(dic1)
# 3、在 zze 对应的字典里添加一个字典 {'zs':'zhangsan'}
dic1['zze']['zs']='zhangsan'
print(dic1)
# 4、将 zze 对应字典中的 python2 删除
dic1['zze']['tom'].remove('python2')
print(dic1)
评论区