我从两年前接触python,到现在python已经陪伴我渡过了我的大半个职业生涯,用过Django开发个人博客,用过pandas、numpy做过数据分析,还用过scikit-learn的数据挖掘算法,还使用过spider写爬虫,但是种种过往在脑中好似一场云烟,经历过却什么都没留下,所以从头开始梳理,将Python的相关知识点一一记录下来。
我一直使用的是经典2.7,官方称2020后将停止对2.x的维护,但是我还是习惯使用2.7版本。另外可以使用from __future__ import module
这种形式在2.x中使用3.x的方法。
# 使用数字符号可以注释单行.""" 强调内容多行注释可以使用三个 """"
# 你的数字3 # => 3# 简单的数学计算1 + 1 # => 28 - 1 # => 710 * 2 # => 2035 / 5 # => 7# 除法相对来说有点麻烦,因为除法的结果是整数还是浮点数是自动的。5 / 2 # => 2# 为了解决除法,我们需要了解浮点数.2.0 # 这就是一个浮点数11.0 / 4.0 # => 2.75 啊哈哈...是不是好多了# 整除的结果无论是正数还是负数都会截断.5 // 3 # => 15.0 // 3.0 # => 1.0 # works on floats too-5 // 3 # => -2-5.0 // 3.0 # => -2.0# 注意我们可以通过导入模块的方式使用一个/就进行正常的除法.from __future__ import division11 / 4 # => 2.75 ...normal division11 // 4 # => 2 ...floored division# 模的操作7 % 3 # => 1# 求幂2 ** 4 # => 16# 使用括号强制定义优先级(1 + 3) * 2 # => 8# 布尔操作# 注意 "and" 和"or" 是要区分大小写的True and False # => FalseFalse or True # => True# 注意用整数进行布尔操作0 and 2 # => 0-5 or 0 # => -50 == False # => True2 == True # => False1 == True # => True# 用not来否定not True # => Falsenot False # => True# 等于是 ==1 == 1 # => True2 == 1 # => False# 不相等是 !=1 != 1 # => False2 != 1 # => True# 更多的比较1 < 10 # => True1 > 10 # => False2 <= 2 # => True2 >= 2 # => True# 可以进行一串比较!1 < 2 < 3 # => True2 < 3 < 2 # => False# 可以使用 " 或 '来创造字符串"This is a string."'This is also a string.'# 字符串还可以进行相加,代表拼接!"Hello " + "world!" # => "Hello world!"# 没有 '+' 也可以进行拼接"Hello " "world!" # => "Hello world!"# 增加更多"Hello" * 3 # => "HelloHelloHello"# 一个字符串可以被看做字符串列表"This is a string"[0] # => 'T'# 可以获取字符串的长度len("This is a string") # => 16# 使用 % 来对字符串进行格式化,但是在3.1后面的版本将会被弃用.x = 'apple'y = 'lemon'z = "The items in the basket are %s and %s" % (x, y)# 还有一种新的方法是使用format方法对字符串进行格式化,而且这也是首选的方法"{} is a {}".format("This", "placeholder")"{0} can be {1}".format("strings", "formatted")# You can use keywords if you don't want to count."{name} wants to eat {food}".format(name="Bob", food="lasagna")# None 是一个对象None # => None# 我们要使用"is"来比较一个对象是否为None,而不是"==" "etc" is None # => FalseNone is None # => True# 'is'可以测试对象的身份,但这个是对于对象来说有用,对于原始的值来说只能是然并卵# 任何一个对象都可以被用在一个布尔环境里面.# 下面这些值被认为是错误的:# - None# - zero of any numeric type (e.g., 0, 0L, 0.0, 0j)# - empty sequences (e.g., '', (), [])# - empty containers (e.g., {}, set())# - instances of user-defined classes meeting certain conditions# see: https://docs.python.org/2/reference/datamodel.html#object.__nonzero__## 其它的值被认为是正确的 (使用 bool() 函数返回的将是 True).bool(0) # => Falsebool("") # => False
# Python 又一个打印语句print "I'm Python. Nice to meet you!" # => I'm Python. Nice to meet you!# 从控制台上获得输入数据的简单方法input_string_var = raw_input("Enter some data: ") # 得到的是一个字符串input_var = input("Enter some data: ") # 将这个数据的值作为python代码# 警告: 建议谨慎使用 input() 方法# 注意: 在 python 3, input() 被弃用,并且raw_input() 重命名为 input()# 在赋值变量前不需要声明,这个不像C++那样繁琐.some_var = 5 # 惯例是使用小写和下划线some_var # => 5# 使用一个之前没有赋值的变量是一种异常.# 看报错内容可以了解更多的异常信息.some_other_var # 报 name error# 使用一个表达式"yahoo!" if 3 > 2 else 2 # => "yahoo!"# 空列表li = []# 直接赋值列表other_li = [4, 5, 6]# 使用 append 方法为列表的末尾添加成员li.append(1) # li 现在是 [1]li.append(2) # li 现在是 [1, 2]li.append(4) # li 现在是 [1, 2, 4]li.append(3) # li 现在是 [1, 2, 4, 3]# 使用 pop 方法可以从列表的末尾删除一个成员li.pop() # => 3 and li 现在是 [1, 2, 4]# Let's put it backli.append(3) # li 现在又是 [1, 2, 4, 3] .# 访问列表就跟访问数组一样li[0] # => 1# 分配新值给索引指向的值li[0] = 42li[0] # => 42li[0] = 1 # 注意:把它设置成原来的值# 查看最后一个元素li[-1] # => 3# 如果查询的是一个超出索引的值就会报错li[4] # Raises an IndexError# 你可以使用切片语法获取一个范围内的值.# (开始和结束取决于你的数字位置.)li[1:3] # => [2, 4]# 省略开始li[2:] # => [4, 3]# 省略结束li[:3] # => [1, 2, 4]# 每两条选择一个li[::2] # =>[1, 4]# 反转整个列表li[::-1] # => [3, 4, 2, 1]# 把他们结合起来做一个更先进的切片# li[start:end:step]# 使用"del"删除列表中的任意元素del li[2] # li is now [1, 2, 3]# 通过列表相加的方式得到一个新列表li + other_li # => [1, 2, 3, 4, 5, 6]# 注意: 原来的列表的值是没有改变的.# 使用"extend()"方法对一个列表添加另一个列表li.extend(other_li) # 现在li变成了 [1, 2, 3, 4, 5, 6]# 删除第一个出现的值li.remove(2) # li is now [1, 3, 4, 5, 6]li.remove(2) # Raises a ValueError as 2 is not in the list# 在指定的索引出插入一个值li.insert(1, 2) # li is now [1, 2, 3, 4, 5, 6] again# 找到这个值对应的索引li.index(2) # => 1li.index(7) # Raises a ValueError as 7 is not in the list# 使用 "in" 检查元素是否在列表中1 in li # => True# 使用 "len()" 查看列表的长度len(li) # => 6# 元组跟列表很像,但是不能改变.tup = (1, 2, 3)tup[0] # => 1tup[0] = 3 # Raises a TypeError# 对于列表的很多操作,在元组中同样也可以len(tup) # => 3tup + (4, 5, 6) # => (1, 2, 3, 4, 5, 6)tup[:2] # => (1, 2)2 in tup # => True# 你可以直接将元组或者列表直接赋值给变量a, b, c = (1, 2, 3) # a is now 1, b is now 2 and c is now 3d, e, f = 4, 5, 6 # you can leave out the parentheses# 如果没有括号,将会默认创建一个元组g = 4, 5, 6 # => (4, 5, 6)# 现在如果要交换两个值将会变得非常简单e, d = d, e # d is now 5 and e is now 4# 字典主要存储映射empty_dict = {}# 直接赋值字典filled_dict = {"one": 1, "two": 2, "three": 3}# 使用 [] 查找字典里的值filled_dict["one"] # => 1# 使用 "keys()" 可以得到所有的键值filled_dict.keys() # => ["three", "two", "one"]# 注意- 字典的键是无须的,所以得到的值可能跟你一开始定义的不一样# 使用 "values()" 可以得到所有的值filled_dict.values() # => [3, 2, 1]# 注意- 同样的值是无须的.# 使用"items()"可以得到一个以列表中的元组形式的“键值-值”对filled_dict.items() # => [("one", 1), ("two", 2), ("three", 3)]# 使用 "in" 检查元素键是否在字典中"one" in filled_dict # => True1 in filled_dict # => False# 查询不存在的健是一个 KeyErrorfilled_dict["four"] # KeyError# 使用 "get()" 可以避免上面的错误,如果没有就会返回Nonefilled_dict.get("one") # => 1filled_dict.get("four") # => None# 通过设置默认值的方式,可以显示没有键情况下的值filled_dict.get("one", 4) # => 1filled_dict.get("four", 4) # => 4# 注意这时候的 filled_dict.get("four") 还是 => None# (get 方法并不能添加字典里面的值)# 设置健值的方法跟列表的类似,直接赋值filled_dict["four"] = 4 # now, filled_dict["four"] => 4# 使用 "setdefault()" 方法,当键不存在的时候就设置这个键和值,但是如果存在就不进行改变filled_dict.setdefault("five", 5) # filled_dict["five"] is set to 5filled_dict.setdefault("five", 6) # filled_dict["five"] is still 5# 集合跟列表也很类似,但是不能包含重复值empty_set = set()# 使用 "set()" 对一群治进行初始化some_set = set([1, 2, 2, 3, 4]) # some_set is now set([1, 2, 3, 4])# 虽然它看起来是经过排序的,但是实际上它是无序的another_set = set([4, 3, 2, 2, 1]) # another_set is now set([1, 2, 3, 4])# 从 2.7 开始, {} 可以用来声明一个集合filled_set = {1, 2, 2, 3, 4} # => {1, 2, 3, 4}# 向集合中添加更多的成员filled_set.add(5) # filled_set is now {1, 2, 3, 4, 5}# 使用 & 对集合进行交集操作other_set = {3, 4, 5, 6}filled_set & other_set # => {3, 4, 5}# 使用 | 对集合进行合集操作filled_set | other_set # => {1, 2, 3, 4, 5, 6}# 使用 - 可以得到补集{1, 2, 3, 4} - {2, 3, 5} # => {1, 4}# 使用 ^ 得到交集的补集{1, 2, 3, 4} ^ {2, 3, 5} # => {1, 4, 5}# 检查左边是否是右边的超集{1, 2} >= {1, 2, 3} # => False# 检查左边是否是右边的子集{1, 2} <= {1, 2, 3} # => True# 使用 in 检查是否在集合中2 in filled_set # => True10 in filled_set # => False10 not in filled_set # => True# 查看变量的数据类型type(li) # => listtype(filled_dict) # => dicttype(5) # => int
# 先来一个变量some_var = 5# 这里又一个声明,缩进在python里非常重要!# 打印"some_var is smaller than 10"if some_var > 10: print "some_var is totally bigger than 10."elif some_var < 10: # 这个 else 字句是可有可无的,根据需要. print "some_var is smaller than 10."else: # 这个也是. print "some_var is indeed 10.""""For 循环在列表中遍历prints: dog is a mammal cat is a mammal mouse is a mammal"""for animal in ["dog", "cat", "mouse"]: # 你可以使用 {0} 得到format里面的字符串. (See above.) print "{0} is a mammal".format(animal)""""range(number)" 返回一个数字列表from 0 to 给出去的数字prints: 0 1 2 3"""for i in range(4): print i""""range(lower, upper)" 返回一个数字列表from 小的数字 to 大的数字prints: 4 5 6 7"""for i in range(4, 8): print i"""While 循环遇到条件就不在运行.prints: 0 1 2 3"""x = 0while x < 4: print x x += 1 # 缩写 x = x + 1# 处理异常使用 try/except 模块try: # 使用 "raise" 来提示错误内容 raise IndexError("This is an index error")except IndexError as e: pass # Pass 就是一个空操作,但是你要写在这里.except (TypeError, NameError): pass # 如果需要,可以将多个异常处理掉.else: # 可用可不用,根据需求,但是要在所有的except后面而且要符合逻辑 print "All good!" # 只会在没有报错的时候运行finally: # 在所有情况下都会执行 print "We can clean up resources here"# 你可以使用下面这个字句代替 try/finally with open("myfile.txt") as f: for line in f: print line
# 使用 "def" 来创建一个函数def add(x, y): print "x is {0} and y is {1}".format(x, y) return x + y # 使用 return 字句返回值# 使员工参数调用函数add(5, 6) # => 打印 "x is 5 and y is 6" 并且返回值 11# 还可以使用关键字参数调用函数add(y=6, x=5) # 关键字参数不需要在意排序.# 你可以使用 * 定义函数的位置变量参数,使用的时候会被当做一个元组def varargs(*args): return argsvarargs(1, 2, 3) # => (1, 2, 3)# 你还可以使用 ** 定义函数的关键字变量参数,使用的时候会被当做一个字典def keyword_args(**kwargs): return kwargs# 调用之后看看会发生什么keyword_args(big="foot", loch="ness") # => {"big": "foot", "loch": "ness"}# 只要你想要,两个一起上也可以def all_the_args(*args, **kwargs): print args print kwargs"""all_the_args(1, 2, a=3, b=4) prints: (1, 2) {"a": 3, "b": 4}"""# 调用函数的时候,你也可以对 args/kwargs 做相反的操作!# 先定义相关的args/kwargs,然后使用 * 传递位置参数、使员工 **传递关键字参数.args = (1, 2, 3, 4)kwargs = {"a": 3, "b": 4}all_the_args(*args) # 相当于 all_the_args(1, 2, 3, 4)all_the_args(**kwargs) # 相当于 all_the_args(a=3, b=4)all_the_args(*args, **kwargs) # 相当于 all_the_args(1, 2, 3, 4, a=3, b=4)# 还可以分别使用 * and ** 来接受并传递其他函数的参数def pass_all_the_args(*args, **kwargs): all_the_args(*args, **kwargs) print varargs(*args) print keyword_args(**kwargs)# 函数范围x = 5def set_x(num): # 局部变量 x 跟全局变量 x 不一样 x = num # => 43 print x # => 43def set_global_x(num): global x print x # => 5 x = num # 全局变量 x 现在变成了 6 print x # => 6set_x(43)set_global_x(6)# Python 有第一类型"""备注:根据变量的取值范围、可操作性、可赋值性可以三种类型:一级:可以作为参数传递也可以作为结果返回;二级:可以作为参数传递,但是不能作为结果返回,也不能复制给变量;三级:连作为参数传递也不行。"""def create_adder(x): def adder(y): return x + y return adderadd_10 = create_adder(10)add_10(3) # => 13# 还有一些匿名函数(lambda x: x > 2)(3) # => True(lambda x, y: x ** 2 + y ** 2)(2, 1) # => 5# 还有内置的一些高阶函数map(add_10, [1, 2, 3]) # => [11, 12, 13],map根据给定的函数对指定序列做映射map(max, [1, 2, 3], [4, 2, 1]) # => [4, 2, 3],提供两个列表,对相同的位置进行maxfilter(lambda x: x > 5, [3, 4, 5, 6, 7]) # => [6, 7]# 我们可以使用列表来更好的理解 maps 和 filters 函数[add_10(i) for i in [1, 2, 3]] # => [11, 12, 13][x for x in [3, 4, 5, 6, 7] if x > 5] # => [6, 7]# 你也可以构造字典或集合去理解.{x for x in 'abcddeef' if x in 'abc'} # => {'a', 'b', 'c'}{x: x ** 2 for x in range(5)} # => {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}
# 我们从对象的子类中得到一个类.class Human(object): # 类的属性. 它会被这个类的所有实例共享 species = "H. sapiens" # 当类被实例化时,称为基本的初始化. # 注意双前下划线和双后下划线表示python所使用的对象和或属性,它们存在于用户空盒子的名称空间中,这些名字你最好别自己命名 def __init__(self, name): # 分配参数给这个实例的 name 属性 self.name = name # 初始化属性 self.age = 0 # 一个实例的方法. 所有的方法使用 "self" 作为第一个参数 def say(self, msg): return "{0}: {1}".format(self.name, msg) # 一个类方法是所有实例之间共享的 # 它们作为第一参数,称为调用类 @classmethod def get_species(cls): return cls.species # 在没有类和实例的情况下调用静态方法 @staticmethod def grunt(): return "*grunt*" """ 丝毫没有get到最后这三种方法的用处 """ # property 方法就像 getter 方法. # 它将类方法转化为一个相同名称的只读属性. @property def age(self): return self._age # 允许去设置属性 @age.setter def age(self, age): self._age = age # 允许删除属性 @age.deleter def age(self): del self._age# 初始化类i = Human(name="Ian")print i.say("hi") # prints out "Ian: hi"j = Human("Joel")print j.say("hello") # prints out "Joel: hello"# 调用类方法i.get_species() # => "H. sapiens"# 改变共有属性Human.species = "H. neanderthalensis"i.get_species() # => "H. neanderthalensis"j.get_species() # => "H. neanderthalensis"# 调用静态方法Human.grunt() # => "*grunt*"# 更新属性i.age = 42# 得到属性i.age # => 42# 删除属性del i.agei.age # => raises an AttributeError##################################################### 6. 模块##################################################### 引入模块import mathprint math.sqrt(16) # => 4# 从模块中引入指定函数from math import ceil, floorprint ceil(3.7) # => 4.0print floor(3.7) # => 3.0# 从模块中引入所有的函数.# Warning: 不推荐这么做from math import *# 还可以对模块重命名import math as mmath.sqrt(16) == m.sqrt(16) # => True# y你可以测试下这些其实等价的from math import sqrtmath.sqrt == m.sqrt == sqrt # => True# Python的模块值是普通的文件.你可以自己写个,然后引入. 模块的名称就是文件的名称.# 你可以找出是哪些函数和属性定义了一个模块import mathdir(math)# 如果在现有模块的文件夹中有一个脚本名称为 math.py ,这个脚本将会代替Python的自建模块,这是因为本地的文件优先级高于自建的库
# 生成器# A generator "generates" values as they are requested instead of storing everything up front# The following method (*NOT* a generator) will double all values and store it in `double_arr`. For large size of iterables, that might get huge!def double_numbers(iterable): double_arr = [] for i in iterable: double_arr.append(i + i) return double_arr# Running the following would mean we'll double all values first and return all of them back to be checked by our conditionfor value in double_numbers(range(1000000)): # `test_non_generator` print value if value > 5: break# We could instead use a generator to "generate" the doubled value as the item is being requesteddef double_numbers_generator(iterable): for i in iterable: yield i + i# Running the same code as before, but with a generator, now allows us to iterate over the values and doubling them one by one as they are being consumed by our logic. Hence as soon as we see a value > 5, we break out of the loop and don't need to double most of the values sent in (MUCH FASTER!)for value in double_numbers_generator(xrange(1000000)): # `test_generator` print value if value > 5: break# BTW: did you notice the use of `range` in `test_non_generator` and `xrange` in `test_generator`?# Just as `double_numbers_generator` is the generator version of `double_numbers`# We have `xrange` as the generator version of `range`# `range` would return back and array with 1000000 values for us to use# `xrange` would generate 1000000 values for us as we request / iterate over those items# Just as you can create a list comprehension, you can create generator comprehensions as well.values = (-x for x in [1, 2, 3, 4, 5])for x in values: print(x) # prints -1 -2 -3 -4 -5 to console/terminal# You can also cast a generator comprehension directly to a list.values = (-x for x in [1, 2, 3, 4, 5])gen_to_list = list(values)print(gen_to_list) # => [-1, -2, -3, -4, -5]# 装饰器# A decorator is a higher order function, which accepts and returns a function.# Simple usage example – add_apples decorator will add 'Apple' element into fruits list returned by get_fruits target function.def add_apples(func): def get_fruits(): fruits = func() fruits.append('Apple') return fruits return get_fruits@add_applesdef get_fruits(): return ['Banana', 'Mango', 'Orange']# Prints out the list of fruits with 'Apple' element in it: Banana, Mango, Orange, Appleprint ', '.join(get_fruits())# in this example beg wraps say# Beg will call say. If say_please is True then it will change the returned messagefrom functools import wrapsdef beg(target_function): @wraps(target_function) def wrapper(*args, **kwargs): msg, say_please = target_function(*args, **kwargs) if say_please: return "{} {}".format(msg, "Please! I am poor :(") return msg return wrapper@begdef say(say_please=False): msg = "Can you buy me a beer?" return msg, say_pleaseprint say() # Can you buy me a beer?print say(say_please=True) # Can you buy me a beer? Please! I am poor :(
联系客服