Python学习中你不可不知的Python陷阱(三)

合集下载

Python技术的内存泄漏排查指南

Python技术的内存泄漏排查指南内存泄漏是软件开发中常见的问题之一，它可能导致程序运行速度减慢、卡顿、甚至崩溃。

在Python技术中，内存泄漏也是一个常见的问题，但幸运的是，Python提供了一些工具和技术来帮助我们排查和解决这个问题。

本篇文章将为您提供一个Python技术的内存泄漏排查指南，以帮助您解决内存泄漏问题。

一、了解内存泄漏的原因首先我们需要了解内存泄漏的原因。

内存泄漏通常发生在对象被创建后，但没有正确释放内存空间的情况下。

这可能是因为对象还在被引用，而引用又不存在的情况。

Python中的内存泄漏主要源自以下几个原因：1. 循环引用：当两个或多个对象之间存在循环引用时，它们不会被垃圾收集器回收，从而导致内存泄漏。

2. 全局变量：在Python中，全局变量在整个程序运行期间都会存在，如果没有正确释放全局变量所占用的内存，就会导致内存泄漏。

3. 缓存：使用缓存可以提高程序的性能，但如果没有正确管理缓存，可能会导致内存泄漏。

二、使用工具进行内存泄漏排查Python提供了一些工具来帮助我们进行内存泄漏的排查。

其中最常用的工具是内存分析器（Memory Profiler）和垃圾收集器（Garbage Collector）。

1. 内存分析器：内存分析器可以帮助我们找出程序中占用内存最多的部分，从而确定内存泄漏的源头。

可以使用第三方库memory_profiler来分析内存的使用情况。

通过在代码中添加`@profile`装饰器，并在命令行中运行`python -mmemory_profiler your_script.py`命令，即可生成内存分析报告。

2. 垃圾收集器：Python的垃圾收集器会自动回收不再使用的对象，但有时候可能会出现无法正确回收的情况，从而导致内存泄漏。

可以使用gc模块来管理垃圾收集器的行为。

其中最常用的方法是`gc.set_debug()`，它可以设置垃圾收集器的调试级别以及输出信息。

(完整版)python学习课件课件

面向对象编程是Python中的重要概念，它允许我们使用类和对象来设计和实现程序。类是对象的模板或蓝图，而对象是类的实例。通过定义类和对象，我们可以模拟现实世界中的各种实体，并为其添加属性和方法。
异常处理
理解异常处理的概念，掌握try-except语句的使用方法。
异常处理是Python中用于处理程序中可能出现的错误或异常情况的一种机制。 try-except语句用于捕获和处理异常，它允许我们定义一个代码块来执行可能引发异常的代码，并在出现异常时执行另一个代码块来处理该异常。
总结词
Python的起源与特点概述
详细描述
Python是一种高级的、动态类型的编程语言，诞生于1980年代末期。它具有简单易学、语法简洁、可读性强等特点，广泛应用于Web开发、数据分析、人工智能等领域。
Python的语法基础
总结词
Python语法规则和基础概念
详细描述
Python的语法规则包括缩进、注释、变量、数据类型等。它采用缩进来表示代码块，注释使用井号(#)开头，变量名由字母、数字或下划线组成，数据类型包括整型、浮点型、布尔型等。
安装与配置
介绍如何安装Flask框架，以及如何配置开发环境，包括虚拟环境的创建和使用。
请求与响应
介绍如何处理客户端请求和生成服务器响应，包括获取请求数据、设置响应内容、处理异常等。
模板引擎的使用
模板引擎介绍
模板继承与布局
介绍常见的模板引擎，如Jinja2、 Mako等，以及它们在Web开发中的应用场景。
THANKS
感谢观看
的数据分析。
Matplotlib库
Matplotlib是Python中用于绘制图表和图像的库，提供了多种绘图函数和工具，支持多种图表类型和风格。

(完整版)Python学习课件

100%
浮点数类型
浮点数用于表示实数，即带有小数点的数字。Python中的浮点数类型通常是双精度浮点数。
80%
数字类型的运算
Python支持基本的数学运算，如加、减、乘、除和取余等。
字符串类型及操作
字符串定义
字符串是由零个或多个字符组成的一种数据类型，用引号括起来表示。
字符串操作
Python提供了丰富的字符串操作方法，如连接、截取、查找、替换等。
(完整版)Python学习课件
汇报人:
2023-12-21
目
CONTENCT
录
• Python基础知识 • Python数据类型与运算符 • Python流程控制语句 • Python函数与模块 • Python面向对象编程思想 • Python文件操作与数据处理
01
Python基础知识
Python简介与发展历程
字符串格式化
可以使用格式化字符串来插入变量或表达式的值，生成动态的字符串内容。
列表、元组和字典等数据结构
列表
列表是一种有序的数据结构，可以包含任意类型的元素，且元素
之间可以重复。
元组
元组与列表类似，也是一种有序的数据结构，但元组是不可变的，即创建后不能修改。
字典
字典是一种无序的数据结构，用于存储键值对，其中键必须是不可变类型（如整数、字符串或元组）。
03
Python流程控制语句
条件语句：if-else结构
if语句
elif语句
用于根据条件判断执行相应的代码块。
用于在if语句中添加额外的条件判断。
else语句
与if语句配合使用，当if语句条件不满足时执行else代码块。

Python爬虫（三）——数据解析

Python爬⾍（三）——数据解析1. re模块之前我们在python基础中介绍过正则表达式，⽽re模块可以使⽤正则表达式对字符串进⾏很好的筛选。

re模块的使⽤可以分为两种:第⼀种是对象式的⽅式，第⼆种是函数式的⽅式。

之前已经介绍过正则模块的简单使⽤，我们在这⾥就直接进⾏案例操作。

通过⽹页分析发现每⼀个图⽚的地址都被放在了该标签下。

在浏览器地址栏中输⼊该图⽚的地址就可以找到这个图⽚。

现在图⽚已经找到了，下⼀步就是对图⽚进⾏下载。

那么如何通过代码去实现呢？url='https:///biaoqing/lists/page/6.html'resp=requests.get(url).textprint(resp)通过刚开始打印的控制台的内容发现浏览器中的代码结构与控制台打印的并不太⼀样。

因此我们在⽹页源代码中查看我们会发现每个图⽚的 URL 地址都在 data-original这个标签中，因此我们对该属性中的内容进⾏正则匹配，正则匹配规则为<img class="ui image lazy" data-original="(.*?)" 通过re.findall()来获得匹配到的内容，括号内的参数主要有三个，第⼀个是正则表达式，第⼆个是需要匹配的内容，第三个是匹配规则，在这⾥我们⼀般只需要记住第⼀个和第⼆个就可以了。

resp=requests.get(url)img_src=re.findall('<img class="ui image lazy" data-original="(.*?)"',resp.text,re.S)匹配到的内容是⼀个列表，再遍历这个列表，依次对列表中的图⽚地址发送请求，因为是图⽚，所以它是⼆进制的形式，因此我们以⼆进制的形式进⾏保存，具体的完整代码请看⽂末附录⼀：for src in img_src:src_filename=src.rsplit('/')[-1]img_content=requests.get(src)with open(f'表情包\\第{page}页\\{src_filename}',mode='wb') as f:f.write(img_content.content)re模块对于新⼿来说，我们只需要记住表达式 .* ？就可以了，将需要匹配的内容以 .* ?的形式，re模块就会进⾏贪婪匹配。

python 核心知识点笔记

python 核心知识点笔记Python 这门编程语言，就像一把神奇的钥匙，能为你打开无数精彩的科技大门。

要说 Python 里的核心知识点，变量就不得不提啦！变量就好像是一个个小盒子，你可以把各种各样的数据，像数字、字符串、列表等等，统统装进去。

你想想，这不就跟你有好多小抽屉，能把不同的宝贝分类放进去一个道理嘛？再来说说数据类型。

整数、浮点数、字符串，它们就像是不同种类的水果，各有各的特点。

整数就像苹果，整整齐齐，没啥小数部分；浮点数呢，就像切开的西瓜，有整数部分还有小数部分。

字符串则像是一串糖葫芦，由一个个字符串起来。

控制结构也是重要的一部分。

条件判断，这不就像是你出门前看天气决定带不带伞嘛？如果下雨，就带伞；如果晴天，就轻松出门。

循环呢，好比你做重复的工作，比如不停地擦桌子，直到擦干净为止。

函数呢，那可是个好帮手。

它就像是一个专门为你解决特定问题的小能手。

你需要它的时候，叫它一声，它就出来把事情办好。

比如说，你想计算两个数的和，写个求和的函数，每次要用，直接调用，多方便！列表和字典也是 Python 里的宝贝。

列表就像一排小格子，你可以按顺序往里面放东西。

字典呢，就像是一个有标签的盒子，你根据标签就能找到对应的东西。

还有面向对象编程，这可厉害了！把现实中的东西抽象成类和对象，就好像把你的玩具车、玩具飞机都做成模板，然后根据模板创造出具体的玩具。

学习 Python 就像是一场探险，每一个核心知识点都是一个宝藏。

你要是能把这些宝藏都掌握好，那在编程的世界里，你就能横着走啦！你难道不想成为 Python 世界里的大侠吗？难道不想用 Python 实现你的奇思妙想吗？所以，加油吧，努力掌握这些核心知识点，让 Python 为你的未来添彩！。

Python中的隐秘陷阱：函数默认参数的误区与妙用

Python中的隐秘陷阱：函数默认参数的误区与妙用《Python中的隐秘陷阱：函数默认参数的误区与妙用》在Python编程的广阔天地中，函数是构建逻辑的基石。

然而，即便是经验丰富的开发者，也可能在函数的默认参数上跌入陷阱。

本文将深入探讨Python中一个常见却容易被忽视的问题——使用可变对象作为函数的默认参数值，并揭示其背后的原因与正确的使用方式。

1. 陷阱揭秘：默认参数的共享之谜在Python中，函数的默认参数值在函数定义时只计算一次。

这意味着，如果一个函数的默认参数是一个可变对象，如列表或字典，那么这个参数在后续的所有函数调用中将指向同一个对象。

这看似无害的特性，实则隐藏着巨大的风险。

pythondef append_to_list(element, my_list=[]):my_list.append(element)return my_listprint(append_to_list(1)) # [1]print(append_to_list(2)) # [1, 2] 而非预期的[2]如上例所示，每次调用append_to_list函数时，我们都期望my_list是一个新的列表。

然而，由于my_list 在定义时只被初始化一次，后续的调用实际上都在修改同一个列表。

2. 误区剖析：为何默认参数的陷阱如此隐蔽？Python的设计哲学之一是“简洁胜于复杂”。

因此，函数的默认参数机制被设计得尽可能简单。

然而，这种简洁性也带来了理解上的挑战。

开发者往往期望每次函数调用都能获得一个独立的默认参数值，但Python的实际行为却与之相悖。

3. 妙用探索：可变默认参数的正当场合尽管使用可变对象作为默认参数存在陷阱，但在某些特定场景下，它却能发挥出意想不到的效果。

例如，当我们需要在函数调用之间共享某些状态或缓存时，可变默认参数就能大显身手。

pythondef memoize(func, cache={}):def wrapper(*args):if args in cache:return cache[args]result = func(*args)cache[args] = resultreturn resultreturn wrapper@memoizedef factorial(n):if n == 0:return 1return n * factorial(n - 1)在这个例子中，memoize函数利用字典作为默认参数来缓存计算结果，显著提高了递归函数的效率。

Python实操（3）：python编程规范

Python实操（3）：python编程规范选择pythoncharm作为Python开发ide也是在网上查了好长时间，这两天了解到visual studio code强大、易用，同时也一直用visual studio做c/c++开发，所以决定把以后的开发平台切换到微软系。

换平台以后发现，先前在pythoncharm写的东西，在visual studio code上一堆问题，百度一下才明确没有遵循PEP8。

“行有行规”，既然准备深究一下python，规则还是必须要了解，遵循的。

PEP8就不具体介绍了，本篇旨在记录自己实操中出现的问题及解决办法，后续学习中不断更新补充。

这里列几条要求：一行列数 : PEP 8 规定为 79 列（这个有时候看着不爽，我修改为120）；一个函数 : 不要超过 30 行代码, 即可显示在一个屏幕类，可以不使用垂直游标即可看到整个函数；一个类 : 不要超过 200 行代码，不要有超过 10 个方法；一个模块 : 不要超过 500 行；一句import：不要导入多个库一个函数或类：前后要空两行一个.py文件：文件最后有且仅有一个空行列出实际遇到的错误及解决方案：(1) indentation is not a multiple of four空格的个数应该是4的倍数，核对一下是否多敲或者少一个空格；（2）line too long (114 > 79 characters)方法一Python行宽为80，可以将段落分行，yapf进行格式化，如visual studio code中快捷键为“alt+shift + f”进行格式化；方法二在visual studio code 中也可以在：文件->首选项->设置将python configuration 中的“python.linting.flake8Args:[]”,复制到右边的用户设置区然后在中括号里添加“--max-line-length=120”,如"python.linting.flake8Args": ["--max-line-length=120"],（3）E502:the backslash is redundant between brackets由于一行太长，所以通过"\"将其分为两行，然后就提示这个错误；是因为虽然这一行很长，但是“\”分开的部分是处于“()”之间的，系统可以自动判决，所以就不需要加"\"了。

深度学习基础-Python课件(附PPT)

深度学习基础——Python 课件(附PPT)
在这个课件中，我们将介绍深度学习的基础知识，并使用Python的各种库进行实际操作。从Python基础语法回顾到神经网络实现，涵盖了深度学习的主要内容。
深度学习简介
深度学习是一种机器学习算法，通过模拟人脑神经系统的结构和功能，实现对复杂数据的高效处理和分析。它已经在各个领域取得了重大突破，如图像识别、语音识别和自然语言处理。
Python基础语法回顾
Python是一种简洁而强大的编程语言，具有简单易懂的语法，适合初学者和专业开发者。本节将回顾Python的基础语法，包括变量、数据类型、条件语句和循环结构。
Numpy库基础操作
Numpy是Python中用于数值计算的核心库，提供了高性能的多维数组对象和各种数学函数。我们将学习如何创建数组、进行数学运算和处理矩阵，为后续的深度学习任务做好准备。
神经网络基础知识
神经网络是深度学习的基本模型，它由多个神经元和层组成，用于处理和学习复杂的非线性关系。我们将介绍神经网络的基本结构和工作原理，以及常用的激活函数和损失函数。
激活函数及其性质
激活函数在神经网络中起着非常重要的作用，它将神经元的输入映射到输出。我们将介绍常用的激活函数，如Sigmoid、ReLU和Softmax，以及它们的性质和适用场景。
图像分类实现
图像分类是计算机视觉中一项重要任务，用于将图像划分到不同的类别中。我们将学习如何使用Python和相关库实现图像分类模型，以解决图像识别、物体检测等问题。
Tensorflow库基础操作
Tensorflow是一个开源的深度学习框架，由Google开发。它提供了丰富的工具和接口，用于构建、训练和部署机器学习和深度学习模型。我们将学习如何使用Tensorflow进行模型的定义和训练。

5个无聊Python程序，用来整蛊你的朋友们

5个⽆聊Python程序，⽤来整蛊你的朋友们以下程序，不要发代码，要不实现不了你整蛊的⽬的。

要打包成⼀个exe程序，发给朋友才有意思。

使⽤pip install pyinstaller打包命令如下：pyinstaller -F ⽂件名.py过程中如果出现 BUG（⼀般是编码错误），⽂末有解决⽅案⽆聊程序之⼀while True:n = input("猜猜我在想啥？")print("猜错喽")你的朋友将永远⽆法知道你在想什么。

⽆聊程序之⼆死命弹窗import tkinter.messageboxwhile True:tkinter.messagebox.showerror('Windows 错误','你的电脑正在被攻击！')运⾏之后，很就刺激了，如果对⽅不会杀进程，更刺激。

⽆聊程序之三调⽤默认浏览器，⽆限打开 CSDN ，让他爱上学习。

import webbrowserwhile True:webbrowser.open('')额，使⽤之后，我⾃⼰的电脑死机了。

瞬间 CPU…⽆聊程序之四这个程序就动感多了，会随机出现弹窗。

import tkinter as tkimport randomimport threadingimport timedef boom():window = ()width = window.winfo_screenwidth()height = window.winfo_screenheight()a = random.randrange(0, width)b = random.randrange(0, height)window.title('你是⼀个傻狍⼦')window.geometry("200x50" + "+" + str(a) + "+" + str(b))bel(window, text='你是⼀个傻狍⼦', bg='green',font=('宋体', 17), width=20, height=4).pack()window.mainloop()threads = []for i in range(100):t = threading.Thread(target=boom)threads.append(t)time.sleep(0.1)threads[i].start()⽆聊程序之五该程序在我看来能排到第⼀，甚⾄可以和当下最⽕的枪茅台案例结合⼀下。

python3学习笔记（3）编码，解码逻辑判断无限循环和for循环字符串的相关操作

python3学习笔记（3）编码，解码逻辑判断⽆限循环和for循环字符串的相关操作编码与解码详解：(1)Python2的默认编码是ascll，Python3 的默认编码是unicode。

(2)编码和解码：编码:就是把str的数据类型转为bytes的数据类型的过程，使⽤到的关键字是encode str→bytes解码: 把bytes的数据类型转为str的数据类型的过程,使⽤到的关键字是decode bytes→strstr_bytes把str数据类型转换为bytes数据类型（3）编码以及解码的步骤：先定义变量在调⽤变量（4）编码和解码实战：就是当你想查看的内容为乱码的时候，可以使⽤解码来获取正确显⽰内容逻辑判断：python中⼀般使⽤if-elif-else语句进⾏逻辑判断使⽤此语句要注意以下⼏点;1.if是如果的意思 elif是否则如果 else是其他2、程序在执⾏时，⾸先执⾏if语句，如果成⽴，则下⾯的elif和else语句都将被忽略；如果不成⽴，则执⾏elif语句；如果elif语句仍不成⽴，则执⾏最后的else语句。

3、else、elif为⼦块，不能独⽴使⽤4、⼀个if语句中可以包含多个elif语句，但结尾只能有⼀个else语句5.else和elif语句也可以叫做⼦句，它们不能独⽴使⽤，两者都是出现在if、for、while语句内部的。

else⼦句可以增加⼀种选择；⽽elif⼦句则是需要检查更多条件时会被使⽤，与if和else⼀同使⽤，elif是else if 的简写。

.⽆限循环和for循环：⽆线循环使⽤（while True）终⽌循环在结尾添加关键字break操作步骤：先将所有语句全选在上⽅输⼊ while True:for循环：使⽤的关键字 for in引号：1.单引号和双引号是等价的2.三引号代表多⾏注释3.单⾏注释⽤#号字符串的操作;1.查看⼀个对象有哪些使⽤⽅法，使⽤的关键字为dir()2.字符串⼩写字母变为⼤写字母，使⽤的关键字为upper()3.字符串⼤写字母变为⼩写字母，使⽤的关键字为lower()4.为了证明我们输出的字符串为想要的类型，通过判断的⽅法来证明，正确则判断结果为True 错误则判断结果为 Flase，具体如下：5.字符串以什么开头，使⽤的关键字为startswith("字母")6.字符串以什么结尾，使⽤的关键字为endswith("字母")7.字符串取消空格使⽤关键字strip()具体操作如下：8.字符串的拆分使⽤的关键字为spilt()-----会把字符串的数据类型转化为列表的数据类型9.字符串的合并使⽤的关键字为join() [........]表⽰的是列表的数据类型10.字符串的索引使⽤的关键字index(),索引是从0开始的索引指的是单个字符串的索引11.获取字符串的个数，使⽤的关键字为count()12.字符串的替换，使⽤的关键字为replace()13.判断是否为数字，使⽤的关键字为digit() 所有的都是数字，则判断结果为True 只要其中任意⼀个不是数字，则判断结果为Flase14.对字符串进⾏循环 for循环使⽤的关键字为 for 和 in 将str9的内容赋给item，⼀个⼀个进⾏输出15.数字的循环使⽤的关键字为，range() 其中的数字表⽰范围，只包含开头不包含结尾。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Python学习中你不可不知的Python陷阱（三）Python被誉为全世界高效的编程语言，但是再高效的语言也会存在安全隐患，下面的内容主要给Python学习者科普一些关于安全隐患的知识，直接看文章吧。

临时文件
由于基于临时文件的使用不当导致的漏洞在许多编程语言中皆有出现，而它们在Python 中仍然惊人地常见，因此，在这里值得一提。

这类型的漏洞利用不安全的文件系统访问权限，可能涉及中间步骤，最终导致数据的机密性和完整性问题。

一般问题的详细描述可以在CWE-377找到。

幸运的是，Python 的标准库中自带了tempfile 模块，它提供高层次函数，"以可能的最安全的方式"来创建临时文件名。

注意，有缺陷的tempfile.mktemp 实现，出于向后兼容的原因，它仍然存在于库中。

必须永远不要使用tempfile.mktemp 函数！取而代之，如果你需要在临时文件关闭后进行持久化，那么使用tempfile.TemporaryFile ，或者tempfile.mkstemp 。

另一种偶然引入漏洞的可能性是通过使用shutil.copyfile函数。

这里的问题是，可能以最不安全的方式创建目标文件。

安全意识高的开发者可能会考虑首先将源文件复制到一个随机的临时文件名，然后将临时文件重命名为它最终的名字。

虽然这可能看起来是一个好的方案，但是如果使用shutil.move 函数来进行重命名，那么也是不安全的。

麻烦的是，如果在文件系统，而不是最终文件所在的地方创建临时文件，那么shutil.move 将无法自动地重命名(通过os.rename)，而是默默地求助于不安全的shutil.copy 。

一个处理措施是使用os.rename 而不是shutil.move ，因为os.rename 保证跨文件系统边界的操作会有明确的失败。

进一步的并发症可能会在shutil.copy 不能够拷贝所有的文件元数据的时候出现，可能使得创建的文件不受保护。

不完全是针对Python，当修改非主流类型的文件系统，特别是远程文件系统上的文件时必须小心。

数据一致性保证倾向于在文件访问序列方面不同。

作为一个例子，NFSv2并不遵守open系统调用的O_EXCL标志，而它是原子文件创建的关键。

不安全的反序列化
模板引擎
Web应用作者很早之前就采用了Python。

在十年的过程中，开发了相当多的Web框架。

它们许多都利用了模板引擎来从，嗯，模板和运行时变量生成动态web内容。

除了web应用，模板引擎还渗入到完全不同的软件中，例如Ansible IT 自动化工具。

当内容被静态模板和运行时变量渲染时，会有用户控制的代码通过运行时变量注入的风险。

针对web应用的成功发起攻击可能导致跨站脚本漏洞。

服务器端模板诸如的一般缓解方法是插值到最终文档之前清理模板变量的内容。

清理可以通过拒绝、剥离或者转义那些特定于任何给定的标记或者其他特定领域的语言字符来完成。

不幸的是，这里，模板引擎似乎并没朝着更严格的安全靠近---- 看看最流行的实现，它们都没有默认使用转义机制，而是依赖开发者对风险的意识。