百科狗-知识改变命运!
--

Python高效率的技巧

梵高1年前 (2023-11-21)阅读数 14#技术干货
文章标签内存

你估计已经看了不少关于Python技巧的文章,里面可能会提到变量拆包(unpacking)、局部函数等,但是Python还有很多不为人知的高效用法,等待着被人发现。本文将介绍作者纵观全网之后,都属于很少没提及的技巧。

清理字符串输入

清理用户输入的问题,几乎适用于我们可能编写的每个程序。通常将字符转换为小写或大写就足够了,这时只需要使用正则即可,但是对于复杂的情况,有一种更好的方法:

user_input="This\nstringhas\tsomewhitespaces...\r\n"

character_map={

ord('\n'):'',

ord('\t'):'',

ord('\r'):None

}

user_input.translate(character_map)#Thisstringhassomewhitespaces..."

在上述示例中,可以看到空格符“\n”和“\t”已被单个空格替换,而“\r”已被完全删除。这是一个简单的示例,但是我们可以更进一步,使用unicodedata包及其combining()函数生成范围更广的映射表,从字符串中删除所有重音符号。

迭代器切片

如果您尝试获取迭代器的切片,系统会报TypeError,提示生成器对象不可下标,但是解决方案很简单:

importitertools

s=itertools.islice(range(50),10,20)#

forvalins:

...

使用itertools.islice,我们可以创建一个islice对象,该对象是产生所需元素的迭代器。不过,请务必注意,这会消耗所有生成器项,直到切片开始为止,而且还会消耗我们的“islice”对象中的所有项。

Usingitertools.islicewecancreateaisliceobjectwhichisaniteratorthatproducesdesireditems.It'simportanttonotethough,thatthisconsumesallgeneratoritemsupuntilthestartofsliceandalsoalltheitemsinourisliceobject.

跳过可迭代对象的开始

有时候需要处理的文件里,明确存在一些不需要的数据行,但是我们不确定数量,比如说代码中的注释。这时,itertools再次为我们提供了简洁的方案:

string_from_file="""

//Author:...

//License:...

//

//Date:...

Actualcontent...

"""

importitertools

forlineinitertools.dropwhile(lambdaline:line.startswith("//"),string_from_file.split("\n")):

print(line)

这段代码仅在初始注释部分之后,才会产生数据行。如果我们只想在迭代器的开头丢弃数据,而又不知道有具体数量时,这个方法很有用。

仅带关键字参数(kwargs)的函数

有时候,使用仅支持关键字参数的函数可以让代码更加清晰易懂:

deftest(*,a,b):

pass

test("valuefora","valueforb")#TypeError:test()takes0positionalarguments...

test(a="value",b="value2")#Works...

只需要在关键字参数前面再加一个*参数,就可以轻松实现了。当然,如果还希望再加上位置参数,可以在*参数前面再增加。

创建支持with语句的对象

我们都知道如何打开文件或使用with语句获取锁,但是怎样自己可以实现类似的功能呢?一般来说,我们可以使用__enter__和__exit__方法来实现上下文管理器协议:

classConnection:

def__init__(self):

...

def__enter__(self):

#Initializeconnection...

def__exit__(self,type,value,traceback):

#Closeconnection...

withConnection()asc:

#__enter__()executes

...

#conn.__exit__()executes

上面是最常见的实现方式,但是还有一种更简单的方法:

fromcontextlibimportcontextmanager

@contextmanager

deftag(name):

print(f"")

yield

print(f"")

withtag("h1"):

print("ThisisTitle.")

上面的代码段使用contextmanager管理器装饰器实现了内容管理协议。进入“with”块时,执行“tag”函数的第一部分(在“yield”之前),然后执行yield,最后执行其余部分。

用__slots__节省内存

如果程序需要创建大量的类实例,我们会发现程序占用了大量内存。这是因为Python使用字典来表示类实例的属性,这样的话创建速度很快,但是很耗内存。如果内存是你需要考虑的一个问题,那么可以考虑使用__slots__:

classPerson:

__slots__=["first_name","last_name","phone"]

def__init__(self,first_name,last_name,phone):

self.first_name=first_name

self.last_name=last_name

self.phone=phone

当我们定义__slots__属性时,Python会使用固定大小的数组(占用内存少)来存储属性,而不是字典,这大大减少了每个实例所需的内存。不过使用__slots__还有一些缺点:无法声明任何新属性,我们只能使用__slots__中的那些属性。同样,带有__slots__的类不能使用多重继承。

限制CPU和内存使用量

如果不是想优化程序内存或CPU使用率,而是想直接将其限制为某个数值,那么Python也有一个可以满足要求的库:

importsignal

importresource

importos

#ToLimitCPUtime

deftime_exceeded(signo,frame):

print("CPUexceeded...")

raiseSystemExit(1)

defset_max_runtime(seconds):

#Installthesignalhandlerandsetaresourcelimit

soft,hard=resource.getrlimit(resource.RLIMIT_CPU)

resource.setrlimit(resource.RLIMIT_CPU,(seconds,hard))

signal.signal(signal.SIGXCPU,time_exceeded)

#Tolimitmemoryusage

Python高效率的技巧

defset_max_memory(size):

soft,hard=resource.getrlimit(resource.RLIMIT_AS)

resource.setrlimit(resource.RLIMIT_AS,(size,hard))

在这里,我们可以设置了最大cpu运行时间以及最大内存使用限制的两个选项。对于cpu限制,我们首先获得该特定资源(RLIMIT_CPU)的软限制和硬限制,然后使用参数指定的秒数和先前获取的硬限制来设置。

最后,我们注册了一个在超过CPU时间后,让系统退出的信号。至于内存,我们再次获取软限制和硬限制,并使用带有大小参数的setrlimit和硬限制完成配置

控制导入的内容

某些语言提供了导出成员(变量,方法,接口)的显式机制,例如Golang,它仅导出以大写字母开头的成员。但是在Python中,所有对象都会导出,除非我们使用__all__:

deffoo():

pass

defbar():

pass

__all__=["bar"]

上面的代码段中,只会导出bar函数。另外,如果__all__的值为空,那么不会导出任何函数,而且在导入该模块时系统会报AttributeError。

实现比较运算符

如果我们要逐一为某个类实现所有的比较运算符,你肯定会觉得很麻烦,因为要实现的方法还不少,有__lt__,__le__,__gt__,和__ge__。

其实,Python提供了一种便捷的实现方式,就是通过functools.total_ordering装饰器。

fromfunctoolsimporttotal_ordering

@total_ordering

classNumber:

def__init__(self,value):

self.value=value

def__lt__(self,other):

returnself.valueNumber(3))

print(Number(1)=Number(15))

print(Number(10)

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)