百科狗-知识改变命运!
--

python中的反斜杠

是丫丫呀1年前 (2023-11-21)阅读数 46#技术干货
文章标签斜杠

使用python写字符串常量时,rawstring是个很好用的东东,比如在C里我要写一个Windows下的路径,得这么

写:

char*path="C:\\mydir\\myfile.txt";

用"\\"来转义成一个反斜杠字符。而在python下用rawstring就不用这么麻烦了:

path=r"C:\mydir\myfile.txt"

一个r搞定,是不是很简单?

真的这么简单吗?未必。试试如果要指定一个目录名呢?

>>>path=r"C:\mydir\mysubdir\"

File"",line1

path=r"C:\mydir\mysubdir\"

^

SyntaxError:EOLwhilescanningsingle-quotedstring

出错了吧。

这是一个常见的陷阱,在使用rawstring时,反斜杠虽然不再做转义用,但它仍然保留了一部分“魔力”——保护字符串。如>>>printr"abc\"xyz"abc\"xyz

在反斜杠之后的那个引号由于反斜杠的魔力,不被视为字符串终结。那么对应到开头那个路径r"C:\mydir\mysubdir\",最后那个引号也是由于反斜杠的魔力,不被视为终结,python认为其后应该还有东西,结果没有,就报错了。

那岂不是用rawstring写Windows路径就很不方便了吗?

答案是:rawstring本来就不是为了方便写Windows路径而设计的,而是为了方便写正则表达式设计的。在正则表达式中,反斜杠是转义字符,因此不可能出现以反斜杠结尾的正则表达式。

Windows路径的“正统”写法应该是:

path=os.path.normcase("c:/mydir/mysubdir/")

os.path.normcase在Windows平台下会自动把正斜杠转换成反斜杠。

由于正则表达式使用反斜杠来转义特殊字符,而python自身处理字符串时,反斜杠也是用于转义字符,这样就产生了一个双重转换的问题,要匹配字符串中1个反斜杠应该怎么写正则表达式?"\\",这样行吗?试试就知道了,re模块抛异常了,因为"\\"就是一个反斜杠,对于正则表达式解析器来说,是一个转义字符,但是后面啥也没有,自然就报错了,"\\\"三个肯定是不行的,试试四个"\\\\",完美匹配。

viewplaincopytoclipboardprint?

importre

re_str_patt="\\\\"

reObj=re.compile(re_str_patt)

str_test="abc\\cd\\hh"

printreObj.findall(str_test)

importre

re_str_patt="\\\\"

reObj=re.compile(re_str_patt)

str_test="abc\\cd\\hh"

printreObj.findall(str_test)

输出:['\\','\\']

这里要这么理解,首先第一重转换是字符串自身的转义,那么"\\\\",实际上就是表示两个反斜杠(两个字符),然后传入正则表达式解析器,因为反斜杠依然是转义字符,那么进行第二重转换,两个反斜杠就代表一个反斜杠,所以就能和一个反斜杠进行匹配了,那么匹配连续的两个反斜杠,写正则表达式时就要写8次"\"了,相当壮观,要匹配/d+(这个在正则表达式里面表示连续1一个以上的数字字符)这个字符串怎么写呢?

viewplaincopytoclipboardprint?

importre

re_str_patt="\\\\d\\+"

printre_str_patt

reObj=re.compile(re_str_patt)

python中的反斜杠

printreObj.findall("\\d+")

importre

re_str_patt="\\\\d\\+"

printre_str_patt

reObj=re.compile(re_str_patt)

printreObj.findall("\\d+")

写成re_str_patt="\\\\d\+"也行,因为\+对于字符串来说,没有转义意义,所以就当成一个反斜杠了。

在python中写正则表达式时用得最多的是raw字符串,原生字符串,什么意思?就是只有一重转换了,没有字符串转换了,只在正则表达式内部进行转换了,这样匹配一个反斜杠的正则表达式可以这样写,re_str_patt=r"\\",有人会想,以后写windows的文件路径什么的方便了,呵呵直接path=r"c:\myforder\xx"搞定,是的,这句没有问题,但是如果你写成path=r"c:\myforder\xx\",直接报错了,为什么?因为反斜杠虽然不作为转义字符了,但是还是对它后面的引号(包括单引号)有影响,使这个引号不被视为字符串的终止,以为它后面还有字符,但是实际没有,因此会报错。其实可以反过来想raw字符串里面要表示引号怎么办呢?,可以发现path=r"\\123\"xxx"是可以的,那用raw字符串岂不是有局限性?不过raw在设计之初就是用来支持正则表达式的,而在正则里面反斜杠是转义字符,所以不可能出现在字符串的末尾的,所以建议不要图方便在其他的地方使用raw。

以上内容为大家介绍了python中的反斜杠,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注IT培训机构:开发教育。http://www.baikegou.com/

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)