"""
正则表达式
"""
"""
re.match 函数
原形:match(pattern, string, flags=0)
pattern:匹配的正则表达式
string:要匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,值如下:
re.I 忽略大小写
re.L 做本地户识别
re.M 多行匹配,影响^和¥
re.S 是.匹配包括换行符在内的所有字符
re.U 根据Unicode字符集解析字符,影响\W \w \B \b
re.X 使我们以更灵活的格式理解正则表达式
参数:
功能:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,返回None
"""
# www.baidu.com
import re
a = re.match('www', 'www.baidu.com')
print(re.match('www', 'www.baidu.com')) # <re.Match object; span=(0, 3), match='www'>
print(re.match('www', 'ww.baidu.com')) # None
print(re.match('www', 'baidu.wwwcom')) # None
print(re.match('www', 'wwW.baidu.com')) # None
print(re.match('www', 'wwW.baidu.com', flags=re.I)) # <re.Match object; span=(0, 3), match='wwW'>
print(a.span()) # (0, 3)
print('------------------------------------------------------------------------------')
# 扫描整个字符串,返回从起始位置成功的匹配
"""
re.search()函数
原形:search(pattern, string, flags=0)
pattern:匹配的正则表达式
string:要匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,值如下:
功能:扫描整个字符串,并返回第一个成功的匹配
"""
print(re.search('sunck', 'good man is sunck!sunck is nice')) # <re.Match object; span=(12, 17), match='sunck'>
"""
re.findall()函数
原形:findall(pattern, string, flags=0)
pattern:匹配的正则表达式
string:要匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,值如下:
功能:扫描整个字符串,并返回第一个成功的匹配
"""
print(re.findall('sunck', 'good man is sunck!sunck is nice')) # ['sunck', 'sunck']
print('----------------------------------匹配单个字符与数字-----------------------------------')
"""
r
. 匹配除换行符以外的任意字符
[0123456789] 匹配单个数字,[]是字符集合,表示匹配方括号中所包含的任意一个字符
[sunck] 匹配's' ‘u' 'n' 'c' 'k'中任意一个字符
[a-z] 匹配任意小写字母
[A-Z] 匹配任意大写字母
[0-9] 匹配任意数字
[0-9a-zA-Z] 匹配任意字母和数字
[0-9a-zA-Z_] 匹配任意字母和数字和下划线
[^sunck] 匹配除了's' 'u' 'n' 'c' 'k'这几个字母以外的所有字符,中括号的^称为脱字符,表示不匹配集合中的字符
[^0-9] 匹配所有的非数字字符
\d 匹配数字,效果通[0-9]
\D 匹配非数字字符,效果同[^0-9]
\w 匹配数字、字母和下划线,效果同[0-9a-zA-Z_]
\W 匹配非数字,字母和下划线,效果同[^0-9a-zA-Z_]
\s 匹配任意的空白字符(空格、回车、换页、制表符、)[ \f\n\t\r]
\S 匹配任意的非空白符[^ \f\n\t\r]
"""
print(re.search('.', 'sunck is a good man')) # <re.Match object; span=(0, 1), match='s'>
print(re.search('[0123456789]', 'sunck is a good man 6')) # <re.Match object; span=(20, 21), match='6'>
print(re.findall('.', '.abc.s/dedf$%Ew-ty#@!*()')) # ['.', 'a', 'b', 'c', '.', 's', '/', 'd', 'e', 'd', 'f', '$', '%', 'E', 'w', '-', 't', 'y', '#', '@', '!', '*', '(', ')']
print('----------------------------------锚字符(边界字符)-----------------------------------')
"""
^ 行首匹配,和在[]里的^不是一个意思
$ 行尾匹配
\A 匹配字符串开始,它和^的区别是,\A只匹配整个字符串的开头,即使在re.Mm模式下也不会匹配其他行的行首
\Z 匹配字符串结束,它和$的区别是,\Z只匹配整个字符串的结束,即使在re.Mm模式下也不会匹配其他行的行尾
\b 匹配一个单词的边界,也就是指单词和空格间的位置
\B 匹配非单词的边界
"""
b = re.search('boy$', 'sunck is a good boy')
print(re.search('^sunck', 'sunck is a good boy')) # <re.Match object; span=(0, 5), match='sunck'>
print(re.search('^sunck$', 'sunck is a good boy')) # None
print(re.search('boy$', 'sunck is a good boy')) # <re.Match object; span=(16, 19), match='boy'>
print(b.span()) # (16, 19)
print(re.findall('^sunck', 'sunck is a good boy\nsunck is a bad man',re.M)) # ['sunck', 'sunck']
print(re.findall('\Asunck', 'sunck is a good boy\nsunck is a bad man')) # ['sunck']
print(re.search(r'er\b','server is server '))
print('----------------------------------匹配多个字符-----------------------------------')
"""
说明:下方的x,y,z均为假设的普通字符吗,不是正则表达式的元字符
(xyz) 匹配小括号内的xyz(作为一个整体去匹配)
x? 匹配0个或者1个x,非贪婪匹配(尽可能少的匹配)
x* 匹配0个或者多个x,贪婪匹配(尽可能多的匹配)
.* 匹配0个或者任意多个字符(换行符除外)
x+ 匹配至少一个x,贪婪匹配
x{n} 匹配确定的n个x(n是一个非负整数)
x{n,} 匹配至少n个x
x{n,m} 匹配至少n个x,最多m个x,n<=m
x|y 匹配x或y,|表示或
"""
print(re.findall(r'(sunck)','sunckgood is a godo man,sunck is a boy')) # ['sunck', 'sunck']
print(re.findall(r'(.*)','sunckgood is a godo man,sunck is a boy'))
print(re.findall(r'(a.*)','aaaaaabaacaaaa'))
print(re.findall(r'(a*)','aaaaaabaacaaaa'))
print(re.findall(r'(a+)','aaaaaabaacaaaa'))
print(re.findall((r'a{2}'),'aaaaaabaacaaaa'))
print(re.findall((r'a{3,}'),'aaaaaabaacaaaa'))
print(re.findall((r'a{3,6}'),'aaaaaabaacaaaa'))
print(re.findall(r'((s|S)unck)','sunck is Sunck'))
print(re.findall(r'(^sunckgood is a godo man,sunck is a boy.*)$','sunckgood is a godo man,sunck is a boy'))
print('----------------------------------特殊-----------------------------------')
"""
说明:下方的x,y,z均为假设的普通字符吗,不是正则表达式的元字符
x? +? *? 最小匹配,通常都是尽可能多的匹配,可以使用这种方式来解决贪婪匹配
"""
# /* part1 */ /* part2 */
print(re.findall(r'(//*.*/*/)','/* part1 */ /* part2 */')) # ['/* part1 */ /* part2 */']
print(re.findall(r'(//*.*?/*/)','/* part1 */ /* part2 */')) # ['/* part1 */', '/* part2 */']
近期热议
推荐标签 标签
-
Hibernate
39 引用 • 103 回帖 • 705 关注
Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。
-
新人
52 引用 • 228 回帖
让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
新手上路,请谨慎驾驶! -
Laravel
20 引用 • 23 回帖 • 723 关注
Laravel 是一套简洁、优雅的 PHP Web 开发框架。它采用 MVC 设计,是一款崇尚开发效率的全栈框架。
-
阿里云
89 引用 • 345 回帖
阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。
-
支付宝
29 引用 • 347 回帖
支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。
-
安装
132 引用 • 1184 回帖
你若安好,便是晴天。
-
TensorFlow
20 引用 • 19 回帖
TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。
-
Kubernetes
110 引用 • 54 回帖 • 3 关注
Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。
-
酷鸟浏览器
3 引用 • 59 回帖 • 31 关注
安全 · 稳定 · 快速
为跨境从业人员提供专业的跨境浏览器 -
深度学习
52 引用 • 40 回帖
深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。
-
服务器
124 引用 • 580 回帖 • 1 关注
服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。
-
Electron
15 引用 • 136 回帖 • 1 关注
Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。
-
CSS
197 引用 • 547 回帖 • 1 关注
CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。
-
CodeMirror
1 引用 • 2 回帖 • 126 关注
- 30Seconds
-
倾城之链
23 引用 • 66 回帖 • 138 关注
-
游戏
176 引用 • 815 回帖
沉迷游戏伤身,强撸灰飞烟灭。
-
设计模式
200 引用 • 120 回帖 • 1 关注
设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。
-
机器学习
83 引用 • 37 回帖 • 1 关注
机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
-
书籍
77 引用 • 390 回帖
宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”
-
Ant-Design
17 引用 • 23 回帖
Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。
-
Ngui
7 引用 • 9 回帖 • 388 关注
Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。 -
VirtualBox
10 引用 • 2 回帖 • 12 关注
VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。
-
前端
247 引用 • 1347 回帖
前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。
-
C
85 引用 • 165 回帖
C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。
-
Wide
30 引用 • 218 回帖 • 625 关注
Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。
欢迎访问我们运维的实例: https://wide.b3log.org
-
WebSocket
48 引用 • 206 回帖 • 346 关注
WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于