"""
正则表达式
"""
"""
re.match 函数
原形:match(pattern, string, flags=0)
pattern:匹配的正则表达式
string:要匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,值如下:
re.I 忽略大小写
re.L 做本地户识别
re.M 多行匹配,影响^和¥
re.S 是.匹配包括换行符在内的所有字符
re.U 根据Unicode字符集解析字符,影响\W \w \B \b
re.X 使我们以更灵活的格式理解正则表达式
参数:
功能:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,返回None
"""
# www.baidu.com
import re
a = re.match('www', 'www.baidu.com')
print(re.match('www', 'www.baidu.com')) # <re.Match object; span=(0, 3), match='www'>
print(re.match('www', 'ww.baidu.com')) # None
print(re.match('www', 'baidu.wwwcom')) # None
print(re.match('www', 'wwW.baidu.com')) # None
print(re.match('www', 'wwW.baidu.com', flags=re.I)) # <re.Match object; span=(0, 3), match='wwW'>
print(a.span()) # (0, 3)
print('------------------------------------------------------------------------------')
# 扫描整个字符串,返回从起始位置成功的匹配
"""
re.search()函数
原形:search(pattern, string, flags=0)
pattern:匹配的正则表达式
string:要匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,值如下:
功能:扫描整个字符串,并返回第一个成功的匹配
"""
print(re.search('sunck', 'good man is sunck!sunck is nice')) # <re.Match object; span=(12, 17), match='sunck'>
"""
re.findall()函数
原形:findall(pattern, string, flags=0)
pattern:匹配的正则表达式
string:要匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,值如下:
功能:扫描整个字符串,并返回第一个成功的匹配
"""
print(re.findall('sunck', 'good man is sunck!sunck is nice')) # ['sunck', 'sunck']
print('----------------------------------匹配单个字符与数字-----------------------------------')
"""
r
. 匹配除换行符以外的任意字符
[0123456789] 匹配单个数字,[]是字符集合,表示匹配方括号中所包含的任意一个字符
[sunck] 匹配's' ‘u' 'n' 'c' 'k'中任意一个字符
[a-z] 匹配任意小写字母
[A-Z] 匹配任意大写字母
[0-9] 匹配任意数字
[0-9a-zA-Z] 匹配任意字母和数字
[0-9a-zA-Z_] 匹配任意字母和数字和下划线
[^sunck] 匹配除了's' 'u' 'n' 'c' 'k'这几个字母以外的所有字符,中括号的^称为脱字符,表示不匹配集合中的字符
[^0-9] 匹配所有的非数字字符
\d 匹配数字,效果通[0-9]
\D 匹配非数字字符,效果同[^0-9]
\w 匹配数字、字母和下划线,效果同[0-9a-zA-Z_]
\W 匹配非数字,字母和下划线,效果同[^0-9a-zA-Z_]
\s 匹配任意的空白字符(空格、回车、换页、制表符、)[ \f\n\t\r]
\S 匹配任意的非空白符[^ \f\n\t\r]
"""
print(re.search('.', 'sunck is a good man')) # <re.Match object; span=(0, 1), match='s'>
print(re.search('[0123456789]', 'sunck is a good man 6')) # <re.Match object; span=(20, 21), match='6'>
print(re.findall('.', '.abc.s/dedf$%Ew-ty#@!*()')) # ['.', 'a', 'b', 'c', '.', 's', '/', 'd', 'e', 'd', 'f', '$', '%', 'E', 'w', '-', 't', 'y', '#', '@', '!', '*', '(', ')']
print('----------------------------------锚字符(边界字符)-----------------------------------')
"""
^ 行首匹配,和在[]里的^不是一个意思
$ 行尾匹配
\A 匹配字符串开始,它和^的区别是,\A只匹配整个字符串的开头,即使在re.Mm模式下也不会匹配其他行的行首
\Z 匹配字符串结束,它和$的区别是,\Z只匹配整个字符串的结束,即使在re.Mm模式下也不会匹配其他行的行尾
\b 匹配一个单词的边界,也就是指单词和空格间的位置
\B 匹配非单词的边界
"""
b = re.search('boy$', 'sunck is a good boy')
print(re.search('^sunck', 'sunck is a good boy')) # <re.Match object; span=(0, 5), match='sunck'>
print(re.search('^sunck$', 'sunck is a good boy')) # None
print(re.search('boy$', 'sunck is a good boy')) # <re.Match object; span=(16, 19), match='boy'>
print(b.span()) # (16, 19)
print(re.findall('^sunck', 'sunck is a good boy\nsunck is a bad man',re.M)) # ['sunck', 'sunck']
print(re.findall('\Asunck', 'sunck is a good boy\nsunck is a bad man')) # ['sunck']
print(re.search(r'er\b','server is server '))
print('----------------------------------匹配多个字符-----------------------------------')
"""
说明:下方的x,y,z均为假设的普通字符吗,不是正则表达式的元字符
(xyz) 匹配小括号内的xyz(作为一个整体去匹配)
x? 匹配0个或者1个x,非贪婪匹配(尽可能少的匹配)
x* 匹配0个或者多个x,贪婪匹配(尽可能多的匹配)
.* 匹配0个或者任意多个字符(换行符除外)
x+ 匹配至少一个x,贪婪匹配
x{n} 匹配确定的n个x(n是一个非负整数)
x{n,} 匹配至少n个x
x{n,m} 匹配至少n个x,最多m个x,n<=m
x|y 匹配x或y,|表示或
"""
print(re.findall(r'(sunck)','sunckgood is a godo man,sunck is a boy')) # ['sunck', 'sunck']
print(re.findall(r'(.*)','sunckgood is a godo man,sunck is a boy'))
print(re.findall(r'(a.*)','aaaaaabaacaaaa'))
print(re.findall(r'(a*)','aaaaaabaacaaaa'))
print(re.findall(r'(a+)','aaaaaabaacaaaa'))
print(re.findall((r'a{2}'),'aaaaaabaacaaaa'))
print(re.findall((r'a{3,}'),'aaaaaabaacaaaa'))
print(re.findall((r'a{3,6}'),'aaaaaabaacaaaa'))
print(re.findall(r'((s|S)unck)','sunck is Sunck'))
print(re.findall(r'(^sunckgood is a godo man,sunck is a boy.*)$','sunckgood is a godo man,sunck is a boy'))
print('----------------------------------特殊-----------------------------------')
"""
说明:下方的x,y,z均为假设的普通字符吗,不是正则表达式的元字符
x? +? *? 最小匹配,通常都是尽可能多的匹配,可以使用这种方式来解决贪婪匹配
"""
# /* part1 */ /* part2 */
print(re.findall(r'(//*.*/*/)','/* part1 */ /* part2 */')) # ['/* part1 */ /* part2 */']
print(re.findall(r'(//*.*?/*/)','/* part1 */ /* part2 */')) # ['/* part1 */', '/* part2 */']
近期热议
推荐标签 标签
-
工具
288 引用 • 734 回帖
子曰:“工欲善其事,必先利其器。”
-
PostgreSQL
22 引用 • 22 回帖
PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。
-
分享
248 引用 • 1795 回帖
有什么新发现就分享给大家吧!
- Solo
-
SpaceVim
3 引用 • 31 回帖 • 105 关注
SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
即用的 Vim-IDE。 -
jsoup
6 引用 • 1 回帖 • 484 关注
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。
-
爬虫
106 引用 • 275 回帖 • 1 关注
网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。
-
Gzip
9 引用 • 12 回帖 • 147 关注
gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。
-
Typecho
12 引用 • 65 回帖 • 445 关注
Typecho 是一款博客程序,它在 GPLv2 许可证下发行,基于 PHP 构建,可以运行在各种平台上,支持多种数据库(MySQL、PostgreSQL、SQLite)。
-
七牛云
27 引用 • 225 回帖 • 163 关注
七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。
-
996
13 引用 • 200 回帖 • 10 关注
-
Flume
9 引用 • 6 回帖 • 637 关注
Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。
-
V2Ray
1 引用 • 15 回帖 • 1 关注
-
TGIF
288 引用 • 4485 回帖 • 663 关注
Thank God It's Friday! 感谢老天,总算到星期五啦!
-
智能合约
1 引用 • 11 回帖 • 2 关注
智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。
-
Caddy
12 引用 • 54 回帖 • 159 关注
Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。
-
Docker
492 引用 • 926 回帖
Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。
-
反馈
123 引用 • 913 回帖 • 250 关注
Communication channel for makers and users.
-
NetBeans
78 引用 • 102 回帖 • 683 关注
NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。
-
Kubernetes
110 引用 • 54 回帖 • 1 关注
Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。
-
阿里云
89 引用 • 345 回帖
阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。
-
CSS
196 引用 • 540 回帖 • 1 关注
CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。
-
区块链
91 引用 • 751 回帖 • 1 关注
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。
-
SVN
29 引用 • 98 回帖 • 694 关注
SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。
-
SEO
35 引用 • 200 回帖 • 27 关注
发布对别人有帮助的原创内容是最好的 SEO 方式。
-
Electron
15 引用 • 136 回帖
Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。
-
Hibernate
39 引用 • 103 回帖 • 715 关注
Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于