python 正则表达式

本贴最后更新于 1110 天前,其中的信息可能已经斗转星移
""" 正则表达式 """ """ re.match 函数 原形:match(pattern, string, flags=0) pattern:匹配的正则表达式 string:要匹配的字符串 flags:标志位,用于控制正则表达式的匹配方式,值如下: re.I 忽略大小写 re.L 做本地户识别 re.M 多行匹配,影响^和¥ re.S 是.匹配包括换行符在内的所有字符 re.U 根据Unicode字符集解析字符,影响\W \w \B \b re.X 使我们以更灵活的格式理解正则表达式 参数: 功能:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,返回None """ # www.baidu.com import re a = re.match('www', 'www.baidu.com') print(re.match('www', 'www.baidu.com')) # <re.Match object; span=(0, 3), match='www'> print(re.match('www', 'ww.baidu.com')) # None print(re.match('www', 'baidu.wwwcom')) # None print(re.match('www', 'wwW.baidu.com')) # None print(re.match('www', 'wwW.baidu.com', flags=re.I)) # <re.Match object; span=(0, 3), match='wwW'> print(a.span()) # (0, 3) print('------------------------------------------------------------------------------') # 扫描整个字符串,返回从起始位置成功的匹配 """ re.search()函数 原形:search(pattern, string, flags=0) pattern:匹配的正则表达式 string:要匹配的字符串 flags:标志位,用于控制正则表达式的匹配方式,值如下: 功能:扫描整个字符串,并返回第一个成功的匹配 """ print(re.search('sunck', 'good man is sunck!sunck is nice')) # <re.Match object; span=(12, 17), match='sunck'> """ re.findall()函数 原形:findall(pattern, string, flags=0) pattern:匹配的正则表达式 string:要匹配的字符串 flags:标志位,用于控制正则表达式的匹配方式,值如下: 功能:扫描整个字符串,并返回第一个成功的匹配 """ print(re.findall('sunck', 'good man is sunck!sunck is nice')) # ['sunck', 'sunck'] print('----------------------------------匹配单个字符与数字-----------------------------------') """ r . 匹配除换行符以外的任意字符 [0123456789] 匹配单个数字,[]是字符集合,表示匹配方括号中所包含的任意一个字符 [sunck] 匹配's' ‘u' 'n' 'c' 'k'中任意一个字符 [a-z] 匹配任意小写字母 [A-Z] 匹配任意大写字母 [0-9] 匹配任意数字 [0-9a-zA-Z] 匹配任意字母和数字 [0-9a-zA-Z_] 匹配任意字母和数字和下划线 [^sunck] 匹配除了's' 'u' 'n' 'c' 'k'这几个字母以外的所有字符,中括号的^称为脱字符,表示不匹配集合中的字符 [^0-9] 匹配所有的非数字字符 \d 匹配数字,效果通[0-9] \D 匹配非数字字符,效果同[^0-9] \w 匹配数字、字母和下划线,效果同[0-9a-zA-Z_] \W 匹配非数字,字母和下划线,效果同[^0-9a-zA-Z_] \s 匹配任意的空白字符(空格、回车、换页、制表符、)[ \f\n\t\r] \S 匹配任意的非空白符[^ \f\n\t\r] """ print(re.search('.', 'sunck is a good man')) # <re.Match object; span=(0, 1), match='s'> print(re.search('[0123456789]', 'sunck is a good man 6')) # <re.Match object; span=(20, 21), match='6'> print(re.findall('.', '.abc.s/dedf$%Ew-ty#@!*()')) # ['.', 'a', 'b', 'c', '.', 's', '/', 'd', 'e', 'd', 'f', '$', '%', 'E', 'w', '-', 't', 'y', '#', '@', '!', '*', '(', ')'] print('----------------------------------锚字符(边界字符)-----------------------------------') """ ^ 行首匹配,和在[]里的^不是一个意思 $ 行尾匹配 \A 匹配字符串开始,它和^的区别是,\A只匹配整个字符串的开头,即使在re.Mm模式下也不会匹配其他行的行首 \Z 匹配字符串结束,它和$的区别是,\Z只匹配整个字符串的结束,即使在re.Mm模式下也不会匹配其他行的行尾 \b 匹配一个单词的边界,也就是指单词和空格间的位置 \B 匹配非单词的边界 """ b = re.search('boy$', 'sunck is a good boy') print(re.search('^sunck', 'sunck is a good boy')) # <re.Match object; span=(0, 5), match='sunck'> print(re.search('^sunck$', 'sunck is a good boy')) # None print(re.search('boy$', 'sunck is a good boy')) # <re.Match object; span=(16, 19), match='boy'> print(b.span()) # (16, 19) print(re.findall('^sunck', 'sunck is a good boy\nsunck is a bad man',re.M)) # ['sunck', 'sunck'] print(re.findall('\Asunck', 'sunck is a good boy\nsunck is a bad man')) # ['sunck'] print(re.search(r'er\b','server is server ')) print('----------------------------------匹配多个字符-----------------------------------') """ 说明:下方的x,y,z均为假设的普通字符吗,不是正则表达式的元字符 (xyz) 匹配小括号内的xyz(作为一个整体去匹配) x? 匹配0个或者1个x,非贪婪匹配(尽可能少的匹配) x* 匹配0个或者多个x,贪婪匹配(尽可能多的匹配) .* 匹配0个或者任意多个字符(换行符除外) x+ 匹配至少一个x,贪婪匹配 x{n} 匹配确定的n个x(n是一个非负整数) x{n,} 匹配至少n个x x{n,m} 匹配至少n个x,最多m个x,n<=m x|y 匹配x或y,|表示或 """ print(re.findall(r'(sunck)','sunckgood is a godo man,sunck is a boy')) # ['sunck', 'sunck'] print(re.findall(r'(.*)','sunckgood is a godo man,sunck is a boy')) print(re.findall(r'(a.*)','aaaaaabaacaaaa')) print(re.findall(r'(a*)','aaaaaabaacaaaa')) print(re.findall(r'(a+)','aaaaaabaacaaaa')) print(re.findall((r'a{2}'),'aaaaaabaacaaaa')) print(re.findall((r'a{3,}'),'aaaaaabaacaaaa')) print(re.findall((r'a{3,6}'),'aaaaaabaacaaaa')) print(re.findall(r'((s|S)unck)','sunck is Sunck')) print(re.findall(r'(^sunckgood is a godo man,sunck is a boy.*)$','sunckgood is a godo man,sunck is a boy')) print('----------------------------------特殊-----------------------------------') """ 说明:下方的x,y,z均为假设的普通字符吗,不是正则表达式的元字符 x? +? *? 最小匹配,通常都是尽可能多的匹配,可以使用这种方式来解决贪婪匹配 """ # /* part1 */ /* part2 */ print(re.findall(r'(//*.*/*/)','/* part1 */ /* part2 */')) # ['/* part1 */ /* part2 */'] print(re.findall(r'(//*.*?/*/)','/* part1 */ /* part2 */')) # ['/* part1 */', '/* part2 */']
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    556 引用 • 675 回帖
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 智能合约

    智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。

    1 引用 • 11 回帖 • 1 关注
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    107 引用 • 127 回帖 • 341 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    95 引用 • 901 回帖
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 290 关注
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    325 引用 • 1395 回帖 • 1 关注
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    498 引用 • 1395 回帖 • 249 关注
  • OnlyOffice
    4 引用 • 21 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 75 关注
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 36 关注
  • Hprose

    Hprose 是一款先进的轻量级、跨语言、跨平台、无侵入式、高性能动态远程对象调用引擎库。它不仅简单易用,而且功能强大。你无需专门学习,只需看上几眼,就能用它轻松构建分布式应用系统。

    9 引用 • 17 回帖 • 629 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    411 引用 • 3588 回帖
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 668 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 592 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    42 引用 • 130 回帖 • 247 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 2 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    143 引用 • 442 回帖 • 1 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    431 引用 • 1250 回帖 • 596 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 568 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 575 关注
  • Anytype
    3 引用 • 31 回帖 • 12 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 786 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 637 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 5 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 461 关注
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖 • 1 关注
  • Word
    13 引用 • 40 回帖
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖