利用正则表达式将字符串分组示例代码
2019/6/29 21:01:16
本文主要是介绍利用正则表达式将字符串分组示例代码,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
前言
最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:
一、实际上可以借助itertools模块的groupby()方法来处理:
import itertools Str = '122333<<<<' Lst = [] for key,group in itertools.groupby(s): Lst.append(list(group)) print map(lambda x: ''.join(x), Lst)
上面的处理,还是比较有技巧,也能得到想要的输出结果
['1', '22', '333', '<<<<']
二、但更酷点,更技巧处理方式是用正则表达式来处理:
import re Str = '122333<<<<' Lst = [] Pat = re.compile(r'((.)\2*)') Rst = [x[0] for x in re.findall(Pat, Str)] print Rst
备注:
1. (.) # .匹配任意字符;(.)做分组,方便后面反向引用
2. \2* # \2对里面括号的反向引用;*代表是0个到多个;
3. ((.)\2*) # 连起来就是任意一个或多个字符组成的分组;
4. (.)\1* # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对找一找教程网的支持。
这篇关于利用正则表达式将字符串分组示例代码的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-01-0939. 干货系列从零用Rust编写负载均衡及代理,正则及格式替换
- 2024-01-08如何编写高效的正则表达式?
- 2023-12-29"Matlab中的正则表达式:强大而灵活的工具"
- 2023-09-30这个正则 为啥同样的单号第二个就提取不出来?
- 2023-06-086.2 re 正则表达式
- 2023-06-06将字符串里的\x01,\x02这些替换掉用正则表达式无效?
- 2023-05-24正则表达式详解
- 2023-05-17我让gpt写了一段正则表达式代码,可是运行报错,可以帮忙看看哪里出了问题?
- 2023-04-27我要提取text4文本中的邮箱号 正则应该怎么写?
- 2023-04-15bash shell 无法使用 perl 正则