百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

regexp正则,用“\K”一键“断舍离”,精准捕获目标数据

lipiwang 2025-06-12 13:56 5 浏览 0 评论

正则表达式的基础外壳函数(wps版):

REGEXP函数是基于正则表达式,对复杂文本进行匹配、提取和替换的函数。


基本语法结构:

REGEXP(原始字符串,正则表达式,[匹配模式],[替换内容])


匹配模式是可选项,0或忽略表示提取,1表示判断是否包含,2表示替换。

替换内容是可选项,仅在匹配模式为2时有效,用来替换匹配的内容。


我们通过编写不同的正则表达式来实现不同的复杂需求



\K在正则表达式中是用来重置匹配的起始点的,也就是说,在\K之前的内容虽然会被匹配,但不会被包含在最终的匹配结果里。这有点像正向预查,但不同的是\K允许后面的内容被捕获。


比如,用正则表达式12\K3d来匹配"123d",结果会是"3d",因为12被\K之前的匹配消耗了,但不在最终结果里。



我们用一个案例深入理解。


如下图所示:

A2单元格内有若干行生产数据记录。每行数据的格式均为:

mm-dd hh:mm:ss 数量 /出口或进口。注: 黄色底色部分均有一个空格。


现在我们想要统计出4月14日8点~10点之间的所有产量数量记录。



我们会在接下来的正则表达式的输入过程中使用到“\K”这个符号。它在我们这个案例效果的实现过程当中起到画龙点睛的作用。



首先我们确定月与日:

=REGEXP(A2,"04-14")


因为我们要统计4月14日的产量记录,4月14日在数据源中的呈现格式为“04-14”。


目前所有4月14日的生产记录就都被提取出来了。



接下来我们确定小时:

=REGEXP(A2,"04-14 (08|09):")


因为我们要统计的是8点~10点之间的产量记录,所以小时数不是08就是09,我们用正则表达式“(08|09):”表示。


|:表示逻辑或的意思。

( ):表示捕获分组。

(08|09)::小时数是8点或9点的(注意后面加个冒号:,起始位置加个空格,保持与数据源格式一致)


目前所有4月14日小时数位于08~09的生产记录就都被提取出来了。



继续确定分钟与秒数:

=REGEXP(A2,"04-14 (08|09):\d{2}:\d{2}")


分钟与秒数均是两位数字格式的。


\d:表示任意的数字

{2}:表示精确前面元素2次。

\d{2}:表示任意的2位数字。


将\d{2}与\d{2}用冒号:连接起来表示分秒格式。


目前所有4月14日小时数位于08~09的带分秒数据的生产记录就都被提取出来了。



最后确定产量数量数据:

=REGEXP(A2,"04-14 (08|09):\d{2}:\d{2} \d+")


\d+:表示任意的1位或多位数字。


目前所有4月14日小时数位于08~09的带分秒带产量的生产记录就都被提取出来了。




铺垫了这么长,最后要的点睛之笔要来了


因为我们最终匹配的只是产量数值\d+,它前面的04-14 (08|09):\d{2}:\d{2},也就是mm-dd hh:mm:ss 部分我们不需要:

=REGEXP(A2,"04-14 (08|09):\d{2}:\d{2} \K\d+")


所以只需要在\d+前面加上\K重置匹配的起始点,即\d+前面匹配都的内容不用显示,只需要显示K\后面的\d+(产量值数量)。


注意:\K前面有一个空格,严格与数据源格式一致。


相关推荐

软件测试|MySQL CROSS JOIN:交叉连接的详细解析

简介在MySQL数据库中,CROSSJOIN是一种用于生成两个或多个表的笛卡尔积的连接方法。CROSSJOIN不需要任何连接条件,它将左表的每一行与右表的每一行进行组合,从而生成一个包含所...

「MySQL笔记」left join-on-and 与 left join-on-where 的区别

1.摘要关于这两种写法的重要知识点摘要如下:left-join时,即使有相同的查询条件,二者的查询结果集也不同,原因是优先级导致的,on的优先级比where高on-and是进行韦恩运算连接...

MySQL中的JOIN——联合查询的基本语法

MySQL中的JOIN指令用来将两个或多个表中的数据进行联合查询,根据连接条件来匹配记录,从而得到需要的结果集。在MySQL中,常见的JOIN类型包括INNERJOIN、LEFTJOIN和RIGH...

MySQL 中的 CROSS JOIN:强大的连接工具

CROSSJOIN在MySQL里是一种挺特别的连接操作,它能弄出连接表的笛卡尔积。这就是说,要是表A有m行,表B有n行,那ACROSSJOINB的结果就会有m*n...

大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?

大厂必问:MySQL三表JOIN操作的解析与性能优化策略,效率又如何?点击关注,开启技术之旅!大家好,这里是互联网技术学堂,无论你是一名程序员、设计师、还是对技术充满好奇心的普通人,都欢迎你加入...

面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)

MySQL的JOIN查询优化是提升数据库性能的关键环节。以下是综合多个技术文档的核心优化策略,按优先级和实现难度分类:一、索引优化:性能提升的基础为连接字段建立索引确保参与JOIN的列(通常...

Flink中处理维表关联技术实现路径

在Flink中处理维表关联大体氛围TableSQLLookupJoin和DataStream算子函数,主要技术实现路径:I.FlinkSQL/TableAPI中的Lookup...

深入剖析Zookeeper原理(一)整体设计

1.ZK集群架构设计与特性1.ZK集群架构设计:ZK主要分为三种角色:Leader(领导者):一个Zookeeper集群同一时间只会有一个实际工作的Leader,它会发起并维护与各Follwer及...

多种负载均衡算法及其Java代码实现

首先给大家介绍下什么是负载均衡负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。负载均衡,英...

一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?

1.概念ribbon是一款客户端负载均衡器,用于微服务之间的负载均衡。首先,什么是客户端负载均衡?如图,ribbon可以通过注册中心获取服务列表,然后自己执行自己的负载均衡策略来决定要访问哪个微服务,...

Step by Step之腾讯云短信-验证码实践

在商城小程序和前端上线用了一阵子之后,用户提出了体验提升的需求,如忘记密码、绑定用户、快捷注册等,作为业界最佳实践的短信验证码登录、重置密码和注册等功能开发也就提上日程了,本文就以重置密码为例,将验证...

10分钟入门响应式:Springboot整合kafka实现reactive

Springboot引入Reactor已经有一段时间了,笔者潜伏在各种技术群里暗中观察发现,好像scala圈子的同仁们,似乎对响应式更热衷一点。也许是因为他们对fp理解的更深吧,所以领悟起来障碍性更少...

使用java随机生成有个性的用户名,LOL地名+水浒传,合计2808个

*随机生成用户名*取水浒传108好汉名字*取LOL地名26个,组合而成*一共可以生成2808个不同特色的用户名如果你在上网的时候,用户名难取的话,这里有很多可选择的用户名,现提供100个...

深入理解Math.random()的概率分布特性

直接上源码/***Returnsa{@codedouble}valuewithapositivesign,*返回一个带符号的double类型的数字,说人话就是返回一个非负...

编程英文 - 创建/生成/构建 (create/generate/build)

在软件开发中,create、generate和build这三个词经常被用到,它们都与"创造"或"产生"某些东西有关,但在具体使用场景和含义上有所不同。基本含义creat...

取消回复欢迎 发表评论: