函数公式、职场模板 、财务应用、分析图表、练习题、财务机器人、快捷键、软件工具、表格合并、图表及可视化、Office 365、Power Query、表格美化、符号作用、生成序列、条件格式、学会骗、一本不正经、避坑指南、数据整理、筛选技巧、日期时间、偷懒宝典、漂亮3D、WPS技巧、PPT技巧、Word技巧
👆点击查看分类专题👆
👇点击查看最新文章👇
双十一来了,偷懒系列图书3.7折起
非常划算!
应用场景:
马上半期考试了,英语老师布置了作业,要孩子们默写1-5单元的英文单词。需要将单词表转成默写样式。
本文操作要求:
将单词表快速整理为默写题,即:
删除汉字前的英文部分,并在后面添加横线
最终效果如下图所示。
操作步骤
一、获取单词表
打开国家中小学智慧教育平台,
在教材栏目将学科选为英语,再选择年级、版本
打开英语教材,复制课本附录的单词表,粘贴到Word。
二、批量删除页码
先总结规律:
页码都是" P.2"这种格式,后面跟一个手动换行符。
非常有规律,因而,可以用Word的查找替换功能来删除。
查找:
p.[0-9]{1,2}^l
替换为:
^13
解释:
p. 这部分匹配字母 " p" 后跟一个句点。
[0-9]{1,2} [0-9]
表示匹配任意一个数字(0到9之间的任何数字)。{1,2}
表示前面的数字可以重复1到2次。因此,它可以匹配一个或两个数字。
^l 这部分是一个特殊字符,表示匹配一个手动换行符。在Word中,段落标记用 "^p" 表示, "^l" 表示手动换行符。
因此,这个正则表达式的完整含义是:查找在文档中以 " p." 开头,后面跟着一个或两个数字,然后是一个手动换行符的字符串。
^13和^p都表示段落标记【选中“使用通配符”复选框时,^p在“查找内容”框中无效】
删除页码后如下图:
红色箭头处的手动换行符需删除,以将下面的行提上来。为避免将小节Unit1等删除,换行符前面不能是数字。
查找栏输入:
[!0-9]^l
解释:
[!0-9] 这部分表示匹配任意一个不是数字(0到9之外的字符)。方括号内的 ^
符号在这里表示取非,即匹配不是0到9之间的任何一个字符。
因此,这个表达式的完整含义是:查找手动换行符(排除掉前面是数字的)。
替换栏为空表示删除。
三、删除汉字前的字母及符号
查找栏输入:
[^13^l][a-zA-TV-Z]{1,}*([一-龟]{1,}*[一-龟) ]{1,})^13
解释:
[^13^l] 段落标记或手动换行符。
[a-zA-TV-Z]{1,} 这部分表示匹配一个或多个英文字母,不区分大小写。a-z
匹配小写字母,A-Z
匹配大写字母。但考虑到要排除Unit1、Unit2等,故将U排除,写为A-TV-Z。
{1,} 表示一个以上
[一-龟] 包括一到龟的所有汉字。【具体解释参见下面的链接】。
[一-龟) ] 包括一到龟的所有汉字、右括号、空格。
* 星号表示任意字符。
( ) 表示分组,以方便在替换栏使用。在替换栏可用\1表示查找栏的第一组括号的内容。\2表示第二组括号的内容。
扩展阅读:
因此,这个表达式的完整含义是:查找在文档中,一行中以英文开头中间有多个字母符号,一直到汉字,汉字中间可以有其他字符。然后提取汉字及其之间的内容。
替换栏输入:
^13\1____________________^13
解释:
^13 表示段落标记(换行符)
\1 表示查找栏第一组括号的内容。
需点击全部替换两次。
替换后效果
如果希望替换后,后面的下划线要对齐的话,可以先选定所有行,再插入制表符。然后查找替换。
只是替换栏的表达式要改为:
^13\1^t____________________^13
^t 表示制表符。
操作演示:
当然,你也可以复制到Excel中,用公式来完成:
=MID(A2,MATCH(1=1,MID(A2,ROW($A$1:$A$99),1)>"吖",0),999)&REPT("_",20)
公式解释:
这个公式是用来从A2单元格中提取第一个汉字之后的内容,并在提取的内容后面添加20个下划线。下面逐步解释这个公式的每个部分:
MID(A2, ROW($A$1:$A$99), 1)
这部分首先将A2单元格中的字符串拆分为单个字符。ROW($A$1:$A$99)
生成一个1到99的序列(这个序列代表了A列的行数),MID(A2, ROW($A$1:$A$99), 1)
则会在每一行中提取A2单元格中对应位置的一个字符。
MID(A2, ROW($A$1:$A$99), 1)>"吖"
这部分将上一步提取的字符与汉字"吖"进行比较。这样,比"吖"大的字符将被识别为第一个汉字。
MATCH(1=1, ..., 0)
这部分使用MATCH函数来查找第一个满足条件(大于"吖"的字符)的位置。1=1
始终为真,所以它实际上是在查找第一个大于"吖"的字符所在的位置。
MID(A2, ..., 99)
这部分使用MID函数提取从上一步找到的位置开始,之后的99个字符。这就是第一个汉字之后的内容。
&REPT("_", 20)
这部分将上一步提取的内容与20个下划线连接在一起,形成最终的结果。REPT("_", 20)
会生成一个包含20个下划线的文本。
本文收录于Word合集:
如需加入RPA群,请备注RPA
如需加入图表群,请备注图表
联系客服