一、Sir学**正则表达式和Word通配符也是机缘巧合,当时Sir想电脑里成千上万随意存放的文件分门别类的归纳整理,因此知道了正则表达式(亲们可自行百度脑补)的存在。后来,Sir又萌生了利用正则表达式进行规范试卷标点符号的想法(试题来源不同标点符号存在差异),也因此知道了Word通配符查找替换功能,还掌握得比较熟练。
二、任务要求:还是原来那位仁兄的需求,从Word提取建造行业数以10万计的联系方式。联系方式的格式除下图呈现的形式外,四个信息类别的表达形式复杂多样。如第一行单位,可能是甲方单位,可能是设计方单位,建造方单位等。
三、任务规划
一开始Sir还是打算使用自己擅长的通配符的办法来提取,但是提取过程遇到了问题,代码明明没有任何问题,但是匹配结果却只返回前9个,后来发现是文档存在某些问题。另外使用通配符匹配的速度相对较慢,因为示例Word文档达250页,需要提取的文档数也有两百多个。 因此转用正则表达式的办法。
四、关键代码
(1)Word通配符法
(2)正则表达式法
通配符虽然在效率、灵活性也不及正则表达式,但胜在可以直接替换Word文档内的内容和格式。
六、最后想说的话,实战是提高VBA水平的捷径,即日起,不定期更新实战例子。有定制服务需求的或是需要系统学**、拜Sir为师的随时欢迎。
本文系作者NextSeven原创,转载请注明出处。未经作者允许,请勿用于商业用途
联系客服