python小例子之删除文本标签

发布时间:2017-09-03 12:32:35 作者:上海宙翔货物运输代理有限公司
python小例子之删除文本标签

Python 练习册,每天一个小程序

问题描述:

我们在网上下载或者复制别人代码的时候经常会遇到下载的代码中包含行数标签的情况。如下图:

这些代码中包含着行数如1.,2.等,如果我们想直接运行或者copy代码需要自己手动的删除这些标签。既然学了python,采集软件,我们写一段脚本来处理它吧。

思路分析:

首先,我们逐行的读取文本。

利用正则表达式,可以顺利地匹配出所有的这些标签以及后面跟随的“ ”,正则表达式为:“d+. ”。

接着我们将匹配的结果在这一行中删除它,使用string模块的replace方法,将匹配的结果用‘’代替。

最后,我们保存每次删除了行数标签的结果行,然后将这些行写入原文本。注意,以w的方式打开文本会删除原文本内容。

代码:

# -*- coding:utf-8 -*- import re import os import sys reload(sys) sys.setdefaultencoding('utf-8') ls = os.linesep label_regex = r'd+. ' content = [] for line in open('source.txt', 'r'): mm = re.search(label_regex, line) if mm: mm = mm.group() content.append(line.replace(mm, '').rstrip()) else: break f = open('source.txt', 'w') f.writelines(['%s%s' % (x,ls) for x in content])

结果:

企业建站2800元起,携手武汉肥猫科技,做一个有见地的颜值派!更多优惠请戳:恩施SEO http://enshi.4567w.com

  • 上一篇:独家专供:PHP的URL验证正则算法,有史以来最强悍的
  • 下一篇:最后一页
  •