打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
如何用正则表达式去掉HTML标签
如何用正则表达式去掉HTML标签[问题点数:40分]
hjsx007
(hjsx007)
等 级:
结帖率:0.00%
楼主发表于:2009-12-28 20:30:33
关键业务能部署云计算吗? 什么是AppUp云服务? 什么是打造云平台的关键? 什么是打造云平台的关键? 云计算面临的安全问题有哪些?
我现在做一个网站,新闻文字内容从数据库中content列(自己建的)读出,但content中有诸如<p></p><span></span>等html标签,而新闻字数又是只能显示前面一部分的,需要截取,只有替换掉这些标签截取的才是字符,不然例如截取到地20个字符恰好是"<"的话,显示出来就不是文字了,要在后台把这些符号替换掉,怎么办呀?大侠们……
alifriend
(波导终结者)
等 级:
5
4
#1楼 得分:0回复于:2009-12-28 20:35:52
C# code
(<=\<.+\>)[^\<]+(=\</.+\>)
取出标签中的内容,试试
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:数据库类的扩展:数据库的建立和表的建立
wuyq11
(人生如梦)
等 级:
3
21
3
更多勋章
#2楼 得分:0回复于:2009-12-28 20:35:58
string str=System.Text.RegularExpressions.Regex.Replace("", @"<[^>]*>", "");
Htmlstring = Regex.Replace(Htmlstring, @" <script[^>]*?>.*? </script>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @" <(.[^>]*)>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:[攒分贴]用c#读取并分析sql2005日志
wxg22526451
(旋风)
等 级:
#3楼 得分:0回复于:2009-12-28 20:39:44
C# code
/// <Header> /// 去除 HTML tag /// </Header> /// <param name="HTML">源</param> /// <returns>结果</returns> public static string StripHTML(string HTML) //google "StripHTML" 得到{ string[] Regexs = { @"<script[^>]*?>.*?</script>", @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>", @"([\r\n])[\s]+", @"&(quot|#34);", @"&(amp|#38);", @"&(lt|#60);", @"&(gt|#62);", @"&(nbsp|#160);", @"&(iexcl|#161);", @"&(cent|#162);", @"&(pound|#163);", @"&(copy|#169);", @"&#(\d+);", @"-->", @"<!--.*\n" }; string[] Replaces = { "", "", "", "\"", "&", "<", ">", " ", "\xa1", //chr(161), "\xa2", //chr(162), "\xa3", //chr(163), "\xa9", //chr(169), "", "\r\n", "" }; string s = HTML; for (int i = 0; i < Regexs.Length; i++) { s = new Regex(Regexs[i], RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s, Replaces[i]); } s.Replace("<", ""); s.Replace(">", ""); s.Replace("\r\n", ""); return s; } }
http://hi.baidu.com/linsen309/blog/item/0ec5eb241cbc55348644f9ee.html
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:请问如何在代码中实现SQL中的触发器
backslash
(Kevin)
等 级:
#4楼 得分:0回复于:2011-08-25 13:01:13
是了wxg22526451的方法,wxg22526451 v5
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:[攒分贴]每日小知识-sql获取第n行
wq664646973
(wq664646973)
等 级:
#5楼 得分:0回复于:2011-08-25 13:53:14
string regexstr = @"<[^>]*>";
, context = Regex.Replace(contextregexstr, string.Empty, RegexOptions.IgnoreCase);
context = context.Replace("&nbsp;", "");
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:再发两个SQL语句效率,附执行时间图
xm900608
(xm900608)
等 级:
#6楼 得分:0回复于:2011-08-30 14:47:49
wq664646973 顶 很好用
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
C#抓取网页内容常用类
去掉所有的Html代码 直接调用StripHTML方法就行了
C#去除字符串中的HTML,效果就像将HTML复制到记事本一样
清除html 标签
C#过滤Html标记
正则表达式过滤Html标签
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服