fteair 发表于 2020-6-4 14:21:37

最近用到的正则表达式

最近修改过滤html不必要的内容,查了一些正则表达式
sc.Add(@"\s?class=\w+");//去掉class
sc.Add(@"\s+style='[^']+'");//去掉样式

sc.Add(@"<(meta|link|/?o:|/?style|/?font|/?strong|/?st\d|/?head|/?html|body|/?body|/?span|!\[)[^>]*?>");去掉标签
sc.Add(@"(?i)height[=:]\s*['""]?[^""';\s]+[""';]?");//去掉高
sc.Add(@"(?i)width[=:]\s*['""]?[^""';\s]+["";]?");//去掉宽

sc.Add(@"/\n[\s| | ]*\r/g");//去掉空行

张兴康 发表于 2020-6-4 15:30:55

{:soso__6926956990947316134_2:}

张兴康 发表于 2020-6-4 15:34:52

{:soso__16324640235148804817_2:}

fteair 发表于 2020-6-7 14:23:52

张兴康 发表于 2017-8-4 15:30


{:3_47:}{:3_47:}

fteair 发表于 2020-6-7 14:28:57

张兴康 发表于 2017-8-4 15:34


{:3_47:}{:3_47:}
页: [1]
查看完整版本: 最近用到的正则表达式