如何去除文档底色部队文档标签

移除HTML标签 ― IT技术 - 赛迪网
移除HTML标签
发布时间: 11:38&&&& 来源:plwww&&&&作者:
方法一 : 禁用HTML 最简单的方法是直接禁用HTML标签而不用移除它们. 可以使用Replace()函数. 例如:
strText = Replace(strText, &script, &script, 1, -1, 1)
或者直接禁用所有的HTML:
strText = Replace(strText, &, &)
这样做虽然很安全,但显得不够友好.(用户提交的文本会变得难以阅读)
方法二: 使用&和& 怎样使得HTML标签从文本中消失呢? 我们可以去掉&和&中间的所有内容
在&#106avascript中这很简单:
function RemoveHTML( strText ) { &var regEx = /&[^&]*&/g; &return strText.replace(regEx, ); }
关于正则表达式可以参考:
/docs/manuals/js/client/jsguide/regexp.htm
现在回到VBScript, 对于Scripting引擎5.0或更高版本(可以通过调用ScriptEngineMajorVersion和ScriptEngineMinorVersion函数来检验版本),我们也可以使用RegExp物体:
Function RemoveHTML( strText ) &Dim RegEx
&Set RegEx = New RegExp
&RegEx.Pattern = &[^&]*& &RegEx.Global = True
&RemoveHTML = RegEx.Replace(strText, ) End Function
若不用正则表达式,下面的函数可以达到同样的目的:
Function RemoveHTML( strText )
&&& Dim nPos1 &&& Dim nPos2 &&&
&&& nPos1 = InStr(strText, &)
&&& Do While nPos1 & 0
&&&&&&& nPos2 = InStr(nPos1 + 1, strText, &)
&&&&&&& If nPos2 & 0 Then
&&&&&&&&&&& strText = Left(strText, nPos1 - 1) & Mid(strText, nPos2 + 1)
&&&&&&& Else
&&&&&&&&&&& Exit Do
&&&&&&& End If
&&&&&&& nPos1 = InStr(strText, &)
&&& RemoveHTML = strText
End Function
以上的方法虽然都可以去掉括号内的HTML标签,但是这些方法都存在以下问题:
首先,文本内的任何不表示HTML的尖括号会被去除.而且两个尖括号中间的文本也会被删掉.换句话说,在文本中插入任何&或&都会出现不可预料的结果.
另外,这种方法不能控制删除哪些HTML标签.比如&b&&i&这些无害的标签通常是允许的.
方法三:使用IE或其他工具 有很多缺点:
It may be desirable to parse HTML files inside a Web server process in response to a browser page request. However, the WebBrowser control, DHTML Editing Control, MSHTML, and other Internet Explorer components may not function properly in an Active Server Pages (ASP) page or other application run in a Web server application. (
/support/kb/articles/Q244/0/85.ASP?LN=EN-US&SD=gn&FR=0
方法四:VBScript 以下的函数可以限制到具体的HTML标签 简介:
要控制被删除的标签列表,可以通过向TAGLIST常数中添加/删除标记来实现. 例如,要保留所有的&B&标签,则从TAGLIST中删除B. 当前的列表包含了MSDN中的所有HTML标签以及 LAYER 标签. 每个标签要用;括起来.
开始标签和结束标签都会被删除,例如&A...&和&/A...&
若标签同时在 TAGLIST 和 BLOCKTAGLIST 常数中,则起始标签和结束标签之间的所有内容都会被删除
没有结束标记的标签不被视为HTML标签,其内容不会被删除
块标签若没有结尾标记,从此标签开始到文本结束的所有内容会被删除
若&!--后跟的字符不是空格,注释标签不会被删除
使用这个函数很简单:
strPlainText = RemoveHTML(strTextWithHTML) 函数内容如下:
Function RemoveHTML( strText ) &&& Dim TAGLIST &&& TAGLIST = ;!--;!DOCTYPE;A;ACRONYM;ADDRESS;APPLET;AREA;B;BASE;BASEFONT; &_ &&&&&&&&&&&&& BGSOUND;BIG;BLOCKQUOTE;BODY;BR;BUTTON;CAPTION;CENTER;CITE;CODE; &_ &&&&&&&&&&&&& COL;COLGROUP;COMMENT;DD;DEL;DFN;DIR;DIV;DL;DT;EM;EMBED;FIELDSET; &_ &&&&&&&&&&&&& FONT;FORM;FRAME;FRAMESET;HEAD;H1;H2;H3;H4;H5;H6;HR;HTML;I;IFRAME;IMG; &_ &&&&&&&&&&&&& INPUT;INS;ISINDEX;KBD;LABEL;LAYER;LAGEND;LI;LINK;LISTING;MAP;MARQUEE; &_ &&&&&&&&&&&&& MENU;META;NOBR;NOFRAMES;NOSCRIPT;OBJECT;OL;OPTION;P;PARAM;PLAINTEXT; &_ &&&&&&&&&&&&& PRE;Q;S;SAMP;SCRIPT;SELECT;SMALL;SPAN;STRIKE;STRONG;STYLE;SUB;SUP; &_ &&&&&&&&&&&&& TABLE;TBODY;TD;TEXTAREA;TFOOT;TH;THEAD;TITLE;TR;TT;U;UL;VAR;WBR;XMP;
&&& Const BLOCKTAGLIST = ;APPLET;EMBED;FRAMESET;HEAD;NOFRAMES;NOSCRIPT;OBJECT;SCRIPT;STYLE; &&&
&&& Dim nPos1 &&& Dim nPos2 &&& Dim nPos3 &&& Dim strResult &&& Dim strTagName &&& Dim bRemove &&& Dim bSearchForBlock &&&
&&& nPos1 = InStr(strText, &) &&& Do While nPos1 & 0 &&&&&&& nPos2 = InStr(nPos1 + 1, strText, &) &&&&&&& If nPos2 & 0 Then &&&&&&&&&&& strTagName = Mid(strText, nPos1 + 1, nPos2 - nPos1 - 1) &&&& strTagName = Replace(Replace(strTagName, vbCr,
&&&&&&&&&&& nPos3 = InStr(strTagName,
) &&&&&&&&&&& If nPos3 & 0 Then &&&&&&&&&&&&&&& strTagName = Left(strTagName, nPos3 - 1) &&&&&&&&&&& End If &&&&&&&&&&&
&&&&&&&&&&& If Left(strTagName, 1) = / Then &&&&&&&&&&&&&&& strTagName = Mid(strTagName, 2) &&&&&&&&&&&&&&& bSearchForBlock = False &&&&&&&&&&& Else &&&&&&&&&&&&&&& bSearchForBlock = True &&&&&&&&&&& End If &&&&&&&&&&&
&&&&&&&&&&& If InStr(1, TAGLIST, ; & strTagName & ;, vbTextCompare) & 0 Then &&&&&&&&&&&&&&& bRemove = True &&&&&&&&&&&&&&& If bSearchForBlock Then &&&&&&&&&&&&&&&&&&& If InStr(1, BLOCKTAGLIST, ; & strTagName & ;, vbTextCompare) & 0 Then &&&&&&&&&&&&&&&&&&&&&&& nPos2 = Len(strText) &&&&&&&&&&&&&&&&&&&&&&& nPos3 = InStr(nPos1 + 1, strText, &/ & strTagName, vbTextCompare) &&&&&&&&&&&&&&&&&&&&&&& If nPos3 & 0 Then &&&&&&&&&&&&&&&&&&&&&&&&&&& nPos3 = InStr(nPos3 + 1, strText, &) &&&&&&&&&&&&&&&&&&&&&&& End If &&&&&&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&&&&&& If nPos3 & 0 Then &&&&&&&&&&&&&&&&&&&&&&&&&&& nPos2 = nPos3 &&&&&&&&&&&&&&&&&&&&&&& End If &&&&&&&&&&&&&&&&&&& End If &&&&&&&&&&&&&&& End If &&&&&&&&&&& Else &&&&&&&&&&&&&&& bRemove = False &&&&&&&&&&& End If &&&&&&&&&&&
&&&&&&&&&&& If bRemove Then &&&&&&&&&&&&&&& strResult = strResult & Left(strText, nPos1 - 1) &&&&&&&&&&&&&&& strText = Mid(strText, nPos2 + 1) &&&&&&&&&&& Else &&&&&&&&&&&&&&& strResult = strResult & Left(strText, nPos1) &&&&&&&&&&&&&&& strText = Mid(strText, nPos1 + 1) &&&&&&&&&&& End If &&&&&&& Else &&&&&&&&&&& strResult = strResult & strText &&&&&&&&&&& strText =
&&&&&&& End If &&&&&&&
&&&&&&& nPos1 = InStr(strText, &) &&& Loop &&& strResult = strResult & strText &&&
&&& RemoveHTML = strResult End Function
[ &] 字体[ &] [ &] [ &] [ &] &[ &]
【相关文章】
【客户需求反馈表】
更多资料 
了解方案 
详细需求信息请在此处填写!如何去除WORD文档中的背景水印
有时我们下载下来的WORD文档打开后存有水印,给我们的使用造成一定的烦恼。下面介绍几种去除它的方法。
一、如果你是用word程序打开的word文档——
有六种方法:
单击格式----背景----水印,弹出对话框,有“文字水印”,“图片水印”和无水印三个选项,按需设置,如果选中无水印,就可以去掉Word背景。
  单击格式——背景——其他颜色、填充效果、水印等,如果是在这里添加的背景,就从相应的选项中去掉word背景。
  在网上复制文本,并粘贴到word后,有时候会发现文字后面有黑色的背景,如何去掉word背景呢?
  首先,复制要用的文本。&然后,点击格式菜单,选择样式和格式项。&之后,点击右侧的“请选择要应用的格式”选项下面的“清除格式”OK。
  word去掉背景还有更简单的方法,就是先将要用的文本粘贴到记事本中,再从记事本中复制到word。这样粘贴过来的就是纯文本文字,不带任何格式背景的。
  由于记事本这类的文字编辑工具仅能接收纯文本信息,因此仅有文字信息被黏贴上,网络的其它格式将被过滤掉,然后再从纯文本编辑工具中将需要的文字拷贝,黏贴至word文档中进行重新排版。
  word去掉背景颜色,还可以通过“编辑”菜单,选择“选择性粘贴”然后选择“无格式文本”也是可行的。
  选定需要修改的部分——格式——边框和底纹——底纹选项卡——填充选择无填充色,
图案:式样选择清除,应用范围选择文字或/段落(看实际情况)——确定。
  页眉和页脚多是插入广告的电话和地址的地方,单击视图——页眉和页脚,弹出菜单,单击“显示/隐藏文档文字”,背景图片就会显示出来,将其删掉即可。
&&二、如果你是用wps程序打开的word文档——
第一步:首先利用WPS文字工具打开这份Word文档,然后在菜单中依次选择“视图→页眉页脚”命令。
第二步:接着把鼠标移动到水印上,当出现十字星时,单击一下鼠标左键将它选中,最后再点击一下鼠标右键,选择“剪切”命令便大功告成了。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。去除PDF文档中的链接、背景或水印
&有些PDF文档带有隐藏的URL链接,这些链接有的在图片下,有的在文字中,有的可能在空白处,不小心点到了,就打开个网页,令人不悦。
根据个人经历,有志者在此提供以下去除方法,首先使用Adobe Acrobat打开待处理PDF文档。
【去除超级链接的方法】
方法一:菜单“工具(T)”-”高级编辑(A)“-”TouchUp对象工具(O)“,选了它之后,用鼠标选定那些待删除链接的方框,删除之,直至文档中所有待去除的都被搞定之后,保存文档即可。该方法肯定有效。
方法二:菜单“高级(A)”-“文档处理(D)”-“删除所有网络链接(R)”。该方法主要应用于明显链接的文档,比较隐蔽的估计搞不定,建议采用方法一。
【编辑超级链接的方法】
菜单“工具(T)”-”高级编辑(A)“-“链接工具(N)”,双击要编辑项目,根据弹出对话框提示进行设置即可。
【去除背景的方法】
如果去除PDF文档的背景,可以通过菜单“文档”-“背景”-“删除”搞定;
【去除水印的方法】
如果去除的是水印,则是菜单“文档”-“水印”-“删除”搞定。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。}

我要回帖

更多关于 如何去除文档底色 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信