ASP.NET中输入文本的HTML解析办法

网页中用TextBox让用户输入文本,然后存入数据库,再从数据库中读出显示在页面上。常常这样做会遇到不少问题,因为TextBox实际上是一个Windows组件,和网页显示标记如:

 1<p>,<td>,<div>等,对字符的解析方法是不同的。比如前者的换行标记为“\r\n”,而后者为“<br/>”。这就带来一个转换的问题。 
 2
 3在做转换之前,先来考虑几个问题: 
 4
 51、 TextBox用“\r\n”来标记换行而网页中以“<br/>”标记 
 6
 72、 网页中连续的空格当做一个空格处理,比如“a b c”将会显示“a b c” 
 8
 93、 用户输入特殊字符比如:“&lt;”,“&amp;”,“ ”,“&lt;”,这些都是网页中有特殊意义的字符,会被解析,而用户输入的目的当然是不希望被解析。 
10
11现在来解决这几个问题,有一种解决办法是在显示的时候仍然用TextBox去显示,这样就不用做任何转换,只要把TextBox.ReadOnly设为true,这样在一定程度上能满足要求。但是往往为了网页的美观,这样做是不可取的。比较好的办法是去解析用户输入的字符串,可以做这样的转换: 
12
13第一步: 
14
15“&lt;” à“&lt;” 
16
17“&amp;” à“&amp;” 
18
19“ ”à“&amp;nbsp;” 
20
21……(此处的省略号后文有说明) 
22
23第二步: 
24
25“ ” à“ ” 
26
27“\r\n” à“<br/>” 
28
29这里必须分两步转换,因为如果你先做第二步转换的话混把用户输入的特殊字符串和由转换而的的特殊字符串混淆,比如: 
30
31用户输入:a b c d 
32
33第二步转换:a b   c d 
34
35第一步转换:a&amp;nbsp;b&amp;nbsp;&amp;nbsp;&amp;nbsp;c&amp;nbsp;d 
36
37可以看到,经过第一次转换后已经无法分辨用户输入的“ ”和转换而来的“ ”,在做第二次转换的时候就会统一处理就会出错。结果显示:a b   c d 
38
39如果严格按照第一步,第二步的转换顺序来转换就不会出现这个问题。 
40
41把转换后的字符串存入数据库,在显示的时候直接把从数据库读出的字符串给HTML组件赋值,比如: 
42
43//这里假设temp是从数据库中读出来的,这里演示Table和HtmlTable其他的控件类似 
44
45//显示的效果是:&lt;a b 
46
47//Table1是Web控件 
48
49String temp = “&lt;a b”; 
50
51Table1.Rows[0].Cells[0].Text = temp; 
52
53//Table2是HTML控件 
54
55Table2.Rows[0].Cells[0].InnerHtml = temp; 
56
57本新闻共  2  页,当前在第  1  页  1  2</div></td></p>
Published At
Categories with Web编程
Tagged with
comments powered by Disqus