** 字符串的使用
一、标记 **
标记(tokenizing)是从文本中提取具体内容的过程。
下面的代码从句子中提取单词,并把它们输出到控制台。
class mytokenizing
{
static void Main(string[ ] args)
{
string mystring="I like this food,are you?";
char[] separators={' ',',','?',':','!'};
int startpos=0;
int endpos=0;
do
{
endpos=mystring.IndexOfAny(separators,startpos);
if ( endpos==-1 ) endpos=mystring.Length;
if ( endpos!=startpos )
Console.WriteLine(mystring.Substring( startpos,(endpos-startpos)));
startpos=(endpos+1);
}while(startpos
1<mystring.length); );="" )方法为数组中的元素重新排序。="" **="" ;="" []="" aaaaaaaa,bbbbbbbb,cccccc="" are="" args)="" array.reverse(mychars);="" char[]="" class="" console.writeline(mychars);="" console.writeline(mystring);="" const="" dddddddd,eeeeeeee,ffffff="" food="" gggggggg,hhhhhhhh,iiiiii="" i="" jjjjjjjj,kkkkkkkk,llllll="" like="" main(string="" mychars="mystring.ToCharArray(" myname="test.txt" myprocessfile="" myreverse="" mystring="你们好" readline="File.OpenRead(myName);" readline;="" readlinesreader="new" readlinesreader.basestream.seek(0,seekorigin.begin);="" sb;="" static="" stream="" streamreader="" streamreader(readline,encoding.unicode);="" string="" stringbuilder="" textwirter="" this="" void="" while(readlinesreader.peek()="" writeline="Console.Out;" writeline;="" you="" {="" }="" 三、字符串的插入、删除和替换="" 下面代码加载数据并处理数据的测试工具。测试结果发送给控制台。="" 二、颠倒字符串次序="" 任何继承于array的类都能利用reverse(="" 示例文件test.txt为字符串的来源。下面代码以unicode格式读取文本。确保文件保存为读取时的格式。例如记事本允许将代码保存为unicode:="" <="输出">-1)
2{
3sb=new StringBuilder(readLineSReader.ReadLine());
4//插入字符串操作语句如:sb.Append(",123");
5Console.WriteLine(sb.ToString());
6}
7}
8}
9
10在结尾添加一列内容:
11//displays aaaaaaaa,bbbbbbbb,cccccc,xxxxx
12//......
13sb.Append(",xxxxx");
14
15第一列可以使用下面的代码删除:
16//displays bbbbbbbb,cccccc
17//......
18sb.Remove(0,sb.ToString().IndexOf(',')+1);
19
20替换分隔符:
21//aaaaaaaa+bbbbbbbb+cccccc
22sb.Replace(',','+');
23
24添加行号(lineNumber已经在前面某处声明过为前提):
25sb.Insert(0,lineNumber.ToString("000 "));
26lineNumber++;
27
28//displays
29//000 aaaaaaaa,bbbbbbbb,cccccc
30//001 dddddddd,eeeeeeee,ffffff
31//002 gggggggg,hhhhhhhh,iiiiii
32//003 jjjjjjjj,kkkkkkkk,llllll
33
3413:16 | 评论 (0)
35
362004年7月11日 #
37
38## 字符串操作学习笔记
39
40**字符串操作**
41
42
43* * *
44
45** 1、从字符串中提取子串 **
46StringBuilder 类没有支持子串的方法,因此必须用String类来提取。
47string mystring="My name is ynn.";
48//Displays "name is ynn."
49Console.WriteLine(mystring.Substring( 3 ));
50//Displays "ynn"
51Console.WriteLine(mystring.Substring( 11,3 ));
52
53** 2、比较字符串 **
54String 类有四种方法:Compare( )、CompareTo( )、CompareOrdinal( )、Equals( )。
55Compare( )方法是CompareTo( )方法的静态版本。只要使用“=”运算符,就会调用Equals( )方法,的以Equals( )方法与“=”是等价的。CompareOrdinal( )方法对两个字符串比较不考本地语言与文件。
56示例:
57int result;
58bool bresult;
59s1="aaaa";
60s2="bbbb";
61//Compare( )method
62//result值为“0”表示等,小于零表示 s1 < s2,大于零表示 s1 > s2
63result=String.Compare(s1,s2);
64result=s1.CompareTo( s2 );
65result=String.CompareOrdinal(s1,s2);
66bresult=s1.Equals( s2 );
67bresult=String.Equals( s1,s2 );
68一个例外情况是,两个字符串都是内置的,并相等,静态方法要快得多。
69
70**3、字符串格式化**
71
72** 3.1 格式化数字 **
73格式字符 说明和关联属性
74
75
76* * *
77
78c、C 货币格式。
79d、D 十进制格式。
80e、E 科学计数(指数)格式。
81f、F 固定点格式。
82g、G 常规格式。
83n、N 数字格式。
84r、R 往返格式,确保将已转换成字符串的数字转换回数字时具有与原数字相同的值。
85x、X 十六进制格式。
86
87
88* * *
89
90double val=Math.PI;
91Console.WriteLine(val.ToString( )); //displays 3.14159265358979
92Console.WriteLine(val.ToString("E"));//displays 3.141593E+000
93Console.WriteLine(val.ToString("F3");//displays 3.142
94int val=65535;
95Console.WriteLine(val.ToString("x")); //displays ffff
96Console.WriteLine(val.ToString("X")); //displays FFFF
97Single val=0.123F;
98Console.WriteLine(val.ToString("p")); //displays 12.30 %
99Console.WriteLine(val.ToString("p1")); //displays 12.3 %
100默认格式化会在数字和百分号之间放入一个空格。定制方法如下:
101其中NumberFormatInfo类是System.Globalization命名空间的一个成员,因此该命名空间必须导入到程序中。
102Single val=0.123F;
103object myobj=NumberFormatInfo.CurrentInfo.Clone( ) as NumberFormatInfo;
104NumberFormatInfo myformat=myobj as NumberFormatInfo;
105myformat.PercentPositivePattern=1;
106Console.WriteLine(val.ToString("p",myformat)); //displays 12.30%;
107Console.WriteLine(val.ToString("p1",myformat)); //displays 12.3%;
108格式化具有很大的灵活性。下面的例子演示一个没有意义的货币结构:
109double val=1234567.89;
110int [] groupsize={2,1,3};
111object myobj=NumberFormatInfo.CurrentInfo.Clone( );
112NumberFormatInfo mycurrency=myobj as NumberFormatInfo;
113mycurrency.CurrencySymbol="#"; //符号
114mycurrency.CurrencyDecimalSeparator=":"; //小数点
115mycurrency.CurrencyGroupSeparator="_"; //分隔符
116mycurrency.CurrencyGroupSizes=groupsize;
117// 输出 #1_234_5_67:89
118Console.WriteLine(val.ToString("C",mycurrency));
119
120** 3.2 格式化日期
121** 输出形式取决于用户计算机的文化设置。
122using System;
123using System.Globalization;
124public class MainClass
125{
126public static void Main(string[] args)
127{
128DateTime dt = DateTime.Now;
129String[] format = {"d","D","f","F","g","G","m","r","s","t", "T","u", "U","y","dddd, MMMM dd yyyy","ddd, MMM d \"'\"yy","dddd, MMMM dd","M/yy","dd-MM-yy",};
130String date;
131for (int i = 0; i < format.Length; i++)
132{
133date = dt.ToString(format[i], DateTimeFormatInfo.InvariantInfo);
134Console.WriteLine(String.Concat(format[i], " :" , date));
135}
136}
137}
138d :07/11/2004 <=======输出
139D :Sunday, 11 July 2004
140f :Sunday, 11 July 2004 10:52
141F :Sunday, 11 July 2004 10:52:36
142g :07/11/2004 10:52
143G :07/11/2004 10:52:36
144m :July 11
145r :Sun, 11 Jul 2004 10:52:36 GMT
146s :2004-07-11T10:52:36
147t :10:52
148T :10:52:36
149u :2004-07-11 10:52:36Z
150U :Sunday, 11 July 2004 02:52:36
151y :2004 July
152dddd, MMMM dd yyyy :Sunday, July 11 2004
153ddd, MMM d "'"yy :Sun, Jul 11 '04
154dddd, MMMM dd :Sunday, July 11
155M/yy :7/04
156dd-MM-yy :11-07-04
157
158** 3.3 格式化枚举
159** enum classmen
160{
161ynn=1,
162yly=2,
163css=3,
164C++=4
165}
166获取枚举字符串信息如下:
167classmen myclassmen=classmen.yly;
168Console.WriteLine(myclassmen.ToString( )); //displays yly
169Console.WriteLine(myclassmen.ToString("d")); //displays 2
170从系统枚举中获取文本人信息如下:
171DayOfWeek day=DayOfWeek.Friday;
172//displays "Day is Friday"
173Console.WriteLine(String.Format("Day is {0:G}",day));
174格式化字符串“ G ”把枚举显示为一个字符串。
175
17611:56 | 评论 (0)
177
1782004年7月8日 #
179
180## StringBuilder 类学习笔记
181
182String类的不可改变性使它更像一个值类型而不是一个引用类型。其副作用是每次执行字符操作时,都会创建一个新的String对象。StringBuilder 类解决了对字符串进行重复修改的过程中创建大量对象的问题。
183
184** StringBuilder 类的一些属性与方法 **
185
186
187* * *
188
189
190**Length** 属性并不是只读的。
191StringBuilder sb=new StringBuilder("I live the language");
192Console.WriteLine(sb.ToString( ));
193sb.Length = 6;
194//Displays "I live"
195Console.WriteLine(sb.ToString( ));
196
197**Capacity** 属性
198描述:当前为实例分配的字符数量。默认容量是16,如果将一个字符串作为参数提供给构造函数,容量以最接近 2 的幂的值。
199
200**MaxCapacity** 属性
201描述:这个实例中可以被分配的字符最大数量。
202
203**Append( )** 方法
204描述:追加给定值的字符串表示。
205StringBuilder sb=new StringBuilder( );
206Console.WriteLine( sb.Capacity+"\t"+sb.Length );
207sb.Append ( 'a' , 17 )
208Console.WriteLine( sb.Capacity+"\t"+sb.Length );
20916 0 <== 输出
21032 17
211
212**EnsureCapacity( Int capacity )** 方法
213描述:如果当前容量小于指定容量,内存分配会增加内存空间以达到指定容量。
214
215**Replace( Char oldchar,Char newchar )** 方法
216描述:用newchar替换oldchar。
217
218**Replace( String oldstring,String newstring )** 方法
219描述:用newstring替换oldstring。
220
221**Replace( Char oldchar,Char newchar,Int startpos,Int count )** 方法
222描述:从startpos到count-1之间用newchar替换oldchar。
223
224**Replace( String oldstring,String newstring,Int startpos,Int count )** 方法
225描述:从startpos到count-1之间用newstring替换oldstring。
226
227**ToString( )** 方法
228StringBuilder sb=new StringBuilder( "I live this game" );
229String s1=sb.ToString( ); //Displays "I live this game"
230String s2=sb.ToString(3,4); //Displays "live"
231在这里第二个ToString( )方法调用了String类的Substring( )方法
232public String ToString( int startIndex,int length )
233{
234**return m_StringValue.Substring( startIndex,length );**
235}
236
23710:28 | 评论 (0)
238
2392004年7月7日 #
240
241## String 类学习笔记
242
243**一、String 类的常用公共成员**
244
245
246* * *
247
248
249**Compare(String s1,String s2)** 静态方法
250功能:区分大小写比较。
251
252**Compare(String s1,String s2,Bool ignoreCase)** 静态方法
253功能:ignoreCase为True,不区分大小写比较。
254
255**CompareTo(String s)** 实例方法
256功能:对给定字符串与实例字符串执行一次区分大小写与文化信息比较。
257
258**Copy(String s)** 静态方法
259功能:返回一个与给定字符串同值的新的字符串。
260
261**CopyTo(Int surceIndex,char[ ] destination,Int destIndex,Int count)
262** 实例方法功能:此实例中的指定位置复制到 Unicode 字符数组中的指定位置。
263参数:
264sourceIndex:此实例中的字符位置。
265destination :Unicode 字符的数组。
266destIndex :destination 中的数组元素。
267count:此实例中要复制到 destination 的字符数。
268例程:
269using System;
270public class CopyToTest {
271public static void Main() {
272string strSource = "changed";
273char [] destination = { 'T', 'h', 'e', ' ', 'i', 'n', 'i', 't', 'i', 'a', 'l', ' ', 'a', 'r', 'r', 'a', 'y' };
274Console.WriteLine( destination );
275** strSource.CopyTo ( 0, destination, 4, strSource.Length ); **
276Console.WriteLine( destination );
277strSource = "A different string";
278** strSource.CopyTo ( 2, destination, 3, 9 ); **
279Console.WriteLine( destination ); }
280}
281输出:
282The initial array
283The changed array
284Thedifferentarray
285
286**EndsWith(String s)**
287功能:如果实例字符串是以给定的字符串结束,就返回True。
288
289**Equals(String s)
290** 功能:如果实例字符串与给定的对象具有相同的值,就返回True。
291
292**Format(IFormatProvider provider,String format,ParamArray args)**
293功能:format 的一个副本,其中格式项已替换为 args 中相应 Object 实例的 String 等效项。
294参数
295provider : 一个 IFormatProvider,它提供区域性特定的格式设置信息。
296format : 包含零个或多个格式项。
297args :包含零个或多个要格式化的对象的 Object 数组。
298例如:
299string myName = "Fred";
300** String.Format("Name = {0}, hours = {1:hh}", myName, DateTime.Now); **
301固定文本是“Name =”和“, hours =”,格式项是“{0}”和“{1:hh}”,值为 myName 和 DateTime.Now。
302
303**Replace(String oldstring,String newstring)
304** 功能:在实例字符串中用newstring替换所有oldstring。
305
306
307**Split(char[] separator,int count)
308** 参数
309separator :分隔此实例中子字符串的 Unicode 字符数组、不包含分隔符的空数组或空引用。
310count :要返回的最大数组元素数。
311例如:
312**string delimStr = " ,.:";**
313char [] delimiter = delimStr.ToCharArray();
314string words = "one two,three:four.";
315string [] split = null;
316**split = words.Split(delimiter, 4);**
317foreach (string s in split)
318{
319Console.WriteLine("-{0}-", s);
320}
321one <==输出
322two
323three
324four.
325
326**SubString(Int startPos,Int length)
327** 功能:从指定位置开始返回一个指定长度的子串。
328
329**ToString( )** 功能:返回一个对实例字符的引用。
330**ToString(IFormatProvider format)**
331功能:返回一个对实例字符串的引用。
332
33313:31 | 评论 (0)
334
3352004年7月6日 #
336
337## 正则表达式学习笔记(1)
338
339** 一、System.Text.RegularExpression命名空间 **
3401、 **Regex类** 可以用来创建正则表达式,还提供了许多方法。
341如:Regex.Replace(string input,String pattern,string replacement);
342**\-------RegexOption枚举**
343**IgnoreCase** 忽略大小写。默认情况区分大小写
344**RightToLeft** 从右到左查找输入字符串。
345**None** 不设定标志。
346**MiltiLine** 指定^与$可以匹配行的开头和结尾,以及字符串的开头和结尾。
347**SingleLine** 规定特殊字符“.”匹配任一字符。换行符除外。
348例:RegexOptions.IgnoreCase
349Regex.IsMatch(Mystring,"YWSM",RegexOptions.IgnoreCase |RegexOptions.RightToLeft):
350** \-------(两个主要的)类构造函数 **
351Regex(string pattern);
352Regex(string pattern , RegexOption options);
353例:匹配YWSM:
354static void Main(string[] args)
355{ Regex myRegex=new Regex("YWSM");
356System.Console.WriteLine(myregex.IsMatch("The first three letters of "+"the alphabet are YWSM")); }
357输出:True如需设置区分大小写可用
358Regex myRegex=new Regex("YWSM",RegexOption.IgnoreCase);
359** \-------IsMatch( )方法 **
360该方法可以测试字符串,看它是否匹配正则表达式的模式。如果发现了一次匹配,返回True,否则为False。IsMatch( )有一个静态的重载方法,使用它时可以无需显式创建一个Regex对象。
361重载形式:
362public bool Regex.IsMatch(string input );
363public bool Regex.IsMatch(string input,int startat);
364public static bool Regex.IsMatch(string input,string pattern);
365public static bool Regex.IsMatch(string input,string pattern,RegexOption options);
366input: 指定了包含将检索的文本的字符串。
367sartat: 指定了搜索的起始字符位置。
368pttern: 指定将匹配的样式。
369options: 匹配行为的选项。
370例:string inputstring="Welcome to the ywicc,ywsmxy!";
371if ( Regex.IsMatch( inputstring,"ywicc",RegexOptions.IgnoreCase) )
372Console.WriteLine("Match Found");
373Else
374Console.WriteLine(" No Match Found");
375** \------Replace( )方法 **
376用指定的字符串代替一个匹配模式。
377**\---基本方法有:**
378public static string Regex.Replace(string input,string pattern,string replacement);
379public static string Regex.Replace(string input,string pattern,string replacement,RegexOption options);
380例:用"AAA"替换"BBB"的所有实例代码:
381string inputstring="Welcome to the AAA!";
382inputstring=Regex.Replace(inputstring,"BBB","AAA");
383Console.WriteLine(inputstring);
384**\----非静态方法,可以指定替换次数的最大值以及开始下标:
385** Public string Replace(string input,string replacement);
386Public string Replace(string input,string replacement,int count);
387Public string Replace(string input,string replacement,int count,int startat);
388例:使用XXX替换456之后的123,最多替换两次,代码如下:
389string inputstring="123,456,123,123,123,789,333";
390Regex regexp=new Regex("123");
391Inputstring=regexp.Replace(inputstring,"XXX",2,4)
392Console.WriteLine(inputstring);
393输出:123,456,XXX,XXX,123,789,333
394** \-------Split( )方法 **
395在每次发现匹配的位置拆分字符串。返回一个字符串数组。
396using System;
397using System.Text;
398using System.Text.RegularExpressions;
399using System.Windows.Forms;
400class mysplit
401{
402static void Main(string[ ] args)
403{
404string inputstring="123,456,789,ads";
405string[ ] splitResults;
406splitresults=Regex.Split(inputstring,",");
407StringBuilder resultsstring=new StringBuilder(32);
408foreach(string stringelement in splitresults)
409{
410resultsstring.Append(stringelement+"\n");
411}
412MessageBox.Show(resultsString.ToString( ));
413}
414}
415
416123 <==结果
417456
418789
419ads</mystring.length);>