Regular Expression 正则表达式-1 (C#)

起因是因为一片帖子,问到了一个问题,帖子是这样的:

Originally Posted by 人就是这样
我想编一个程序,但学CompSci是很久以前的事情了。想请教请教大家。

有两个txt文件,一个叫source.txt(有很多数据), 一个叫target.txt(空白的)

我想把source.txt里的一些数据提取出来(稍微修改一下),然后写到target.txt里面。

举个例子:
sourse.txt里的数据:
2oi)4@##( "data:001%abc" >dsi-23)(*32##( "data:dce%xy3" #(*EOIj2308Eld

想提取的数据就是橘黄色的。
data:001%abc

全部提取出来以后,我还想把%换成*, 然后每条数据后面加个逗号","

最后target.txt就应该这样:

data:001abc,
data:dce
xyz

请问应该怎么做啊?实在JAVA忘光了。求教~~

如果帮我做的话付点酬劳也可以。

以前我也面临过类似的问题,总是通过程序描述的办法解决,现在问题又提起来了,于是静下心来想一想。有了上学期330编译原理的基础,并且做过有限状态自动机以后,已经非常明确这种文字处理的事情应该交给Regular Expression(正则表达式),只不过自己总因为正则表达式晦涩难懂,因此没有好好的琢磨过。

于是我就打算借这个机会把Regular Expression好好的熟悉一下。结果发现程序原来如此好写:

using System ;
using System . IO ;
using System . Text ;
using System . Text . RegularExpressions ;

namespace RegExpression
{
///

1<summary>   
2///   
3/// </summary>

public class DataFilter
{
public static void Main ( string [] args )
{
if( args . Length < 2 )
{
Console . Error . WriteLine ( "Please enter 2 filenames(e.g. In.txt Out.txt)" );
return;
}
string Result ;
using ( StreamReader sr = new StreamReader ( args [ 0 ]) )
{
Result = Filter ( sr . ReadToEnd () );
}
using ( StreamWriter wr = new StreamWriter ( args [ 1 ]) )
{
wr . Write ( Result );
}
}
private static string Filter ( string input )
{
StringBuilder result = new StringBuilder ();
Regex r = new Regex ( ""(?

 1<data>\\\w+):(?<key>\\\w+)%(?<value>\\\w+)\""  ,  RegexOptions  .  Compiled  );   
 2for(  Match m  =  r  .  Match  (  input  );  m  .  Success  ;  m  =  m  .  NextMatch  () )   
 3{   
 4result  .  Append  (  m  .  Result  (  "${data}:${key}*${value},"  \+  Environment  .  NewLine  ) );   
 5}   
 6return  result  .  ToString  ();   
 7}   
 8}   
 9}   
10
11
12实现这个功能的关键代码也就不超过10行就够了,一个字,爽。 
13
14略加修正: 
15
16·using statement 
17
18·end of line (Environment.NewLine) 
19
20·use StringBuilder to improve performence 
21
22这些要感谢cumcum给与指正。</value></key></data>
Published At
Categories with Web编程
Tagged with
comments powered by Disqus