추출한 데이터에서 원하는 데이터만 가져오고 싶을때 정규식을 이용해서 가져오면 간단하게 해결된다.
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
namespace ConsoleApplication1
{
class Program
{
// 정규식
const string _RegTxt = "<strong>(?<entry>.*?)</strong>";
static void Main(string[] args)
{
//추출한 문자
String txt = "<html><body><strong>문자</strong></body></html>";
Console.WriteLine("result : {0}", getRegText(txt, _RegTxt));
}
/// <summary>
/// 문자 추출하기
/// </summary>
/// <param name="txt">추출한 문자</param>
/// <param name="txtRegx">정규식</param>
/// <returns></returns>
public static string getRegText(string txt, string txtRegx)
{
Group g = null;
string result=null;
Regex reg = new Regex(txtRegx, RegexOptions.IgnoreCase | RegexOptions.Singleline);
MatchCollection resultColl = reg.Matches(txt);
foreach (Match mm in resultColl)
{
g = mm.Groups[1];
result = mm.Groups["entry"].ToString();
}
return result;
}
}
}