/// 0-9: 숫자 (0부터 9까지)
/// a-zA-Z: 영어 대소문자
/// 가-힣: 한글 완성형(가부터 힣까지의 모든 완성된 한글 음절)
/// [제외] ㄱ-ㅎ: 한글 자음(자음 'ㄱ'부터 'ㅎ'까지)
/// [제외] ㅏ-ㅣ: 한글 모음(모음 'ㅏ'부터 'ㅣ'까지)
/// ぁ-ゔ: 일본어 히라가나
/// ァ-ヴ: 일본어 가타카나
/// ー: 일본어 가타카나의 장음부호(ー)
/// 々〆〤: 일본어에서 사용되는 반복 문자 및 기타 기호
/// 一-龥: 한자(기본 한자 범위)
/// [결과] "0-9a-zA-Z가-힣ぁ-ゔァ-ヴー々〆〤一-龥"
/// ऀ-ॿ: 힌디어(데바나가리 문자)
/// ก-๙: 태국어 문자
/// \u0600-\u06FF: 아랍어 문자
/// \u0400-\u04FF: 키릴 문자(러시아어 문자)
/// [결과] "0-9a-zA-Z가-힣ぁ-ゔァ-ヴー々〆〤一-龥ऀ-ॿก-๙\\u0600-\\u06FF\\u0400-\\u04FF"

// 기존 허용하는 문자 외에는 Replace로 제거
Regex.Replace(_strString, @"[^a-zA-Z가-힣ぁ-ゔァ-ヴー々〆〤一-龥ऀ-ॿก-๙\u0600-\u06FF\u0400-\u04FF]", "");


[참조] https://codechacha.com/ko/csharp-remove-special-letters/


C# - 문자열에서 특수문자 제거

문자열에서 특수문자를 제거하거나, 특정 언어를 제외한 다른 언어를 제거하는 방법을 소개합니다. 정규표현식(Regex)를 이용한 방법 Regex.Replace(string, pattern, replacement)는 string에서 정규표현식 patt



[참조] https://blog.naver.com/bassfrontier/221787732602


C# 에서의 정규식 (Regex) 특수문자의 입력 확인 방법

프로그램 내에서 입력 양식을 제공하고, 입력된 값을 검사하는 일은 꽤나 빈번하게 일어나는 일이다. 대부...



Posted by blueasa
, |



RegExLib.com Regular Expression Cheat Sheet (.NET)


Character Escapes http://tinyurl.com/5wm3wlEscaped CharDescription

ordinary characters Characters other than . $ ^ { [ ( | ) ] } * + ? \ match themselves.
\a Matches a bell (alarm) \u0007.
\b Matches a backspace \u0008 if in a []; otherwise matches a word boundary (between \w and \W characters).
\t Matches a tab \u0009.
\r Matches a carriage return \u000D.
\v Matches a vertical tab \u000B.
\f Matches a form feed \u000C.
\n Matches a new line \u000A.
\e Matches an escape \u001B.
\040 Matches an ASCII character as octal (up to three digits); numbers with no leading zero are backreferences if they have only one digit or if they correspond to a capturing group number. (For more information, see Backreferences.) For example, the character \040 represents a space.
\x20 Matches an ASCII character using hexadecimal representation (exactly two digits).
\cC Matches an ASCII control character; for example \cC is control-C.
\u0020 Matches a Unicode character using a hexadecimal representation (exactly four digits).
\* When followed by a character that is not recognized as an escaped character, matches that character. For example, \* is the same as \x2A.

Character Classes http://tinyurl.com/5ck4llChar ClassDescription

. Matches any character except \n. If modified by the Singleline option, a period character matches any character. For more information, see Regular Expression Options.
[aeiou] Matches any single character included in the specified set of characters.
[^aeiou] Matches any single character not in the specified set of characters.
[0-9a-fA-F] Use of a hyphen (–) allows specification of contiguous character ranges.
\p{name} Matches any character in the named character class specified by {name}. Supported names are Unicode groups and block ranges. For example, Ll, Nd, Z, IsGreek, IsBoxDrawing.
\P{name} Matches text not included in groups and block ranges specified in {name}.
\w Matches any word character. Equivalent to the Unicode character categories [\p{Ll}\p{Lu}\p{Lt}\p{Lo}\p{Nd}\p{Pc}]. If ECMAScript-compliant behavior is specified with the ECMAScript option, \w is equivalent to [a-zA-Z_0-9].
\W Matches any nonword character. Equivalent to the Unicode categories [^\p{Ll}\p{Lu}\p{Lt}\p{Lo}\p{Nd}\p{Pc}]. If ECMAScript-compliant behavior is specified with the ECMAScript option, \W is equivalent to [^a-zA-Z_0-9].
\s Matches any white-space character. Equivalent to the Unicode character categories [\f\n\r\t\v\x85\p{Z}]. If ECMAScript-compliant behavior is specified with the ECMAScript option, \s is equivalent to [ \f\n\r\t\v].
\S Matches any non-white-space character. Equivalent to the Unicode character categories [^\f\n\r\t\v\x85\p{Z}]. If ECMAScript-compliant behavior is specified with the ECMAScript option, \S is equivalent to [^ \f\n\r\t\v].
\d Matches any decimal digit. Equivalent to \p{Nd} for Unicode and [0-9] for non-Unicode, ECMAScript behavior.
\D Matches any nondigit. Equivalent to \P{Nd} for Unicode and [^0-9] for non-Unicode, ECMAScript behavior.



[출처] https://regexlib.com/CheatSheet.aspx?AspxAutoDetectCookieSupport=1


RegExLib.com Regular Expression Cheat Sheet (.NET Framework)

\p{name}Matches any character in the named character class specified by {name}. Supported names are Unicode groups and block ranges. For example, Ll, Nd, Z, IsGreek, IsBoxDrawing.



Posted by blueasa
, |

[링크] https://hamait.tistory.com/342


정규표현식 (Regex) 정리

정규표현식은 아주 가끔 쓰기때문에 항상 다시 볼때마다 헷갈리곤 하기에 주요 사용예를 내가 나중에 다시 봤을 때 편하도록 정리하여 보았다. 정규 표현식의 용어들정규 표현식에서 사용되는



Posted by blueasa
, |
    using System.Text.RegularExpressions;
    /// <summary>
    /// 닉네임 체크
    /// 글자수 제한 : 1~10
    /// 사용가능 문자 : 숫자/영어소문자/영어대문자/한글/일본어/한자
    /// [정규식]
    /// 숫자 : 0-9
    /// 영어 대소문자 : a-zA-Z
    /// 한글완성형 : 가-힣
    /// 한글자모음 : ㄱ-ㅎㅏ-ㅣ(제외)
    /// 일본어 : [ぁ-ゔ]+|[ァ-ヴー]+[々〆〤]
    /// 한자 : 一-龥
    /// </summary>
    /// <param name="_strInputNickname"></param>
    /// <returns>isMatch</returns>
    public static bool IsValidNickname(string _strInputNickname)
        Regex regex = new Regex(@"^[0-9a-zA-Z가-힣ぁ-ゔァ-ヴー々〆〤一-龥]{1,10}$");
        bool bIsMatch = regex.IsMatch(_strInputNickname);
        if (false == bIsMatch)
            Debug.LogWarningFormat("숫자와 영문 대소문자,한글,일본어,한자만 입력가능합니다.(글자제한1~10)");

        return bIsMatch;


Posted by blueasa
, |

[링크] https://blog.naver.com/rookiemodel/10139446205


[ 스크랩 ] Regular Expression( 정규표현식 ) 총정리

1. 콤마( . ) . 는 어떤 문자 1개를 가리킨다. ( "줄바꿈 문자(\n)"는 제외) ============================...



Posted by blueasa
, |

[수정] 댓글에 shin님 제보

/가-ㄱ-ㅎㅏ-ㅣ/         /가-ㄱ-ㅎㅏ-ㅣ/

[참조] https://blueasa.tistory.com/2812




[링크] https://bonita-sy.tistory.com/174


[Regex] 한국어, 일본어, 한자, 영어, 숫자 정규표현식

한국어 /가-힇ㄱ-ㅎㅏ-ㅣ/ 일본어 /[ぁ-ゔ]+|[ァ-ヴー]+[々〆〤]/ 한자 /一-龥/ 영어 /a-zA-Z/ 숫자 /0-9/ 예시 - 한글, 영어, 한자, 일본어, 숫자 모두 매칭되는 regex /[a-zA-Z0-9가-힇ㄱ-ㅎㅏ-ㅣぁ-ゔァ-ヴー



Posted by blueasa
, |



string Pattern = @"^[a-zA-Z0-9가-힣ㄱ-ㅎㅏ-ㅣ]*$";

 한글, 숫자, 영어는 커버가 가능했지만 대만에 퍼블리싱 되면서 대만어 입력을 할 경우 필터링 되어


문제가 되었는데 이와 같이 여러 언어로 서비스 하는 경우 각 국가 언어를 예전코드처럼 글자 자체를


입력하기에는 무리가 있다.


이런 경우 유니코드의 범위를 지정하여 필터링 할 수가 있는데 문제는 각 국가별 유니코드 범위를


알아야 한다는 것이었다. 아무리 구글신께 대만어 유니코드 범위를 알려달라 해봐도 그는 고개를





검색을 이리저리 하다보니 CJK가 계속 눈에 띄어 위키느님께 여쭤보니


CJK(Chinese - Japanese - Korean, 중국·일본·한국)는 한국어, 중국어, 일본어를 통틀어 이르는 말로, 소프트웨어 국제화, 언어 지역화 분야에서 쓰인다. 베트남어를 포함해서 CJKV라고 하기도 한다.

으헉.. 한자는 중국과 대만이 다르고 또 한국과 일본이 다르건만 통합을 해놓았다...


내부적으로 어떤 경계가 있을법도 한데 어제 반나절을 투자해 검색해본 결과로는 없는것 같았다.


아마도 중복되는 한자들이 존재하니 통합하는길 밖에 없었던 것도 같다. 유니코드는 한 문자당 코드가


한개씩만 할당되어야 하므로.


알아낸 유니코드 범위들은 다음과 같다.


@"[\uFF21-\uFF3A]" // A-Z

@"[\uFF41-\uFF5A]"  // a-z
@"[\uFF10-\uFF19]"  // 0-9
@"[\uAC00-\uD7A3]"  // 가-힣
@"[\u1100-\u1112]"  // ㄱ-ㅎ
@"[\u3130-\u3163]"  // ㄱ-ㅎ(Compatible)ㅏ-ㅣ
@"[\u4E00-\u9FFF]" // Unified Hanja (Traditional/Simplify Chinese, Japanese, Korean)
@"[\u3040-\u30FC]" // Japanese 


실제 구현부에는 얘네들을 | 연산자로 국가별로 골라서 넣을 수 있도록 구현을 해놓았다.


아래 사이트에서 실제 어떤 아이들이 들어가 있는지 볼 수 있다.




[출처] https://m.blog.naver.com/amurorei82/10189119746


C#에서의 나라별 정규 표현식 구현

예전코드 string Pattern = @"^[a-zA-Z0-9가-힣ㄱ-ㅎㅏ-ㅣ]*$"; 한글, 숫자, 영어는 커버가 가능했지만 ...



Posted by blueasa
, |

[출처] https://code.i-harness.com/ko-kr/q/5184a7




나는 @"^([\w\.\-]+)@([\w\-]+)((\.(\w))+)$" 가 효과가 있다고 생각합니다. 
당신은 그것을 쓸 필요가 있습니다.

string email = txtemail.Text;
Regex regex = new Regex(@"^([\w\.\-]+)@([\w\-]+)((\.(\w))+)$");
Match match = regex.Match(email);
if (match.Success)
    Response.Write(email + " is correct");
    Response.Write(email + " is incorrect");

다음 경우에 실패 할 것이라고 경고하십시오.

  1. @ 기호 다음에 하위 도메인이 있습니다.
  2. .info 와 같이 길이가 3보다 큰 TLD를 사용합니다.

나는 이것을 사용한다.


전자 우편의 유효성을 검사하는 regexp

([\w\.\-]+) - 첫 번째 수준 도메인 (많은 문자와 숫자, 점과 하이픈) 

([\w\-]+) - 두 번째 수준 도메인 용입니다. 

((\.(\w))+) 와)과 2 또는 3 리터럴을 포함하는 다른 레벨 도메인 (3에서 무한대까지)에 대한 것 ((\.(\w))+) 

이 정규식에 무슨 문제가 있습니까?

편집 : 그것은 "something@someth.ing"이메일과 일치하지 않습니다


Regex.IsMatch ()를 사용하고 있습니다.

우선 다음 문을 추가해야합니다.

using System.Text.RegularExpressions;

그런 다음 메서드는 다음과 같습니다.

private bool EmailValidation(string pEmail)
                 return Regex.IsMatch(pEmail,
                 @"^(?("")("".+?(?<!\\)""@)|(([0-9a-z]((\.(?!\.))|[-!#\$%&'\*\+/=\?\^`\{\}\|~\w])*)(?<=[0-9a-z])@))" +
                 RegexOptions.IgnoreCase, TimeSpan.FromMilliseconds(250));

그것은 내 논리 때문에 개인적인 방법이지만 "유틸리티"와 같은 다른 레이어에 정적으로 메서드를 넣고 필요한 곳에서 메서드를 호출 할 수 있습니다.


MSDN에 좋은 문서가 있습니다.

방법 : 문자열이 유효한 전자 메일 형식인지 확인 here (이 코드는 인터넷 도메인 이름에 비 ASCII 문자를 사용할 수도 있습니다. )

.NET 2.0 / 3.0 및 .Net 3.5 이상에서는 2 가지 구현이 있습니다. 
2.0 / 3.0 버전은 다음과 같습니다.

bool IsValidEmail(string strIn)
    // Return true if strIn is in valid e-mail format.
    return Regex.IsMatch(strIn, @"^([\w-\.]+)@((\[[0-9]\.[0-9]\.[0-9]\.)|(([\w-]+\.)+))([a-zA-Z]|[0-9])(\]?)$"); 

이 방법에 대한 내 테스트는 다음을 제공합니다.

Invalid: @majjf.com
Invalid: A@b@c@example.com
Invalid: Abc.example.com
Valid: j..s@proseware.com
Valid: j.@server1.proseware.com
Invalid: js*@proseware.com
Invalid: js@proseware..com
Valid: ma...ma@jjf.co
Valid: ma.@jjf.com
Invalid: ma@@jjf.com
Invalid: ma@jjf.
Invalid: ma@jjf..com
Invalid: ma@jjf.c
Invalid: ma_@jjf
Invalid: ma_@jjf.
Valid: ma_@jjf.com
Invalid: -------
Valid: 12@hostname.com
Valid: d.j@server1.proseware.com
Valid: david.jones@proseware.com
Valid: j.s@server1.proseware.com
Invalid: j@proseware.com9
Valid: j_9@[]
Valid: jones@ms1.proseware.com
Invalid: js#internal@proseware.com
Invalid: js@proseware.com9
Invalid: js@proseware.com9
Valid: m.a@hostname.co
Valid: m_a1a@hostname.com
Valid: ma.h.saraf.onemore@hostname.com.edu
Valid: ma@hostname.com
Invalid: ma@hostname.comcom
Invalid: MA@hostname.coMCom
Valid: ma12@hostname.com
Valid: ma-a.aa@hostname.com.edu
Valid: ma-a@hostname.com
Valid: ma-a@hostname.com.edu
Valid: ma-a@1hostname.com
Valid: ma.a@1hostname.com
Valid: ma@1hostname.com


다음 코드는 github 에 대한 Microsoft의 데이터 주석 구현을 기반으로하며 전자 메일에 대한 가장 완전한 유효성 검사라고 생각합니다.

public static Regex EmailValidation()
    const string pattern = @"^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$";
    const RegexOptions options = RegexOptions.Compiled | RegexOptions.IgnoreCase | RegexOptions.ExplicitCapture;

    // Set explicit regex match timeout, sufficient enough for email parsing
    // Unless the global REGEX_DEFAULT_MATCH_TIMEOUT is already set
    TimeSpan matchTimeout = TimeSpan.FromSeconds(2);

        if (AppDomain.CurrentDomain.GetData("REGEX_DEFAULT_MATCH_TIMEOUT") == null)
            return new Regex(pattern, options, matchTimeout);
        // Fallback on error

    // Legacy fallback (without explicit match timeout)
    return new Regex(pattern, options);


C #에서 REGEX 메서드를 사용하여 STRING 검색

정규 표현식으로 전자 메일의 유효성을 검사하는 방법

string EmailPattern = @"\w+([-+.']\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*";
if (Regex.IsMatch(Email, EmailPattern, RegexOptions.IgnoreCase))
    Console.WriteLine("Email:  is valid.", Email);
    Console.WriteLine("Email:  is not valid.", Email);

Reference String.Regex () 메서드 사용

string patternEmail = @"(?<email>\w+@\w+\.[a-z])";
Regex regexEmail = new Regex(patternEmail);


이 코드는 C #에서 정규식을 사용하여 전자 메일 ID의 유효성을 검사하는 데 도움이됩니다. 닷넷 .. 사용하기 쉽습니다.

if (!System.Text.RegularExpressions.Regex.IsMatch("<Email String Here>", @"^([\w\.\-]+)@([\w\-]+)((\.(\w))+)$"))
            MessageBox.show("Incorrect Email Id.");


위 응답의 조합. MailAddress를 사용하는 Microsoft의 선호하는 방법을 사용하지만 문자열의 확장으로 구현합니다.

public static bool IsValidEmailAddress(this string emailaddress)
            MailAddress m = new MailAddress(emailaddress);
            return true;
        catch (FormatException)
            return false;

그런 다음 모든 문자열을 이메일 주소로 확인하십시오.

string customerEmailAddress = "bert@potato.com";

깨끗하고 간편한 휴대용. 누군가가 도움이되기를 바랍니다. 전자 메일의 정규식은 지저분합니다.

MattSwanson은이 주제에 대한 블로그를 갖고 있으며 정규식을 사용하지 말고 대신 '@'abd를 입력하는 것이 좋습니다. 여기에서 그의 설명을 읽으십시오 : https://mdswanson.com/blog/2013/10/14/how-not-to-validate-email-addresses.html


나는 당신의 캐럿과 달러 기호가 문제의 일부라고 생각한다. 정규 표현식을 약간 수정해야한다. 나는 다음 @ "[:] + ([\ w .-] +) @ ([\ w -.]) + ((. (\ w) ) +) "


크기에 대해 사용해보십시오.

public static bool IsValidEmailAddress(this string s)
    var regex = new Regex(@"[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?");
    return regex.IsMatch(s);

public static bool ValidateEmail(string str)
     return Regex.IsMatch(str, @"\w+([-+.']\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*");

위 코드를 사용하여 전자 메일 주소의 유효성을 검사합니다.


이것은 지금까지 내가 좋아하는 접근 방식입니다.

public static class CommonExtensions
    public static bool IsValidEmail(this string thisEmail)
        => !string.IsNullOrWhiteSpace(thisEmail) &&
           new Regex(@"^([\w\.\-]+)@([\w\-]+)((\.(\w))+)$").IsMatch(thisEmail);

그런 다음 생성 된 문자열 확장자를 다음과 같이 사용하십시오.

if (!emailAsString.IsValidEmail()) throw new Exception("Invalid Email");


이 기능을 사용해보십시오.

public bool IsValidEmailAddress(string s)
    if (string.IsNullOrEmpty(s))
        return false;
        var regex = new Regex(@"\w+([-+.']\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*");
        return regex.IsMatch(s) && !s.EndsWith(".");


최고의 이메일 검증 정규식


그리고 그것의 사용법 : -

bool isEmail = Regex.IsMatch(emailString, @"\A(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?)\Z", RegexOptions.IgnoreCase);


Posted by blueasa
, |
Posted by blueasa
, |

정규식을 이용하여 특정 문자만 얻는 방법을 알아보겠습니다.


- Namespace : System.Text.RegularExpressions

- Class : Regex

- Method : 


 public static string Replace(
string input,
string pattern,
string replacement



1. 숫자만 얻기

 - 정규식 : [^0-9]

string str = "Englsh@korea$101299**한글";
// 숫자만 0-9
str = Regex.Replace(str, @"[^0-9]""");
// 결과 : 101299

2. 영문자만 얻기

 - 정규식 : [^a-zA-Z]

string str = "Englsh@korea$101299**한글";
// 영문자 a-z A-Z
str = Regex.Replace(str, @"[^a-zA-Z]""");
// 결과 : Englshkorea


3. 한글만 얻기

 - 정규식 : [^가-힣]

string str = "Englsh@korea$101299**한글";
// 한글만 가-힣
str = Regex.Replace(str, @"[^가-힣]""");
// 결과 : 한글


4. 특수문자 제거

  - 정규식 : [^0-9a-zA-Z가-힣]

string str = "Englsh@korea$101299**한글";
// 특수문자 제거
str = Regex.Replace(str, @"[^0-9a-zA-Z가-힣]""");
// 결과 : Englshkorea101299한글


※ 위의 예에서와 같이 정규식을 잘 이용하면 얻고자 하는 문자를 쉽게 처리 할 수 있습니다.





Posted by blueasa
, |