본문 바로가기
::public/윈도우즈 시스템

문자셋(Character Sets)의 종류와 특성

by 해맑은욱 2019. 9. 19.

*SBCS(Single Byte Character Set)

;각 문자를 1바이트만을 사용. 아스키코드가 대표적.

 char 타입으로 표현. 문자열의 마지막에는 1바이트의 null('\0')값이 표시됨.

*MBCS(Multi Byte Character Set)

;아스키코드를 제외한 문자는 2바이트로 처리. 영문자 1바이트 한글 문자 2바이트.

 char 타입으로 표현. 문자열의 마지막에는 한 바이트의 null('\0')값이 표시됨.

*WBCS(Wide Byte Character Set)

;모든 문자를 2바이트 처리.

 유니코드가 속함. 유니코드의 경우 wchar_t 타입으로 표현.

 문자열의 마지막에는 2바이트의 null('\0')값이 표시됨.

 

*문자 관련 타입들

LP는 long pointer를 나타내는 약어.

C는 constant.

STR은 말 그대로 string. 내부적으론 char형 배열에 null값 종료를 의미.

W는 wide char, unicode.

T는 TCHAR, t_char. 운영체제가 multi-byte면 char형으로 unicode환경이면 w_char, wide char형으로 처리.

 

LPSTR      : long pointer string = char *

LPCSTR    : long pointer constant string = const char *

LPTSTR    : long pointer t_string = tchar *

LPCTSTR  : long pointer constant t_string = const tchar *

LPWSTR   : long pointer wide string = w_char *

LPCWSTR : long pointer constant wide string = const w_char *

 

// MBCS일 경우
char *message = "Hello World";
 
// unicode일 경우
char *message = L"Hello World";
 
// TCHAR의 사용
TCHAR[] message[] = _T("Hello World");
TCHAR[] message[] = TEXT("Hello World");
cs

 

'::public > 윈도우즈 시스템' 카테고리의 다른 글

프로그램의 실행 과정  (0) 2019.09.10
컴퓨터 하드웨어의 구성  (0) 2019.09.10