Java/자바

캐릭터 인코딩

필리힐리 2021. 8. 8. 17:57

Character set

정보를 표현하기 위한 문자들의 집합

 

Character Encoding

문자들의 집합을 컴퓨터가 이해할 수 있도록 바꾸는 작업

 

한글 인코딩 방식

- 완성형 (단어 하나)

EUC-KR, CP949 (MS949)

각가갂갃.... 이렇게 쭉 조합할 수 있는 단어가 등록되어 있고 그 중 하나를 선택하는 방식

영어는 1바이트, 한글은 2바이트 취급한다.

Window는 이 방식을 채택하고 있고 서버는 주로 UTF-8 방식이기 때문에 이 둘의 차이로 한글 깨짐이 발생할 수 있다.

 

- 조합형 (초, 중, 종성)

유니코드 인코딩 방식 (대표적으로 UTF-8)

ㅇ+ㅏ+ㄴ = 안

초성, 중성, 종성 각각 하나당 1바이트이기 때문에 한글은 3바이트 취급한다.

여러 언어를 표현하는데 장점이 있음

 

* 아래 블로그들을 참고했습니다.

 

https://studyforus.tistory.com/167

 

한글 인코딩 종류 및 문제점 파악하기 (UTF-8 vs. EUC-KR)

인코딩 방식 이해하기 한글 인코딩 종류 윈도우를 기본 운영체제로 사용하였을 때는 전혀 느끼지 못했던 인코딩 방식이 웹서버를 운영하면서 인코딩 표준을 따라가다 보니 여러 문제점이 생겼

studyforus.tistory.com

https://nuli.navercorp.com/community/article/1079940

 

문자 집합(Character Set)과 인코딩(Encoding)

널리 알리는 기술 소식 다양한 접근성과 사용성, UI 개발에 대한 소식을 널리 알리고 참여하세요! Spread your knowledge! 구독 아티클 문자 집합(Character Set)과 인코딩(Encoding) Nts Nuli 2012-09-25 17:25:25 안녕

nuli.navercorp.com

 

'Java > 자바' 카테고리의 다른 글

StringTokenizer vs String.split()  (0) 2021.08.26
String vs StringBuffer vs StringBuilder  (0) 2021.08.26
String 클래스  (0) 2021.08.04
MVC  (0) 2021.04.11
String  (0) 2021.02.25