중화사전망 - 자전 검색 - 한자의 위치 코드는 무엇입니까?
한자의 위치 코드는 무엇입니까?
관련 소개:
한자 인코딩이란 과학적으로 실행 가능한 방법을 사용하여 각 한자에 대해 고유한 코드를 인코딩하여 컴퓨터가 인식하고 받고 처리할 수 있도록 하는 것입니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 한자 인코딩, 한자 인코딩, 한자 인코딩, 한자 인코딩) 여기에 소개된 것은' 국가 표준 정보 교환 한자 인코딩' 이다. 가공정리 후, 이 코드는 항상 한어병음의 알파벳 순서에 따라, 음절이 같은 단어는 사용 빈도의 순서에 따라 배열된다. 검색 방법은' 일반 한어사전' 의 한어병음음절 색인과 같다.
모든 한자에 전국적인 통일코딩을 하기 위해 1980 년, 우리나라는 첫 번째 한자 인코딩 국가 표준인 GB23 12-80' 정보교환용 한자 인코딩 문자 세트' 기본세트를 반포했다. 이는 우리나라 중국어 정보 처리 기술의 발전 기초이다.
국가 표준 코드는 4 자리 16 진수 코드이기 때문에 의사 소통을 용이하게 하기 위해 일반적으로 4 자리 10 진수 지역 번호를 사용합니다. 모든 국가 표준 한자와 기호는 94×94 의 행렬을 구성한다. 이 사각형 행렬에서 각 행은 "영역" 이라고 하고 각 열은 "비트" 라고 합니다. 그래서 이 방진은 실제로 94 개 구역 (지역번호는 각각 1 에서 94 까지) 이 있는 한자 세트를 구성하는데, 각 구역마다 94 비트 (숫자는 각각 1 에서 94 까지) 가 있다.
한자의 지역번호와 위치번호를 간단히 조합하면 한자의' 위치코드' 가 형성된다. 한자의 위치 코드 중 위 두 자리는 지역번호이고, 아래 두 자리는 위치번호입니다. 지역 번호에서 0 1-09 섹션에는 682 자의 특수 문자가 포함되고 16~87 섹션에는 6763 자의 한자가 포함됩니다.
여기서 16-55 구역은 1 차 한자 (가장 많이 사용되는 한자 3755 개는 알파벳순으로 정렬), 56-87 구역은 2 차 한자 (3008 개의 한자는 부수순으로 정렬) 입니다.
따라서 n 개의 한자가 필요할 때 모든 한자의 목록을 만들 필요가 없습니다. 대신 위치 코드를 사용하여 공통 한자를 추출합니다.