중화사전망 - 자전 검색 - 한자의 GBK 코드를 어떻게 알 수 있습니까? (소프트웨어 제외)

한자의 GBK 코드를 어떻게 알 수 있습니까? (소프트웨어 제외)

어떤 소프트웨어도 한자의 GBK 코드를 계산하지 않고 기네스북 세계기록을 신청할 수 있다.

이해:

GBK 는 또 다른 한자 인코딩 표준으로, 전체 이름은' 중국어 내코드 확장 규범 (GBK)' 이고, 영어 이름은' 중국어 내코드 규범' 으로 중화인민공화국과 전국정보기술 표준화 기술위원회가 6 월 1995+2 월/KLOC-0 국가기술감독국 표준화사와 전자공업부 과학기술품질감독사가 공동으로 기술규범 지도문서로 확정해 번호 문서로 발표했다. [1995] 229 일 1995 년 2 월 5 일 공포 및 시행. GBK 사양의 이 버전은 1.0 버전입니다. GB 는' 국가 표준' 이고, K 는' 확장' 한어병음의 첫 글자이다.

GBK 는 GB 23 12 인코딩과 역호환되며 ISO 10646. 1 국제 표준을 지원합니다.

O106466 은 ISOC 의 코딩 표준이며, 바로 통용 멀티 8 비트 인코딩 문자 세트 (UCS) 는 중국 대륙에서 일반 멀티 8 비트 인코딩 문자 세트로 번역됩니다. 대만성에서 일반 멀티 8 비트 인코딩 문자 세트로 번역합니다. 유니코드 조직의 유니코드 인코딩과 완벽하게 호환됩니다. O10646.1은 표준, 중국의 1993 은 GB 13000. 1 국가 표준 형식 (예: GB13000./kloc) 으로 인정받았다

O1064666 은 세계상의 모든 언어를 포괄하는 쓰기 형식과 부호가 붙은 부호화 시스템이다. 한자 부분은' 한중일 통일한자' (c 는 중국, j 는 일본, k 는 북한) 라고 불린다. 이 가운데 중국 부분에는 중국 본토의 GB 23 12, GB 12345,' 현대한어 공통어표' 등 법정표준의 한자와 기호, 대만성의 CNS 1/등이 포함되어 있다.

I. 어휘

GBK 사양에는 ISO 10646. 1 에 있는 모든 한중일 한자와 기호가 포함되며 몇 가지 보완이 제공됩니다. 구체적으로 다음과 같습니다.

1 에 있는 모든 한자와 한자가 아닌 한자. GB 23 12 입니다.

2.GB 13000. 1 의 기타 한중일 한자. 이상은 모두 20902 GB 한자입니다.

3.GB 13000. 1 의 52 자 한자는 간략화된 단어 요약에 포함되지 않습니다.

4.' 강희사전' 과' 사해' 에는 28 개 부수와 중요한 부품이 GB 13000. 1 에 수록되지 않았다.

5. 13 한자 구조 기호.

6.Big-5 에는 139 개의 그래픽 기호가 GB 23 12 에는 포함되지 않지만 GB 13000. 1 에는 있습니다

7.GB 12345 보충 병음 기호 6 개.

8. 한자' ○'.

9.GB 12345 에 추가된 19 수직 구두점 (GB 23 12 에 비해 GB 10 에 29 개 추가)

10.2 1 한자는 GB 13000. 1 의 한중일 호환 영역에서 선택됩니다.

11.GB13000.1수익 3 1 IBM OS/2 특수 기호.

둘째, 코드 할당 및 순서

GBK 는 전체 인코딩 범위가 8 140-FEFE 이고, 첫 번째 바이트는 8 1-FE 사이이고, 마지막 바이트는 40-FE 사이이며, xx7F 행은 포함되지 않습니다. 총 23,940 개의 코드 포인트, * * * 에는 265,438+0,886 개의 한자와 그래픽 기호가 포함되어 있으며, 그 중 265,438+0,003 개의 한자 (옆부분과 부품 포함) 와 883 개의 그래픽 기호가 포함되어 있습니다.

모든 코드는 세 부분으로 나뉩니다.

1. 한자 영역. 포함 내용:

A.GB 23 12 한자 영역. GBK/2: B0A 1-F7FE 입니다. GB 23 12 는 모두 6763 자의 한자로, 원래 순서로 배열되어 있다.

B.GB 13000. 1 한자 영역 확장. 포함 내용:

(1) GBK. GB 13000. 1 에 있는 6080 개의 한중일 한자를 포함합니다.

(2) GBK/4: AA40-FEA0. 한중일 한자 포함 및 8 160 추가 한자 포함. 한중일 한자가 우선하며 UCS 코드 크기에 따라 정렬됩니다. 간지 (편측부와 부품 포함) 를 보충하는 것은 강희사전 페이지/위치에 따라 마지막을 차지한다.

2. 그래픽 기호 영역. 포함 내용:

A.GB 23 12 한자가 아닌 기호 영역. 즉 gbk/1:a1a1-a9fe 입니다. GB 23 12 의 기호 외에도 GB 12345 의 보완 10 소문자 로마 숫자와 기호가 있습니다. 7 17 개의 기호가 있습니다.

B.GB 13000. 1 한자 이외의 영역 확장. GBK/5: A840-A9A0 입니다. BIG-5 는 중국어가 아닌 기호, 구조기호 및' 0' 이 이 영역에 배열되어 있습니다. 166 개의 기호가 있습니다.

3. 사용자 지정 영역: (1)(2)(3) 세 개의 커뮤니티로 나뉩니다.

(1) 564 인코딩 비트가 있는 AAA1-affe.

(2) 658 자리 f8a1-fefe.

(3) a140-a7a 0,672 야드 비트.

영역 (3) 은 사용자에게 개방되어 있지만 향후 해당 영역에 새 문자를 추가할 가능성을 배제하지 않기 때문에 사용이 제한됩니다.

셋째, 서체

GBK 는 글리프에 대해 다음과 같이 규정했다.

1. 원칙적으로 GB 13000. 1 G (즉, 중국 대륙 법정표준에서 유래한 한자) 열 아래의 글꼴/필형과 일치한다.

2.' 한중일 한자 인식 규칙' 의 전반적인 틀 안에서 모든 GBK 코드 한자는' 정형무중코드' ('GB') 여야 한다. 즉, 무거운 코드를 만들지 않고 가능한 한 신중국 서체를 채택하는 것이다.

3. 한중일 한자 인식 규칙을 초과하거나 인식 규칙에서 명시적으로 규정하지 않은 한자의 경우 일시적으로 GBK 코드에 기존 글리프를 배치합니다. 이렇게 많은 경우 GBK 는 같은 한자의 신구 글리프를 흡수한다.

4. GB 23 12 에 포함된 한자가 아닌 기호의 글리프는 GB 23 12 와 일치합니다. GB 23 12 를 초과하는 부분은 GB 100038+0 과 일치합니다.

5. 성조가 있는 병음 자모는 반각 형식이다.