중화사전망 - 자전 검색 - 한자의 GBK 코드를 어떻게 알 수 있습니까? (소프트웨어 제외)
한자의 GBK 코드를 어떻게 알 수 있습니까? (소프트웨어 제외)
이해:
GBK 는 또 다른 한자 인코딩 표준으로, 전체 이름은' 중국어 내코드 확장 규범 (GBK)' 이고, 영어 이름은' 중국어 내코드 규범' 으로 중화인민공화국과 전국정보기술 표준화 기술위원회가 6 월 1995+2 월/KLOC-0 국가기술감독국 표준화사와 전자공업부 과학기술품질감독사가 공동으로 기술규범 지도문서로 확정해 번호 문서로 발표했다. [1995] 229 일 1995 년 2 월 5 일 공포 및 시행. GBK 사양의 이 버전은 1.0 버전입니다. GB 는' 국가 표준' 이고, K 는' 확장' 한어병음의 첫 글자이다.
GBK 는 GB 23 12 인코딩과 역호환되며 ISO 10646. 1 국제 표준을 지원합니다.
O106466 은 ISOC 의 코딩 표준이며, 바로 통용 멀티 8 비트 인코딩 문자 세트 (UCS) 는 중국 대륙에서 일반 멀티 8 비트 인코딩 문자 세트로 번역됩니다. 대만성에서 일반 멀티 8 비트 인코딩 문자 세트로 번역합니다. 유니코드 조직의 유니코드 인코딩과 완벽하게 호환됩니다. O10646.1은 표준, 중국의 1993 은 GB 13000. 1 국가 표준 형식 (예: GB13000./kloc) 으로 인정받았다
O1064666 은 세계상의 모든 언어를 포괄하는 쓰기 형식과 부호가 붙은 부호화 시스템이다. 한자 부분은' 한중일 통일한자' (c 는 중국, j 는 일본, k 는 북한) 라고 불린다. 이 가운데 중국 부분에는 중국 본토의 GB 23 12, GB 12345,' 현대한어 공통어표' 등 법정표준의 한자와 기호, 대만성의 CNS 1/등이 포함되어 있다.
I. 어휘
GBK 사양에는 ISO 10646. 1 에 있는 모든 한중일 한자와 기호가 포함되며 몇 가지 보완이 제공됩니다. 구체적으로 다음과 같습니다.
1 에 있는 모든 한자와 한자가 아닌 한자. GB 23 12 입니다.
2.GB 13000. 1 의 기타 한중일 한자. 이상은 모두 20902 GB 한자입니다.
3.GB 13000. 1 의 52 자 한자는 간략화된 단어 요약에 포함되지 않습니다.
4.' 강희사전' 과' 사해' 에는 28 개 부수와 중요한 부품이 GB 13000. 1 에 수록되지 않았다.
5. 13 한자 구조 기호.
6.Big-5 에는 139 개의 그래픽 기호가 GB 23 12 에는 포함되지 않지만 GB 13000. 1 에는 있습니다
7.GB 12345 보충 병음 기호 6 개.
8. 한자' ○'.
9.GB 12345 에 추가된 19 수직 구두점 (GB 23 12 에 비해 GB 10 에 29 개 추가)
10.2 1 한자는 GB 13000. 1 의 한중일 호환 영역에서 선택됩니다.
11.GB13000.1수익 3 1 IBM OS/2 특수 기호.
둘째, 코드 할당 및 순서
GBK 는 전체 인코딩 범위가 8 140-FEFE 이고, 첫 번째 바이트는 8 1-FE 사이이고, 마지막 바이트는 40-FE 사이이며, xx7F 행은 포함되지 않습니다. 총 23,940 개의 코드 포인트, * * * 에는 265,438+0,886 개의 한자와 그래픽 기호가 포함되어 있으며, 그 중 265,438+0,003 개의 한자 (옆부분과 부품 포함) 와 883 개의 그래픽 기호가 포함되어 있습니다.
모든 코드는 세 부분으로 나뉩니다.
1. 한자 영역. 포함 내용:
A.GB 23 12 한자 영역. GBK/2: B0A 1-F7FE 입니다. GB 23 12 는 모두 6763 자의 한자로, 원래 순서로 배열되어 있다.
B.GB 13000. 1 한자 영역 확장. 포함 내용:
(1) GBK. GB 13000. 1 에 있는 6080 개의 한중일 한자를 포함합니다.
(2) GBK/4: AA40-FEA0. 한중일 한자 포함 및 8 160 추가 한자 포함. 한중일 한자가 우선하며 UCS 코드 크기에 따라 정렬됩니다. 간지 (편측부와 부품 포함) 를 보충하는 것은 강희사전 페이지/위치에 따라 마지막을 차지한다.
2. 그래픽 기호 영역. 포함 내용:
A.GB 23 12 한자가 아닌 기호 영역. 즉 gbk/1:a1a1-a9fe 입니다. GB 23 12 의 기호 외에도 GB 12345 의 보완 10 소문자 로마 숫자와 기호가 있습니다. 7 17 개의 기호가 있습니다.
B.GB 13000. 1 한자 이외의 영역 확장. GBK/5: A840-A9A0 입니다. BIG-5 는 중국어가 아닌 기호, 구조기호 및' 0' 이 이 영역에 배열되어 있습니다. 166 개의 기호가 있습니다.
3. 사용자 지정 영역: (1)(2)(3) 세 개의 커뮤니티로 나뉩니다.
(1) 564 인코딩 비트가 있는 AAA1-affe.
(2) 658 자리 f8a1-fefe.
(3) a140-a7a 0,672 야드 비트.
영역 (3) 은 사용자에게 개방되어 있지만 향후 해당 영역에 새 문자를 추가할 가능성을 배제하지 않기 때문에 사용이 제한됩니다.
셋째, 서체
GBK 는 글리프에 대해 다음과 같이 규정했다.
1. 원칙적으로 GB 13000. 1 G (즉, 중국 대륙 법정표준에서 유래한 한자) 열 아래의 글꼴/필형과 일치한다.
2.' 한중일 한자 인식 규칙' 의 전반적인 틀 안에서 모든 GBK 코드 한자는' 정형무중코드' ('GB') 여야 한다. 즉, 무거운 코드를 만들지 않고 가능한 한 신중국 서체를 채택하는 것이다.
3. 한중일 한자 인식 규칙을 초과하거나 인식 규칙에서 명시적으로 규정하지 않은 한자의 경우 일시적으로 GBK 코드에 기존 글리프를 배치합니다. 이렇게 많은 경우 GBK 는 같은 한자의 신구 글리프를 흡수한다.
4. GB 23 12 에 포함된 한자가 아닌 기호의 글리프는 GB 23 12 와 일치합니다. GB 23 12 를 초과하는 부분은 GB 100038+0 과 일치합니다.
5. 성조가 있는 병음 자모는 반각 형식이다.
- 관련 기사
- 상응하는 조디악은 어떤 것이 있나요? 12 개의 별자리는 무엇입니까?
- 한의종양학 전문가 장명은 어떻게 빠른 종양 절제 요법을 개발했습니까?
- 창문에' Xi' 또는' ba' 라는 단어가 있습니까?
- 어떤 비교적 좋은 번역 소프트웨어가 있습니까?
- Java 사전 값 매핑이 너무 많습니다.
- 복수의 의미는 무엇입니까? 복수의 의미는 무엇입니까?
- 어떻게 경필행서를 잘 쓸 수 있습니까?
- "초등 중국어 2022" 의 새로운 커리큘럼 표준 작성 경험
- 피아노 곡에서 SF 는 무엇을 의미합니까?
- Vb 소스 코드 설명, 설명이 상세할수록 좋습니다. 희망은 전문가이고 설명을 이해할 수 있다. 이것은 암호 사전을 생성하는 데 사용되는 소스 코드입니다. 저는 초보자입니다.