중화사전망 - 자전 검색 - 호프만 코딩의 압축비는 얼마입니까?

호프만 코딩의 압축비는 얼마입니까?

호프만의 압축률은 평균 코드 길이를 기준으로 계산되며 압축률이 낮습니다.

예를 들어, 3 개의 이진수가 있는 동일 길이 인코딩의 평균 길이는 3 이고 호프만 트리 인코딩에 따른 평균 코드 길이는 다음과 같습니다.

4 * 0.07+2 * 0.19+5 * 0.02+4 * 0.06+2 * 0.32+5 * 0.03+2 * 0.2/kr

2.6 1/3=0.87=87%

평균 코드 길이는 같은 길이의 87% 이므로 평균 압축비는 13% 입니다.

호프만 인코딩은 호프만 인코딩이라고도 하며, 호프만 인코딩은 가변 길이 인코딩 (VLC) 입니다.

호프만은 1952 에서 문자가 나타날 확률에 따라 서로 다른 접두사의 평균 길이가 가장 짧은 코드를 구성하는 인코딩 방법을 제시했습니다. 이를 최적의 인코딩이라고도 하며 일반적으로 호프만 인코딩이라고 합니다.

압축비는 압축 파일의 효과 이름을 설명하며 압축 전 파일 크기에 대한 압축 후 파일 크기의 비율입니다. 예를 들어 100m 의 파일은 90m 로 압축되고 압축비는 90/ 100* 100%=90% 입니다. 일반적으로 압축비가 작을수록 좋지만 압축률이 작을수록 압축 해제 시간이 길어집니다.

확장 데이터

호프만 코딩의 구체적인 방법: 먼저 나타나는 확률에 따라 줄을 서서 두 개의 가장 작은 확률을 새로운 확률로 더한다.

그런 다음 가장 작은 두 확률을 더하고 1 이 될 때까지 다시 줄을 서세요.

각 단계

연장전에서' 0' 과' 1' 은 모두 두 개의 가산 확률에 할당됩니다. 읽을 때 기호가 시작되고 마지막 "1" 로 이동합니다.

라우팅에서 발견된 "0" 과 "1" 을 가장 낮은 비트에서 가장 높은 비트까지 순서대로 정렬합니다. 이것이 기호의 호프만 인코딩입니다.

바이두 백과-호프만 코딩

바이두 백과-압축비