중화사전망 - 서예자전 - 이미지 처리

이미지 처리

제 3 장 이미지 처리

출력 이미지의 픽셀 값은 입력 이미지의 픽셀 값으로만 결정됩니다.

1..1픽셀 변환

-응? 픽셀에서 출력 픽셀을 생성합니다. 여기 픽셀은 여러 그림의 픽셀이 될 수 있습니다.

1.2 색상 변환

-응? 컬러 이미지의 채널 사이에는 강한 상관 관계가 있습니다.

1.3 합성 및 그리기

-응? 이미지 배경에서 전경 오브젝트를 추출하는 것을 매트 라고 합니다. 한 오브젝트를 다른 이미지에 삽입하는 것을 컴포지션이라고 합니다.

1.4 히스토그램 평준화

대비 및 밝기 매개변수는 이미지의 모양을 향상시킵니다. 이 두 매개변수를 자동으로 조정하는 두 가지 방법이 있습니다. 한 가지 방법은 이미지에서 가장 밝은 값과 가장 어두운 값을 찾아 순백색과 순수한 검정에 매핑하는 것입니다. 또 다른 방법은 이미지의 평균 픽셀 값을 픽셀의 중간 그레이스케일 값으로 구한 다음 전체 범위를 가능한 표시 가능한 값에 도달하는 것입니다.

로컬 어댑티브 히스토그램 균형은 영역마다 다른 균형 방법을 사용합니다. 단점은 블록 효과가 발생한다는 것입니다. 즉, 블록 경계에서 밝기가 연속적이지 않다는 것입니다. 이러한 영향을 제거하기 위해 이동 창이나 블록 사이의 전송 함수는 일반적으로 부드러운 보간에 사용됩니다.

1.5 적용: 색조 조정

도트 연산자의 일반적인 영역은 사진의 대비와 색조를 조작하는 것입니다.

점 연산자에 해당하는 이웃 산자는 선택한 픽셀과 주변 픽셀을 기준으로 픽셀의 출력을 결정합니다. 이웃 산자는 로컬 색조 조정뿐만 아니라 이미지 매끄러움과 선명 및 이미지 노이즈 제거에도 사용됩니다.

이웃 산자의 중요한 개념은 컨볼 루션과 관계이며, 이들은 모두 선형 변환 불변산자로, 중첩 원리와 이동 불변의 원리를 만족시킨다.

채우기, 컨볼 루션 코어가 이미지 경계를 초과하면 경계 효과가 발생합니다. 포장 방법에는 0 포장, 상수 포장, 클램핑 포장, 중첩 포장, 미러 포장 및 확장 포장과 같은 여러 가지가 있습니다.

-응? -응? 2. 1 분리가능 필터

컨볼 루션 연산이 1 차원 행 벡터 컨볼 루션과 1 차원 열 벡터 컨볼 루션으로 분해 될 수 있다면 컨볼 루션 코어는 분리 가능합니다. 2D 커널 함수는 K 의 첫 번째 기이한 값이 0 인 경우에만 K 를 분리할 수 있는 행렬 K 로 간주할 수 있습니다.

2.2 선형 필터의 예

가장 간단한 필터는 슬라이딩 평균 또는 블록 필터이고, 그 다음은 쌍선형 필터 (쌍선형 코어) 와 가우스 필터 (가우스 코어) 로 저통핵, 흐릿한 코어, 부드러운 코어입니다. 푸리에 분석은 이러한 커널 함수의 효과를 측정하는 데 사용됩니다. 소벨 연산자와 코너 연산자가 있습니다.

2.3 대역 통과 필터 및 조향 필터

소벨 연산자는 방향 필터의 근사치입니다. 먼저 가우스 핵으로 이미지를 매끄럽게 한 다음 방향 도수 (라플라스 산자) 로 이미지에 작용하여 스티어링 필터를 얻습니다. 방향은 잠재적인 국부적이고 좋은 스케일 공간 특성을 가지고 있다. 방향 필터는 일반적으로 피쳐 설명자 및 모서리 탐지기를 구성하는 데 사용되며, 선형 구조는 일반적으로 모서리 모양으로 간주됩니다.

영역 합계표는 특정 영역 내의 모든 픽셀 값의 합계이며 통합 이미지라고도 합니다. 효과적인 계산 방법은 재귀 알고리즘 (래스터 스캔 알고리즘) 입니다. 영역과 테이블은 다른 컨볼 루션 코어, 얼굴 감지의 다중 스케일 피쳐, 스테레오 비전의 차이 제곱합 계산에 사용됩니다.

IIR (무한 임펄스 응답) 이라고 하는 재귀 필터는 2D 거리 함수와 연결량을 계산하는 데 사용되거나 넓은 영역 스무딩을 계산하는 데 사용될 수 있습니다.

3. 1 비선형 필터

중앙값 필터는 산입자 노이즈를 제거할 수 있으며, 또 다른 장점은 가장자리 평활이 유지된다는 것입니다. 즉, 고주파 노이즈를 필터링할 때 가장자리가 쉽게 부드러워지지 않는다는 것입니다.

양자 필터 사상의 본질은 고정 비율의 픽셀을 억제하는 것이 아니라 중심 픽셀 값과 큰 차이가 있는 픽셀을 억제하는 것입니다. 가중치 필터를 기준으로 가중치 계수를 제어합니다. 즉, 정의된 도메인 코어 (가우스 코어) 와 값 도메인 코어 (중심 픽셀 값과 비슷한 정도) 에 따라 두 개의 필터 코어를 곱합니다.

반복 적응 스무딩 커널 이방성 확산.

3.2 형태학

비선형 필터는 일반적으로 이진 이미지 처리에 사용됩니다. 형태학 연산자는 이진 이미지에서 가장 일반적인 연산자입니다. 이진 구조 요소를 이진 이미지와 컨볼 루션 하여 컨볼 루션 결과의 임계값에 따라 이진 출력을 선택합니다. 구조 요소는 모든 모양이 될 수 있습니다.

일반적인 형태학 연산은 팽창, 부식, 반교차, 개연산, 폐쇄연산이다. 뾰족한 모서리의 절반은 매끄럽게 되고, 개폐 작업을 통해 이미지의 작은 점과 작은 구멍을 제거하여 이미지를 매끄럽게 합니다.

3.3 거리 변환

거리 변환은 두 번의 래스터 스캔 방법을 사용하여 도시 거리 거리 변환 및 유클리드 거리 변환을 포함하여 곡선 또는 점 세트까지의 거리를 신속하게 예측할 수 있습니다. 심볼 거리 변환은 모든 픽셀에서 경계 픽셀까지의 거리를 계산하는 기본 거리 변환의 확장입니다.

3.4 연결 도메인

이미지 연결을 감지하는 것은 반 글로벌 이미지 작업입니다. 연결은 동일한 입력 값을 가진 인접 픽셀의 영역으로 정의됩니다. 2 값 또는 다중 값 이미지를 링크로 나눈 후 각 개별 영역에 대한 통계, 면적, 둘레, 면중심점 및 2 차 모멘트를 계산합니다. 영역 정렬 및 영역 일치에 사용할 수 있습니다.

-응? 푸리에 변환 분석 필터의 주파수 영역 특성을 이용하여 FFT 는 대규모 핵의 컨볼 루션을 신속하게 실현할 수 있다.

-응? 사고: 필터의 주파수 특성을 분석하기 위해 알려진 주파수의 사인파가 필터를 통과하여 사인파의 약화 정도를 관찰할 수 있습니다. 푸리에 변환은 입력 신호를 사인 신호 s(x) 로 간주할 수 있으며, 필터 h(x) 를 통과한 후 출력 응답은 사인 신호 o(x)=s(x)*h(x) 로 간주될 수 있습니다. 푸리에 변환은 각 주파수의 진폭 및 위상 응답의 간단한 리스트입니다. 푸리에 변환은 필터뿐만 아니라 신호 및 이미지에도 사용할 수 있습니다.

-응? 푸리에 변환의 특성: 오버레이, 변환, 반전, 회선, 관련, 곱셈, 미분, 도메인 확대/축소, 실제 이미지, 파세발 정리.

-응? 4. 1 푸리에 변환 쌍

-응? 일반적인 푸리에 변환 쌍, 연속적이고 이산적입니다. 푸리에 변환에 편리하다.

고주파 구성요소는 다운샘플링에서 겹침을 발생시킵니다.

-응? 4.2 2D 푸리에 변환

2 차원 이미지와 필터를 처리하기 위해 1 차원 푸리에 변환과 유사한 2 차원 푸리에 변환이 제안되었습니다. 단 스칼라는 벡터로 대체되고 곱셈은 벡터 내부 곱으로 대체됩니다.

4.3 위너 필터

푸리에 변환은 비너 필터가 등장하는 이미지 클래스의 전체 스펙트럼을 분석하는 데도 사용할 수 있습니다. 이러한 이미지가 임의 노이즈 필드에 있다고 가정하면 각 주파수의 예상 크기는 전력 스펙트럼에 의해 제공되고 신호 전력 스펙트럼은 공간 통계의 1 차 설명을 캡처합니다. 위너 필터는 전력 스펙트럼이 P 인 이미지 노이즈를 제거하는 데 적합합니다.

비너 필터의 특성은 저주파 단위 이득, 고주파 감쇠 효과입니다.

이산 코사인 변환 (DCT) 은 블록별 이미지 압축을 처리하는 데 자주 사용됩니다. 이 계산은 일련의 다른 주파수의 코사인 점으로 폭이 N 인 블록의 픽셀을 축적하는 것입니다.

DCT 변환의 본질은 자연 이미지의 일부 작은 영역에 대한 최적의 KL 분해 (PCA 주성분 분석의 근사치) 이며 KL 은 관련 신호를 효과적으로 제거할 수 있습니다.

소파 알고리즘과 DCT 의 겹치는 변형은 사각형 효과를 효과적으로 제거할 수 있습니다.

4.4 응용 프로그램: 선명, 블러 및 노이즈 제거

-응? 선명 효과 및 노이즈 제거는 이미지를 효과적으로 향상시킵니다. 기존의 방법은 선형 필터 산자를 사용하는 것인데, 현재 비선형 필터 산자 (예: 가중치 중앙값과 양자 필터, 비등방성 확산 및 비국부 평균, 변분법 등) 를 광범위하게 사용하고 있습니다.

-응? 피크 노이즈 비율 (PNSR) 과 구조 유사성 (SSIM) 은 이미지 노이즈 제거 알고리즘의 효과를 측정하는 데 자주 사용됩니다.

지금까지 이미지 변형의 출력 이미지 크기는 입력 이미지 크기와 같습니다. 컴퓨터 해상도에 맞게 작은 이미지를 보간하거나, 알고리즘 실행 속도를 높이거나, 저장 공간과 전송 시간을 절약하기 위해 이미지 크기를 줄이는 등 해상도가 다른 이미지를 처리하기 위해

이미지를 처리하는 데 필요한 해상도를 모르기 때문에 여러 가지 다른 이미지에서 이미지 피라미드를 구성하여 다중 스케일 인식 및 편집 작업을 수행합니다. 이미지 해상도를 변경하는 더 좋은 필터는 보간 필터와 다운샘플링 필터입니다.

-응? 5. 1 보간

이미지를 더 높은 해상도로 확대하려면 보간을 사용하여 이미지를 컨볼 루션해야 합니다. 2 차 보간에 일반적으로 사용되는 방법은 쌍선형 보간, 2 차 보간 및 창 함수입니다. 창 함수는 저해상도 이미지의 세부 사항을 유지하고 겹침을 방지하기 때문에 최고 품질의 보간기로 간주됩니다.

5.2 다운샘플링

다운샘플링은 이미지의 해상도를 낮추기 위한 것입니다. 먼저 저역 통과 필터를 사용하여 이미지를 컨볼 루션하여 겹침을 피한 다음 R 샘플을 유지합니다. 일반적으로 사용되는 다운샘플링 필터에는 선형 필터, 2 차 필터, 3 차 필터, 창 코사인 필터, QMF-9 필터 및 JPEG2000 필터가 포함됩니다.

5.3 다중 해상도 표현

다운샘플링 및 보간 알고리즘을 통해 전체 이미지 피라미드를 만들 수 있습니다. 이 피라미드는 굵은에서 가는 검색 알고리즘을 가속화하여 다양한 크기의 객체와 패턴을 찾거나 다중 해상도 융합 작업을 수행할 수 있습니다.

컴퓨터 비전에서 가장 유명한 피라미드는 라플라스 피라미드이다. 원본 이미지가 흐려지고 크기 2 의 계수로 2 차 샘플링한 다음 피라미드의 다음 수준에 저장됩니다.

-응? 5.4 웨이브 렛 변환

웨이블릿은 공간 및 주파수 영역에서 신호를 찾는 필터이며 다른 크기로 정의됩니다. 웨이블릿은 멀티 스케일 방향 필터링 및 노이즈 제거에 사용할 수 있습니다. 기존의 피라미드에 비해 웨이블릿은 더 나은 방향 선택성을 가지고 있으며 컴팩트한 프레임워크를 제공합니다.

리프트 웨이블릿은 2 세대 웨이블릿이라고 불리며 비정규 샘플링 토폴로지에 쉽게 적응할 수 있으며 방향을 바꿀 수 있는 멀티 스케일 변환이 있습니다. 그들의 표현은 지나치게 완전할 뿐만 아니라 방향 선택성도 있다.

-응? 5.5 응용 프로그램: 이미지 융합

라플라스 피라미드 응용 프로그램, 혼합 합성 이미지. 혼합 이미지를 생성하기 위해 각 원본 이미지는 자체 라플라스 피라미드로 분해되고 각 밴드에 피라미드 등급에 비례하는 부드러운 가중치 함수를 곱합니다. 가장 쉬운 방법은 이진 마스크 이미지를 만들고 이 이미지에서 가우스 피라미드를 생성한 다음 라플라스 피라미드와 가우스 마스크라는 두 개의 가중 피라미드를 결합하여 최종 이미지를 생성하는 것입니다.

점 조작에 비해 이미지의 범위를 변경하는 반면 기하학적 변형은 이미지의 선명도를 변경하는 데 중점을 둡니다. 초기 방법은 전역적으로 파라메트릭 2D 변환을 수행한 다음 메시 기반 로컬 변형과 같은 보다 일반적인 변형으로 주의를 돌리는 것입니다.

6. 1 매개 변수 변환

매개 변수 변형은 전체 이미지를 전역적으로 변형합니다. 여기서 변형 동작은 몇 개의 매개 변수에 의해 제어되며, 역감기 또는 역매핑의 성능은 정방향 굴곡보다 우수합니다. 이는 주로 구멍과 정수가 아닌 위치 리샘플링 문제를 방지하기 때문입니다. 또한 고품질 필터를 사용하여 앨리어싱을 제어할 수 있습니다.

대상 픽셀 x' 에서 원본 픽셀 X 로의 매핑을 지정하면 이미지 감김 문제가 원본 이미지를 리샘플링하도록 형식화될 수 있습니다. 역법의 유사한 응용은 광류 방법으로, 광류를 예측하고 렌즈의 방사형 왜곡을 교정한다.

리샘플링 중 보간 필터에는 2 차 보간, 3 차 보간, 창 보간, 속도에 대한 2 차 보간, 시각적 품질에 대한 3 차 보간 및 창 보간이 포함됩니다.

MIP 맵은 텍스처 맵을 위한 빠른 사전 필터링된 이미지 도구입니다.

MIP 이미지는 표준 이미지 피라미드로, 각 레이어는 저품질의 근사치가 아닌 고품질 필터로 필터링됩니다. 리샘플링할 때 리샘플링 속도 r 을 추정해야 합니다.

타원 가중 평균 필터 (EWA), 비등방성 필터, 다중 채널 변환

방향 이진 필터 및 리샘플링 작업은 일련의 1 차원 리샘플링 및 전단 변환을 통해 근사화될 수 있습니다. 일련의 1 차원 변환을 사용하면 크고 분리할 수 없는 이진 필터 코어보다 더 효과적이라는 장점이 있습니다.

6.2 메쉬 변형 기준

더 많은 자유 로컬 변형을 얻기 위해 메쉬 감김이 발생합니다. 희소한 제어점, 밀집 세트, 유향 세그먼트 분할, 변위 필드 결정.

6.3 응용 프로그램: 기능 기반 형태학

감싸기는 일반적으로 단일 이미지의 모양을 변경하여 애니메이션을 만들거나 여러 이미지를 혼합하여 강력한 변형 효과를 내는 데 사용됩니다. 단순히 두 이미지 사이를 페이드하면 고스트가 발생할 수 있지만 이미지 감기를 사용하여 좋은 대응 관계를 설정하면 해당 기능이 정렬됩니다.

몇 가지 최적화 기준을 사용하여 변경하고자 하는 목표를 명확하게 표현한 다음, 그 기준에 대한 해결책을 찾거나 추론한다. (존 F. 케네디, 노력명언) 정규화 및 변분법은 솔루션의 특징을 설명하는 연속적인 글로벌 에너지 함수를 구성한 다음 스파스 선형 시스템이나 관련 반복 방법을 사용하여 최소 에너지 솔루션을 찾습니다. 베이지안 통계는 잡음 측정 과정과 솔루션 공간에 대한 선험적 가설을 모델링하는데, 일반적으로 마르코프 랜덤 필드에 의해 코드화된다. 일반적인 예로는 해시 데이터의 표면 보간, 이미지 노이즈 제거 및 누락된 영역 복구, 전경 및 배경 영역으로 분할된 이미지가 있습니다.

-응? 7. 1 정규화

정규화 이론은 모델을 사용하여 심각한 불충분한 제약 조건으로 공간의 데이터를 해석하려고 합니다. 측량 데이터 점이 매끄러운 서피스와 교차하거나 근사화되는 문제 세트입니다. 이런 문제는 병세와 불편함이다. 이런 방식으로 샘플링 데이터 포인트 d(xi, yi) 에서 전체 이미지 f(x, Y) 를 복구하는 문제를 역문제라고 합니다.

부드러운 솔루션을 정의하기 위해 일반적으로 솔루션 공간에서 표준을 정의합니다. 1 차원 함수의 경우 함수의 1 차 미분의 제곱을 적분하거나 함수의 2 차 미분의 제곱을 적분합니다. 이 에너지 측정은 함수를 스칼라 값에 매핑하는 함수 및 연산자의 예입니다. 이 방법을 변분법이라고 하며 함수의 변화 (비매끄러움) 를 측정하는 데 사용됩니다.

7.2 마르코프 랜덤 필드

7.3 응용 프로그램: 이미지 복원