앎을 경계하기

Machine Learning/For CV

2. 디지털 영상 기초(1)

양갱맨 2020. 10. 15. 15:34

2.1 시각적 인지의 요소

2.1.1 눈의 구조

우리의 눈은 세 개의 막이 눈을 둘러싼 구조이다.

  • 각막은 눈 앞 표면을 덮고 있는 투명한 조직이다.
  • 공막은 각막과 이어져 눈 구의 나머지를 둘러싼 불투명한 막이다.
  • 맥락막은 공막 바로 밑에 존재하며 눈에 필요한 영양분의 주 공급원인 혈관 네트워크를 포함한다. 맥락막의 외막은 빽빽하게 착색되어 눈에 들어오는 광량과 내부의 후방 산란을 줄여준다. 맥락막은 앞에서 모양체와 홍채로 갈라진다.
  • 홍채의 중앙 구멍(동공)은 직경이 변화하며, 홍채의 앞면은 눈의 가시 색소를, 뒷면은 흑색 색소를 포함한다.
  • 수정체는 모양체에 붙은 섬유에 의해 지탱된다. 눈의 다른 조직들보다 단백질을 많이 포함하고 있다. 수정체는 가시 광선의 약 8%를 흡수하고 파장이 짧을수록 흡수율이 높다. 적외선과 자외선은 모두 수정체 구조 안의 단백질에 의해 흡수된다.
  • 망막은 눈의 가장 내부에 위치한 막이며 내벽 뒷부분 전체를 덮고 있다. 눈 초점이 맞춰지면 외부 객체로부터의 빛이 망막에 비춰진다.

패턴 비전은 망막 표면에 분포된 이산 감광 세포들의 분포에 의해 제공된다. 감광 세포는 추상 세포와 간상 세포로 나뉜다.

  • 추상 세포는 망막의 중앙부(중심오목)에 위치하며 컬러에 매우 민감하다. 눈을 제어하는 근육이 관심 객체 영상이 중심오목에 들어올 때까지 안구를 회전시킨다. 추상 세포 비전은 명소시(photopic vision)로 불린다.
  • 간상 세포는 추상세포보다 훨씬 많고 분포 영역이 더 넓고 한 신경에 여러 개의 간상세포가 연결되어 있어 분간 가능한 디테일이 감소된다. 간상 세포는 전체적인 그림을 제공하며 낮은 레벨의 조명에 민감하다. 태양 빛에서 밝은 컬러의 객체가 달빛에서는 색이 없어 보이는 이유는 간상세포들만 자극되기 때문이다. 간상 세포 비전은 암소시(scotopic vision)로 불린다.

2.1.2 눈에서의 영상 형성

카메라에서는 렌즈의 초점 길이가 고정되어 있고 다양한 거리에서 포커싱은 렌즈와 필름이 놓인 영상화 평면 사이의 거리를 변화시켜서 이루어진다.

인간의 눈은 반대로 렌즈와 영상화 영역 간 거리가 고정되어 있다. 적절한 초점을 얻는 데 필요한 초점 길이가 렌즈의 모양을 변화시켜 얻어진다. 멀리 있는 객체에 대해선 모양체근 섬유가 수정체를 얇게 만들고 가까운 객체에 대해서는 두껍게 만든다.

중심오목의 영역에 초점이 맞춰져서 망막에 형성되는 영상이 생기면 감광 세포들의 여기에 의해 인지가 일어난다.

2.1.3 밝기 적응 및 구별

이 장은 따로 정리 안함

2.2 빛과 EM 스펙트럼

EM스펙트럼은 전자기파를 파장에 따라 나열한 스펙트럼으로 우리 눈으로 인지 가능한 컬러 범위도 포함된다.

EM 스펙트럼은 파장, 주파수, 에너지로 표현될 수 있다. 파장(λ)과 주파수(ν)는 다음과 같은 관계가 있다. 여기서 c는 광속이다.

에너지의 표현은 다음과 같다.

h는 플랑크 상수이다. (찾아보니 플랑크 상수는 입자의 에너지와 드브로이 진동수의 비로, 양자 역학의 기본 상수 중 하나라고 함)

파장의 단위는 m, μm, nm로 표현되고 주파수는 Hz, 에너지 단위는 eV이다.

광자는 빛을 입자로 이해할 때 광속으로 이동하는 빛의 입자를 말한다. 주파수가 높은, 파장이 짧은 EM 현상일수록 광자 당 많은 에너지를 갖는다. 따라서 가장 낮은 파인 라디오파는 낮은 에너지의 광자를 갖게된다. 가시 대역은 보라부터 빨강까지 범위에 걸쳐 있으며 보라, 파랑, 초록, 노랑, 주황, 빨강 6개의 범위로 나뉜다. 컬러의 경계는 뚜렷하지 않고 부드럽게 섞여있다. 모든 가시 파장에서 균형 잡힌 빛을 반사하는 물체는 흰색으로 보이게 된다.

단색빛은 컬러가 없는 빛을 말하는데, 단색빛의 속성은 광의 밝기뿐이다. 흑색에서 백색까지 변하는 것으로 인지되며 이것이 바로 Gray level이며 이 단색광 측정의 범위가 Gray scale이다.

색채광은 radiance, luminance, brightness로 특성 묘사가 가능하다.

  • radiance는 광원으로부터 흘러나오는 총 에너지량이며 단위는 와트(W)를 사용한다.
  • luminance는 루멘(lm) 단위를 사용하며 눈으로 볼 수 있는 에너지량을 뜻한다.
  • brightness는 밝기 개념을 말하며 밝기의 무색 개념을 표현한다.

EM 스펙트럼의 짧은 파장 부분에는 감마선과 엑스선이 존재한다. 파장이 긴 부분에는 적외선 대역이 있다 가시 스펙트럼과 가까운 적외선 부분을 근적외선, 먼 곳을 원적외선 영역이라고 한다.

객체를 보기 위해서는 EM 파의 파장이 객체보다 길어서는 안된다. 예를 들어 물 분자는 10^-10m이다. 물 분자 연구를 위해서는 10^-10m 이상 영역의 광원인 원자외선, 연X-선 영역의 광원이 필요하다.

현재까지 EM 파에 대한 이야기를 했지만 꼭 영상 생성을 위해 EM파를 활용해야하는 것은 아니다.

2.3 영상 감지 및 획득

조명은 EM 스펙트럼의 에너지원으로부터 비롯될 수 있다. 그리고 초음파나 컴퓨터로 생성된 조명 패턴 등으로도 가능하다. 광원 종류에 따라 조명 에너지는 객체를 통과하거나 반사된다.

영상 획득은 단일 센서, 띠 형태의 직렬 센서 장치, 센서 배열을 이용하여 이루어진다.

띠 형태의 센서 장치를 통해 3D 객체의 단면 영상을 얻을 수 있다. CT 촬영이 대표적인 사례이다.

센서 배열을 사용하는 것은 2D로 배치된 개별 센서들을 배열로 구성하는 방법이다. 대표적인 센서는 카메라에 사용되는 CCD이다.

2.3.4 간단한 영상 형성 모델

영상은 2D 좌표에서 f(x,y)로 표현한다. 물리적으로 영상이 생성될 때 밝기값은 물리적 광원에 의해 방사되는 에너지에 비례한다. 따라서 영상은 0이 아니고 유한해야 한다.

f(x,y)는 두 성분에 의해 특징지어질 수 있다.

  1. 조명 성분 : 관찰 장면에 입사하는 광원 조명의 양
  1. 반사 성분 : 장면 객체에 의해 반사되는 조명의 양

조명 성분, 반사 성분을 각각 i(x,y)와 r(x,y)로 표현할 때, 영상 f(x,y)는 다음으로 형성된다.

0<i(x,y)<0<r(x,y)<1f(x,y)=i(x,y)r(x,y)0<i(x,y)<\infty \\ 0<r(x,y)<1 \\ f(x,y)=i(x,y)r(x,y)\\

반사 성분은 0(완전 흡수)과 1(완전 반사)로 제한된다. 조명 성분의 경우 조명원에 의해 결정되고 반사 성분은 빛을 반사하는 객체의 특성에 의해 결정된다.

'Machine Learning > For CV' 카테고리의 다른 글

2. 디지털 영상 기초(3)  (0) 2020.10.15
2. 디지털 영상 기초(2)  (0) 2020.10.15
1. Intro(2)  (0) 2020.10.12
1. Intro(1)  (0) 2020.10.09
비전 페이퍼 스터디 : UNet3+  (0) 2020.09.26