본문 바로가기

Deep Learning & Machine Learning/Computer Vision

컴퓨터 비전 개요

Computer vision

  • 컴퓨터 공학의 한 분야로 컴퓨터 시각(vision) 데이터를 처리하는 분야로 영상 처리와 패턴 인식을 포함한다. 
  • 어떻게 적용되는가? 
    • 이미지의 각 픽셀을 2D 벡터로 표현하고, 2D 벡터를 사용하여 이미지 데이터를 조작하고 분석한다.
    • 2D 벡터 기반의 기계 학습 알고리즘을 사용하여 패턴 인식 문제를 해결하는 데에도 활용된다. 

사용 예시

  • 손글씨 인식
  • 얼굴 및 물체 인식
    • ex. 아이폰의 Face ID: 적외선 카메라를 이용한 보안성 높은 얼굴 인식
    • 가장 흔히 볼 수 있는 컴퓨터 비전으로, 휴대폰 카메라로 할 수 있는 QR 코드/바코드 스캐닝, 페이스북의 얼굴 인식 등 생각보다 많은 일상생활 분야에 사용된다. 
  • 모션 트래킹: 광학식 모션 캡쳐, 립모션을 이용한 손의 움직임 감지, 오큘러스 퀘스트의 일부 적외선 카메라를 이용한 손 움직임 감지 등 영상 정보로부터 관절의 위치를 역산하여 움직임을 구현한다.
  • 시각적 주행 측정과 광학 흐름(optical flow)
  • 자율주행 자동차 

 

인공지능 모델로는 CNN, selft-supervised learning, GAN, autoencoder, VAE, flow-based model, diffusion model, score based model, NeRF, super resolution 등이 있다. 

 

 

나무위키 컴퓨터 비전

https://namu.wiki/w/%EC%BB%B4%ED%93%A8%ED%84%B0%20%EB%B9%84%EC%A0%84