Computer vision
- 컴퓨터 공학의 한 분야로 컴퓨터 시각(vision) 데이터를 처리하는 분야로 영상 처리와 패턴 인식을 포함한다.
- 어떻게 적용되는가?
- 이미지의 각 픽셀을 2D 벡터로 표현하고, 2D 벡터를 사용하여 이미지 데이터를 조작하고 분석한다.
- 2D 벡터 기반의 기계 학습 알고리즘을 사용하여 패턴 인식 문제를 해결하는 데에도 활용된다.
사용 예시
- 손글씨 인식
- 얼굴 및 물체 인식
- ex. 아이폰의 Face ID: 적외선 카메라를 이용한 보안성 높은 얼굴 인식
- 가장 흔히 볼 수 있는 컴퓨터 비전으로, 휴대폰 카메라로 할 수 있는 QR 코드/바코드 스캐닝, 페이스북의 얼굴 인식 등 생각보다 많은 일상생활 분야에 사용된다.
- 모션 트래킹: 광학식 모션 캡쳐, 립모션을 이용한 손의 움직임 감지, 오큘러스 퀘스트의 일부 적외선 카메라를 이용한 손 움직임 감지 등 영상 정보로부터 관절의 위치를 역산하여 움직임을 구현한다.
- 시각적 주행 측정과 광학 흐름(optical flow)
- 자율주행 자동차
인공지능 모델로는 CNN, selft-supervised learning, GAN, autoencoder, VAE, flow-based model, diffusion model, score based model, NeRF, super resolution 등이 있다.
나무위키 컴퓨터 비전
https://namu.wiki/w/%EC%BB%B4%ED%93%A8%ED%84%B0%20%EB%B9%84%EC%A0%84
'Deep Learning & Machine Learning > Computer Vision' 카테고리의 다른 글
[코드없는 프로그래밍] 딥러닝, CNN options (0) | 2024.04.15 |
---|---|
[코드없는 프로그래밍] 딥러닝, CNN Depth Channel (0) | 2024.04.15 |
[코드없는 프로그래밍] 딥러닝 CNN (0) | 2024.04.15 |
[코드없는 프로그래밍] 딥러닝 이미지 전처리 (0) | 2024.04.14 |
[코드없는 프로그래밍] 딥러닝, 컴퓨터비전, 이미지 읽기 (0) | 2024.04.14 |