no image
HRNet 논문 리뷰
논문링크참고자료1참고자료2Pose Estimation 설명body part를 예측하는 분야로써 2D, 3D로 나눌수 있음2D는 single person, multi person으로 나눔신체의 머리, 어깨, 관절 등의 keypoint를 예측하는 방법으로 Direct Regression, Heatmap regression으로 나눌수 있음Direct regression2차원 이미지 픽셀 값을 입력값으로 이용해 바로 좌표를 추정하는 방식빠른 학습이 가능, 다수의 사람이 존재할 경우 적용이 어려움keypoints 위치가 비선형적임으로 적합하게 매핑하기 어렵다는 문제가 존재Heatmap regression신체 부위중 keypoints가 존재할 만한 위치를 확률적으로 heatmap으로 계산하고 keypoints 위치..
2024.07.22
no image
On The Convergence of Adam and Beyond 논문 리뷰
On The Convergence of Adam and Beyond 논문 1. 사전에 알고 가야하는 Optimizer 1-1. SGD장점전체 data를 가지고 한 번에 loss function을 계산하는 것이 아닌 전체 데이터의 일부만으로 loss function을 계산함loss function을 여러번 빠르게 계산이 가능함단점loss function의 최솟값을 찾기 위해 자주 step의 방향을 바꿔야 해서 학습이 불안정함순간순간의 기울기에 따라 방향이 결정되어서 상황에 따라서 비효율적인 Local minimum 수렴 1-2. Momentum장점현재 Gradient를 통해 이동하는 방향과 별개로 과거에 이동했던 방식을 기억하면서 그 방향으로 일정량을 주기적으로 이동하는 방식local minimum에 빠지..
2024.07.22
no image
Mask R-CNN 논문 리뷰
논문 링크 : Mask R-CNN 요약Mask R-CNN은 일반적으로detection task보다는 instance segmentation task에서 주로 사용Instance segentation이미지 내에 존재하는 모든 객체를 탐지하는 동시에 각각의 경우를 정확하게 픽셀 단위로 분류하는 task객체를 탐지하는 object detection task와 각각의 픽셀의 카테고리를 분류하는 semantic segmentation task가 결합된 것위 그림을 보면 Semantic segmentation과 Instance segmentation의 차이를 확인할수있음객체도 잡히고 배경도 그대로Mask R-CNN은 Faster R-CNN의 RPN에서 얻은 RoI(Region of Interest)에 대하여 객체의..
2024.07.22
no image
YOLO 논문 리뷰
논문링크요약Yolo 논문에서 Object detection에 대한 새로운 접근방식을 적용함Object detection 이란?여러 물체에 대해 어떤 물체가 어디에 있는지 알아내는 작업 기존의 multi-task 문제를 하나의 회귀 문제로 재정의multi-task?서로 연관 있는 과제들을 동시에 학습함으로써 모든 과제 수행의 성능을 전반적으로 향상시키려는 학습 패러다임장점Knowledge Transfer : 각각의 task를 학습하면서 얻은 정보가 서로 다른 task 들에 좋은 영향을 줌Overfitting 감소 : 여러 task를 동시에 수행하기 때문에 보다 일반화된 특징표현에 중심으로 학습함Computational Efficiency : 하나의 신경망으로 여러 task를 동시에 수행단점Negative ..
2024.07.22
no image
Faster R-CNN 논문 리뷰
논문 링크 : Faster R-CNN최신 Object detection 모델은 객체 위치를 추정하기 위해 region proposal 알고리즘을 사용했음 (R-CNN, Fast R-CNN 모두 selective search 사용)결과적으로 region proposal 사용으로 병목현상은 지속적으로 발생병목현상 : 한 번에 처리할 수 있는 데이터의 양보다 처리할 수 있는 능력이 충분하지 않을 경우 발생하는 문제R-CNN 에서 region proposal의 selective search를 사용하기때문에 시간 소요가 크고 실시간으로 detection하는데 무리가 큼Fast R-CNN 에서는 기본적으로 GPU로 속도를 향상시켰지만 region proposal은 CPU에서 수행함으로 병목현상 발생 region p..
2024.07.22
no image
Fast R-CNN 논문 리뷰
논문 링크 : Fast R-CNNIntroduction기존의 Object detection 모델은 객체 위치까지 찾아야 하는 작업이 추가되어 multi-stage 파이프라인으로 구성되었음multi-stage 파이프라인 때문에 속도 느리고 복잡함multi-stage는 이미지분류, 객체 위치 찾는 과정을 각각 다른 파이프라인에서 수행R-CNN은 conv 훈련, SVM 분류, bounding box regression 3단계가 각각의 파이프라인에서 수행되는 multi-stage Fast R-CNN에서는 객체를 분류하는일, 후보 영역에서 정확한 위치를 탐색하는일을 동시에 수행하는 single-stage 제안 Fast R-CNN 장점훈련과 테스트 단계에서 빠른 속도를 보여줌 (R-CNN 보다)훈련이 single-..
2024.07.09
no image
SSD 논문 리뷰
논문 링크 : SSD: Single Shot MultiBox DetectorIntroductionSSD는 단일 깊은 신경망을 사용한 탐지 기법예측 단계에서 SSD는 디폴트 박스 내 객체 카테고리 존재 여부를 점수화하여 디폴트 박스가 객체 모양과 더 일치하도록 조정디폴트 박스는 YOLO에서의 anchor box와 같은 개념SSD는 다양한 크기의 객체를 탐지하도록 서로 다른 해상도를 갖는 여러 피처 맵의 예측 결과를 활용함SSD는 영역 추정을 필요로 하는 다른 객체 탐지 기법에 비해 상대적으로 간단함→ 영역 추정 단계와 반복적인 피처 샘플링을 제거하여 모든 연산을 단일 네트워크로 수행하기 때문에, 이런 과정 때문에 훈련이 잘 됨 또한 다른 객체 탐지 요소와 결합도 쉬움훈련과 예측을 단일 프레임워크로 처리한다..
2024.07.09
no image
R-CNN 논문 리뷰
R-CNN 논문 : R-CNN요약Object Detection 성능이 정체되었고 그중 가장 좋은 성능을 가진 알고리즘 보더 mAP score 30% 이상을 높혀 53.3% mAP 달성mAP(mean Avergae Precision)객체 탐지의 성능을 측정하는 대표적인 지표객체 탐지를 위한 영역 제안에 CNN 적용영역 제안(Region Proposal)이미지 안에서 객체가 있을 만한 후보 영역을 먼저 찾아주는 방법, Selective Search (선택적 탐색)이 속함Selective Search 알고리즘R-CNN에서 사용하고 YOLO에서 안씀—> YOLO부터는 conv 내부에서 처리Segmentation과 Exhaustive search 두 방법을 결합해 후보영역 추천Segmentation : 이미지 구..
2024.07.05
no image
HOG, SIFT Object detection 발전과정
HOG보행자 검출이나 사람의 형태에 대한 검출image의 지역적인 Gradient를 해당 영상의 특징으로 사용하는 방법대상 영역을 일정 크기의 셀로 나누고, 각 셀마다 edge 픽셀들의 방향에 대한 히스토그램을 구한 후 이들 히스토그램의 bin 값을 일렬로 연결한 벡터HOG의 특징hog는 위의 (g) 그림처럼 Edge의 양과 방향을 구분하는 특성을 가짐overlap을 이용하여 계산하기 때문에 어느 정도 변화에도 적응할 수 있는 능력을 갖춤overlap : gradient 누적값을 의미HOG는 Edge를 사용하기 때문에 기본적으로 영상의 밝기 변화, 조명 변화 등에 덜 민감한 특징을 가짐HOG 과정입력 영상으로부터 각 pixel의 Gradient의 크기와 방향을 계산입력 영상의 이미지의 픽셀의 밝기 값은 ..
2024.07.03