no image
Faster R-CNN 논문 리뷰
논문 링크 : Faster R-CNN최신 Object detection 모델은 객체 위치를 추정하기 위해 region proposal 알고리즘을 사용했음 (R-CNN, Fast R-CNN 모두 selective search 사용)결과적으로 region proposal 사용으로 병목현상은 지속적으로 발생병목현상 : 한 번에 처리할 수 있는 데이터의 양보다 처리할 수 있는 능력이 충분하지 않을 경우 발생하는 문제R-CNN 에서 region proposal의 selective search를 사용하기때문에 시간 소요가 크고 실시간으로 detection하는데 무리가 큼Fast R-CNN 에서는 기본적으로 GPU로 속도를 향상시켰지만 region proposal은 CPU에서 수행함으로 병목현상 발생 region p..
2024.07.22
no image
Fast R-CNN 논문 리뷰
논문 링크 : Fast R-CNNIntroduction기존의 Object detection 모델은 객체 위치까지 찾아야 하는 작업이 추가되어 multi-stage 파이프라인으로 구성되었음multi-stage 파이프라인 때문에 속도 느리고 복잡함multi-stage는 이미지분류, 객체 위치 찾는 과정을 각각 다른 파이프라인에서 수행R-CNN은 conv 훈련, SVM 분류, bounding box regression 3단계가 각각의 파이프라인에서 수행되는 multi-stage Fast R-CNN에서는 객체를 분류하는일, 후보 영역에서 정확한 위치를 탐색하는일을 동시에 수행하는 single-stage 제안 Fast R-CNN 장점훈련과 테스트 단계에서 빠른 속도를 보여줌 (R-CNN 보다)훈련이 single-..
2024.07.09
no image
SSD 논문 리뷰
논문 링크 : SSD: Single Shot MultiBox DetectorIntroductionSSD는 단일 깊은 신경망을 사용한 탐지 기법예측 단계에서 SSD는 디폴트 박스 내 객체 카테고리 존재 여부를 점수화하여 디폴트 박스가 객체 모양과 더 일치하도록 조정디폴트 박스는 YOLO에서의 anchor box와 같은 개념SSD는 다양한 크기의 객체를 탐지하도록 서로 다른 해상도를 갖는 여러 피처 맵의 예측 결과를 활용함SSD는 영역 추정을 필요로 하는 다른 객체 탐지 기법에 비해 상대적으로 간단함→ 영역 추정 단계와 반복적인 피처 샘플링을 제거하여 모든 연산을 단일 네트워크로 수행하기 때문에, 이런 과정 때문에 훈련이 잘 됨 또한 다른 객체 탐지 요소와 결합도 쉬움훈련과 예측을 단일 프레임워크로 처리한다..
2024.07.09
no image
R-CNN 논문 리뷰
R-CNN 논문 : R-CNN요약Object Detection 성능이 정체되었고 그중 가장 좋은 성능을 가진 알고리즘 보더 mAP score 30% 이상을 높혀 53.3% mAP 달성mAP(mean Avergae Precision)객체 탐지의 성능을 측정하는 대표적인 지표객체 탐지를 위한 영역 제안에 CNN 적용영역 제안(Region Proposal)이미지 안에서 객체가 있을 만한 후보 영역을 먼저 찾아주는 방법, Selective Search (선택적 탐색)이 속함Selective Search 알고리즘R-CNN에서 사용하고 YOLO에서 안씀—> YOLO부터는 conv 내부에서 처리Segmentation과 Exhaustive search 두 방법을 결합해 후보영역 추천Segmentation : 이미지 구..
2024.07.05
no image
HOG, SIFT Object detection 발전과정
HOG보행자 검출이나 사람의 형태에 대한 검출image의 지역적인 Gradient를 해당 영상의 특징으로 사용하는 방법대상 영역을 일정 크기의 셀로 나누고, 각 셀마다 edge 픽셀들의 방향에 대한 히스토그램을 구한 후 이들 히스토그램의 bin 값을 일렬로 연결한 벡터HOG의 특징hog는 위의 (g) 그림처럼 Edge의 양과 방향을 구분하는 특성을 가짐overlap을 이용하여 계산하기 때문에 어느 정도 변화에도 적응할 수 있는 능력을 갖춤overlap : gradient 누적값을 의미HOG는 Edge를 사용하기 때문에 기본적으로 영상의 밝기 변화, 조명 변화 등에 덜 민감한 특징을 가짐HOG 과정입력 영상으로부터 각 pixel의 Gradient의 크기와 방향을 계산입력 영상의 이미지의 픽셀의 밝기 값은 ..
2024.07.03
no image
USAD 논문 리뷰
USAD 논문 : USADIntroductionAE-based & GAN-based anomaly detection 모델에 한계점이 존재AE-based AD : AE는 정상 데이터를 잘 복원하도록 학습되기 때문에 이상치가 정상 데이터와 유사하면 reconstruction error가 작아 이상치로 탐지되지 않음LSTM-AETraining : 정상 데이터의 reconstruction error를 기반으로 LSTM-AE를 학습하여 정상 데이터의 분포를 학습함Anomaly detection : 학습이 완료된 LSTM-AE를 기반으로 도출한 새로운 input의 reconstruction error가 threshold를 초과하면 이상치로 탐지함LSTAM-AE는 정상 데이터만으로 학습을 시켜서 정상에 대한 분포를 ..
2024.07.02
no image
U-net 논문 리뷰
논문링크 : U-net Introduction기존 AlexNet의 등장으로 분류의 영역이 커짐하지만 기존의 한 이미지를 분류하기보다 픽셀별로 클래스 분류를 해야하는 Localization이 포함된 Classification도 필요성이 늘어남이를 해결하기 위해 픽셀 주변의 영역을 포함한 정보를 통해 해당 객체가 무엇을 나타내는지 판단하는 방법을 사용함결과적으로 학습 데이터가 이미지 단위가 아닌 이미지 속 일부가 학습 단위가 됨 (풍부한 데이터셋 구현 가능, 속도가 느림, 많은 max-pooling layer 필요, localization accuracy 감소)localization : bbox에서 원하는 객체를 찾는 회귀전체이미지가 아닌 이미지속 일부 : patch이런 문제점 때문에 U-net이 고안됨U-..
2024.07.02
no image
Pytorch 기본기 - 5
데이터 출처 : Kaggle구글 코랩에서 실행하기Kaggle simpsons data example심슨에 나온 다양한 캐릭터를 분류하는 classification model 연습Kaggle data 불러오기# Kaggle json 넣기!pip install kagglefrom google.colab import filesfiles.upload()Kaggle API 에서 얻은 kaggle.json 입력# 데이터 다운로드 kaggle api!mkdir -p ~/.kaggle!cp kaggle.json ~/.kaggle/kaggle.json!chmod 600 ~/.kaggle/kaggle.json!ls -al ~/.kaggle/!kaggle datasets download -d alexattia/the-sim..
2024.07.02
no image
Pytorch 기본기 - 4
참고 : pytorch 전이학습(Transfer Learning) 튜토리얼충분한 크기의 데이터셋을 갖추는 경우가 상대적으로 어려움이를 해결하기 위해 전이학습 사용2가지 전이학습 방법합성곱 신경망의 미세조정 방법무작위 초기화 대신에 미리 학습된 신경망을 가져와 초기화 후 학습고정 특정 추출기로써의 합성곱 신경망마지막의 완전히 연결된 계층을 제외한 모든 신경망의 가중치 고정마지막 FC는 새로운 무작위의 가중치를 갖는 계층으로 대체 학습할 데이터 불러오기75개의 검증용 이미지class는 ants, bees# 학습을 위한 데이터 증가(Augmentation)와 일반화하기# 단지 검증을 위한 일반화하기data_transforms = { 'train': transforms.Compose([ tra..
2024.07.02