🔹 CNN 주요 모델 흐름 정리
✔ 1. LeNet-5
- 초기 CNN 모델 (손글씨 숫자 인식)
- 구조:
Conv → Pooling → Conv → Pooling → FC → Classification
특징:
- 단순한 구조
- CNN 기본 형태의 시작
✔ 2. AlexNet
LeNet과 차이
- 훨씬 깊은 구조 (깊이 증가)
- ReLU 사용 (기존 tanh → 학습 속도 개선)
- Dropout 도입 (과적합 방지)
- GPU 사용 (연산 속도 개선)
- ReLU 사용 (기존 tanh → 학습 속도 개선)
- Dropout 도입 (과적합 방지)
- GPU 사용 (연산 속도 개선)
의미:
딥러닝 붐의 시작 (ImageNet 우승)
✔ 3. VGG16
특징:
- 3×3 작은 필터만 반복 사용
- 구조가 매우 단순 (Conv 쌓기)
- 깊은 네트워크
- 구조가 매우 단순 (Conv 쌓기)
- 깊은 네트워크
장점:
이해하기 쉽고 구조가 깔끔
단점:
파라미터 많음 (무거움)
✔ 4. GoogLeNet
핵심:
Inception Module 도입
특징:
- 1×1, 3×3, 5×5 필터를 병렬로 사용
- 다양한 스케일 특징 추출
- 1×1 conv로 채널 줄여서 연산량 감소
- 다양한 스케일 특징 추출
- 1×1 conv로 채널 줄여서 연산량 감소
→ “깊이 + 병렬 구조로 효율 증가” ✔
✔ 5. ResNet
핵심:
Skip Connection (Residual Block)
특징:
출력 = F(x) + x
해결한 문제:
깊어질수록 성능 떨어지는 문제(degradation)
장점:
- 매우 깊은 네트워크 가능
- gradient 흐름 개선
- gradient 흐름 개선
🔹 Transformer와의 연결 (보완)
ResNet의 skip connection 개념은
Transformer에서도 그대로 사용됨
Transformer에서도 그대로 사용됨
단, Transformer는 attention 기반 모델이라 구조 자체는 다름
🔹 CNN 개념 정리 (수정 포함🔥)
✔ 뉴런 (Neuron)
뉴런 = 출력 feature map의 각 위치 값 하나
공식:
뉴런 수 = height × width × 채널 수
✔ 가중치 (Weight)
필터 1개 weight = filter_height × filter_width × C_in
“한 칸마다 채널 수만큼 weight 존재” ✔
✔ 채널 수 (Channel)
채널 = feature map 개수 (특징의 종류)
✔ 입력 채널
흑백 이미지 → 1
RGB 이미지 → 3
RGB 이미지 → 3
✔ Conv 이후 채널
채널 수 = 필터 개수
C_out = number of filters
'AI > 개념' 카테고리의 다른 글
| 파인튜닝 추천 전략 및 팁 (0) | 2026.04.28 |
|---|---|
| 비전 객체탐지 모델 응용 및 전이학습(심화) (0) | 2026.04.28 |
| 비전 객체탐지 모델 응용 및 전이학습 (0) | 2026.04.27 |
| CNN 프리뷰 (초간단 CNN 개념 정리) (0) | 2026.04.23 |
| 인공신경망 모델의 구조와 동작원리 (0) | 2026.04.21 |