AI/개념

CNN 주요 모델 흐름 정리

ksc036 2026. 4. 24. 22:37

🔹 CNN 주요 모델 흐름 정리

✔ 1. LeNet-5

  • 초기 CNN 모델 (손글씨 숫자 인식)
  • 구조:
Conv → Pooling → Conv → Pooling → FC → Classification
 

 특징:

  • 단순한 구조
  • CNN 기본 형태의 시작

✔ 2. AlexNet

 LeNet과 차이 

- 훨씬 깊은 구조 (깊이 증가)
- ReLU 사용 (기존 tanh → 학습 속도 개선)
- Dropout 도입 (과적합 방지)
- GPU 사용 (연산 속도 개선)
 

 의미:

딥러닝 붐의 시작 (ImageNet 우승)
 

✔ 3. VGG16

 특징:

- 3×3 작은 필터만 반복 사용
- 구조가 매우 단순 (Conv 쌓기)
- 깊은 네트워크
 

 장점:

이해하기 쉽고 구조가 깔끔
 

 단점:

파라미터 많음 (무거움)
 

✔ 4. GoogLeNet

 핵심:

Inception Module 도입
 

 특징:

- 1×1, 3×3, 5×5 필터를 병렬로 사용
- 다양한 스케일 특징 추출
- 1×1 conv로 채널 줄여서 연산량 감소

 

→ “깊이 + 병렬 구조로 효율 증가” ✔
 

✔ 5. ResNet

 핵심:

Skip Connection (Residual Block)
 

 특징:

출력 = F(x) + x
 

해결한 문제:

깊어질수록 성능 떨어지는 문제(degradation)
 

 장점:

- 매우 깊은 네트워크 가능
- gradient 흐름 개선
 

🔹 Transformer와의 연결 (보완)

ResNet의 skip connection 개념은
Transformer에서도 그대로 사용됨
 

 단, Transformer는 attention 기반 모델이라 구조 자체는 다름


🔹 CNN 개념 정리 (수정 포함🔥)

✔ 뉴런 (Neuron)

뉴런 = 출력 feature map의 각 위치 값 하나
 

 공식:

뉴런 수 = height × width × 채널 수

 


✔ 가중치 (Weight)

필터 1개 weight = filter_height × filter_width × C_in
 
“한 칸마다 채널 수만큼 weight 존재” ✔
 

✔ 채널 수 (Channel)

채널 = feature map 개수 (특징의 종류)
 

✔ 입력 채널

흑백 이미지 → 1
RGB 이미지 → 3
 

 


✔ Conv 이후 채널

채널 수 = 필터 개수
 
C_out = number of filters