065. Attention Is All You Need — 트랜스포머 논문 핵심 정리

2017년 Google Brain의 Vaswani 등이 발표한 논문. RNN 없이 어텐션만으로 시퀀스를 처리하는 트랜스포머 아키텍처를 제안했다. 병렬 연산이 가능하고 장거리 의존성을 직접 포착한다는 두 가지 특성이 이후 모든 대형 언어 모델의 기반이 됐다.

2026년 6월 14일 · 5 분 · 2251 단어 · CharmingGroot

067. AI 모델 로드맵 — 발전 순서 목록

딥러닝 모델들의 발표 연도 기준 학습 로드맵. CNN 발전사부터 멀티모달, 추론 최적화, 에이전트까지 순서대로 정리한다.

2026년 6월 14일 · 2 분 · 544 단어 · CharmingGroot

068. AlexNet → ResNet — CNN과 딥러닝 르네상스

2012년 AlexNet이 ImageNet 대회에서 압도적인 성능을 보이며 딥러닝 시대를 열었다. 이후 VGGNet, GoogLeNet, ResNet으로 이어지는 CNN 발전사를 다룬다. 각 모델이 해결하려 했던 문제와 핵심 기여를 중심으로 설명한다.

2026년 6월 14일 · 5 분 · 2221 단어 · CharmingGroot