065. Attention Is All You Need — 트랜스포머 논문 핵심 정리

2017년 Google Brain의 Vaswani 등이 발표한 논문. RNN 없이 어텐션만으로 시퀀스를 처리하는 트랜스포머 아키텍처를 제안했다. 병렬 연산이 가능하고 장거리 의존성을 직접 포착한다는 두 가지 특성이 이후 모든 대형 언어 모델의 기반이 됐다.

2026년 6월 14일 · 5 분 · 2251 단어 · CharmingGroot