<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Vision on CharmingGroot</title>
    <link>https://charminggroot.github.io/tags/vision/</link>
    <description>Recent content in Vision on CharmingGroot</description>
    <generator>Hugo</generator>
    <language>ko-kr</language>
    <lastBuildDate>Sun, 14 Jun 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://charminggroot.github.io/tags/vision/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>067. AI 모델 로드맵 — 발전 순서 목록</title>
      <link>https://charminggroot.github.io/posts/067-ai-model-roadmap/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/067-ai-model-roadmap/</guid>
      <description>딥러닝 모델들의 발표 연도 기준 학습 로드맵. CNN 발전사부터 멀티모달, 추론 최적화, 에이전트까지 순서대로 정리한다.</description>
    </item>
    <item>
      <title>074. DETR — 트랜스포머 기반 객체 탐지</title>
      <link>https://charminggroot.github.io/posts/074-detr/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/074-detr/</guid>
      <description>DETR(2020)은 트랜스포머를 객체 탐지에 처음 적용한 모델이다. NMS 같은 수작업 후처리 없이 이미지에서 객체를 End-to-End로 탐지한다. 헝가리안 매칭으로 예측과 정답을 1대1로 연결해 중복 탐지 문제를 해결했다.</description>
    </item>
    <item>
      <title>075. ViT — Vision Transformer</title>
      <link>https://charminggroot.github.io/posts/075-vit/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/075-vit/</guid>
      <description>ViT(2020)는 이미지를 패치로 나눠 트랜스포머에 입력하는 방식으로 CNN 없이 이미지를 처리한다. 충분히 큰 데이터셋으로 학습하면 ResNet을 능가한다. 이후 비전 모델의 패러다임을 CNN에서 트랜스포머로 전환하는 계기가 됐다.</description>
    </item>
    <item>
      <title>082. DINO — 자기지도학습 비전 표현</title>
      <link>https://charminggroot.github.io/posts/082-dino/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/082-dino/</guid>
      <description>DINO(2021)는 레이블 없이 ViT를 학습하는 자기지도학습 방법이다. 학생-교사 구조에서 이미지의 다른 크롭이 같은 표현을 갖도록 학습한다. 레이블 없이도 의미 있는 시각적 특징을 학습하고, 어텐션 맵이 자연스럽게 세그멘테이션 마스크를 형성한다.</description>
    </item>
    <item>
      <title>091. DINOv2 — 범용 비전 특징 추출기</title>
      <link>https://charminggroot.github.io/posts/091-dinov2/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/091-dinov2/</guid>
      <description>DINOv2(2023)는 1억 4200만 장의 정제된 이미지로 학습한 자기지도 비전 모델이다. 파인튜닝 없이 깊이 추정, 세그멘테이션, 분류, 검색 등 다양한 비전 태스크에 직접 사용할 수 있는 범용 비전 특징 추출기다.</description>
    </item>
    <item>
      <title>092. SAM — Segment Anything Model</title>
      <link>https://charminggroot.github.io/posts/092-sam/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/092-sam/</guid>
      <description>SAM(2023)은 Meta AI가 발표한 범용 이미지 세그멘테이션 모델이다. 점, 박스, 텍스트 등 다양한 프롬프트로 이미지의 어떤 객체든 마스크를 생성한다. 11억 개 마스크로 학습된 파운데이션 모델로, 파인튜닝 없이 대부분의 세그멘테이션 태스크에 적용된다.</description>
    </item>
  </channel>
</rss>
