<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Semantic-Search on CharmingGroot</title>
    <link>https://charminggroot.github.io/tags/semantic-search/</link>
    <description>Recent content in Semantic-Search on CharmingGroot</description>
    <generator>Hugo</generator>
    <language>ko-kr</language>
    <lastBuildDate>Sun, 14 Jun 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://charminggroot.github.io/tags/semantic-search/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>066. Sentence Transformers — 문장 임베딩과 의미 검색</title>
      <link>https://charminggroot.github.io/posts/066-sentence-transformers/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/066-sentence-transformers/</guid>
      <description>Sentence Transformers(SBERT)는 문장을 고정 크기 벡터로 변환해 의미적 유사도를 빠르게 계산할 수 있게 한다. 2019년 Reimers와 Gurevych가 제안했으며, BERT의 O(n²) 연산 문제를 샴 네트워크 구조로 해결했다. RAG, 의미 검색, 문장 클러스터링의 기반 기술이다.</description>
    </item>
    <item>
      <title>076. ColBERT — Late Interaction 검색</title>
      <link>https://charminggroot.github.io/posts/076-colbert/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/076-colbert/</guid>
      <description>ColBERT(2020)는 쿼리와 문서를 각각 토큰 단위 벡터로 인코딩하고, 검색 시 MaxSim 연산으로 유사도를 계산하는 Late Interaction 방식을 제안했다. Bi-Encoder의 속도와 Cross-Encoder의 정확도 사이 균형을 잡는다.</description>
    </item>
    <item>
      <title>078. 벡터 DB — Qdrant, pgvector, Pinecone</title>
      <link>https://charminggroot.github.io/posts/078-vector-db/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/078-vector-db/</guid>
      <description>벡터 DB는 고차원 임베딩 벡터를 저장하고 근사 최근접 이웃(ANN) 검색을 빠르게 수행하는 데이터베이스다. Qdrant, pgvector, Pinecone 세 가지 대표 선택지의 구조, 인덱싱 알고리즘, 트레이드오프를 다룬다.</description>
    </item>
    <item>
      <title>081. MTEB — 임베딩 모델 벤치마크 읽는 법</title>
      <link>https://charminggroot.github.io/posts/081-mteb/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/081-mteb/</guid>
      <description>MTEB(Massive Text Embedding Benchmark)는 56개 데이터셋, 8개 태스크로 임베딩 모델을 종합 평가하는 벤치마크다. 모델 선택 시 전체 평균이 아니라 실제 사용 태스크와 언어에 맞는 점수를 봐야 한다.</description>
    </item>
  </channel>
</rss>
