<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Int4 on CharmingGroot</title>
    <link>https://charminggroot.github.io/tags/int4/</link>
    <description>Recent content in Int4 on CharmingGroot</description>
    <generator>Hugo</generator>
    <language>ko-kr</language>
    <lastBuildDate>Sun, 14 Jun 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://charminggroot.github.io/tags/int4/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>090. GPTQ — 사후 학습 양자화</title>
      <link>https://charminggroot.github.io/posts/090-gptq/</link>
      <pubDate>Sun, 14 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://charminggroot.github.io/posts/090-gptq/</guid>
      <description>GPTQ(2022)는 LLM 가중치를 4비트로 압축하는 사후 학습 양자화 방법이다. 재학습 없이 보정 데이터만으로 FP16 대비 4배 작은 모델을 만들고, 성능 손실을 최소화한다. 소비자 GPU에서 대형 모델을 실행하는 실용적인 방법이다.</description>
    </item>
  </channel>
</rss>
