<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>AI Safety on KnightLiブログ</title>
        <link>https://www.knightli.com/ja/tags/ai-safety/</link>
        <description>Recent content in AI Safety on KnightLiブログ</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>ja</language>
        <lastBuildDate>Sat, 18 Apr 2026 10:20:00 +0800</lastBuildDate><atom:link href="https://www.knightli.com/ja/tags/ai-safety/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Gemma 4 E4B の脱獄版と公式通常版の違い</title>
        <link>https://www.knightli.com/ja/2026/04/18/gemma-4-e4b-uncensored-vs-official/</link>
        <pubDate>Sat, 18 Apr 2026 10:20:00 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/18/gemma-4-e4b-uncensored-vs-official/</guid>
        <description>&lt;p&gt;&lt;code&gt;HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive&lt;/code&gt; のようなモデルを見るときに一番重要なのは、これは &lt;strong&gt;Google が新しく出した別の Gemma 4 ではない&lt;/strong&gt; という点です。公式の &lt;code&gt;google/gemma-4-E4B-it&lt;/code&gt; をベースにした非公式派生版であり、主眼は「拒否応答を減らすこと」にあります。&lt;/p&gt;
&lt;p&gt;つまり、通常版との本質的な差はモデル構造よりも &lt;strong&gt;アラインメント方針と応答スタイル&lt;/strong&gt; にあります。&lt;/p&gt;
&lt;h2 id=&#34;この派生版モデルカードが明示していること&#34;&gt;この派生版モデルカードが明示していること
&lt;/h2&gt;&lt;p&gt;Hugging Face のモデルカードでは、この HauhauCS 版について次のように書かれています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;google/gemma-4-E4B-it&lt;/code&gt; ベースである&lt;/li&gt;
&lt;li&gt;「データセットや能力には変更がない」と主張している&lt;/li&gt;
&lt;li&gt;違いは「拒否応答を外しただけ」と主張している&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Aggressive&lt;/code&gt; 版は「完全に解放され、プロンプトを拒否しない」と説明している&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これらは作者側の主張であり、独立した第三者評価ではありません。ただし、意図している方向性は明確です。これは「安全上の拒否を減らす」ことを狙った非公式派生版です。&lt;/p&gt;
&lt;h2 id=&#34;公式版-vs-いわゆる脱獄版&#34;&gt;公式版 vs いわゆる「脱獄版」
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;観点&lt;/th&gt;
          &lt;th&gt;公式 &lt;code&gt;google/gemma-4-E4B-it&lt;/code&gt;&lt;/th&gt;
          &lt;th&gt;&lt;code&gt;Gemma-4-E4B-Uncensored-HauhauCS-Aggressive&lt;/code&gt;&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;出所&lt;/td&gt;
          &lt;td&gt;Google 公式&lt;/td&gt;
          &lt;td&gt;Hugging Face 上の第三者派生版&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;ベースモデル&lt;/td&gt;
          &lt;td&gt;Gemma 4 E4B の instruction-tuned 版&lt;/td&gt;
          &lt;td&gt;同じモデル系統で、モデルカードにも &lt;code&gt;google/gemma-4-E4B-it&lt;/code&gt; ベースと明記&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;主目的&lt;/td&gt;
          &lt;td&gt;汎用アシスタント能力 + Responsible AI 前提&lt;/td&gt;
          &lt;td&gt;拒否応答を減らし、とにかく出力を続ける&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;安全方針&lt;/td&gt;
          &lt;td&gt;Gemma 系列の安全文書・禁止用途ポリシーに沿う&lt;/td&gt;
          &lt;td&gt;拒否やガードレールを意図的に弱めている&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;応答傾向&lt;/td&gt;
          &lt;td&gt;敏感な要求では拒否・回避・慎重回答が増える&lt;/td&gt;
          &lt;td&gt;公式版なら止まる要求にもそのまま答えやすい&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;リスク&lt;/td&gt;
          &lt;td&gt;既定では比較的低いが、完全に安全という意味ではない&lt;/td&gt;
          &lt;td&gt;既定でより高リスク。不適切または非準拠の出力が出やすい&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;プロダクト適性&lt;/td&gt;
          &lt;td&gt;企業や公開サービスで説明しやすい&lt;/td&gt;
          &lt;td&gt;公開サービスやポリシー重視環境では扱いにくい&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;追加対策&lt;/td&gt;
          &lt;td&gt;アプリ側の安全対策は依然必要&lt;/td&gt;
          &lt;td&gt;モデル側の抑制が弱いため、下流側の安全対策がより重要&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;本質は能力向上より挙動変更&#34;&gt;本質は「能力向上」より「挙動変更」
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;uncensored&lt;/code&gt; を「より高性能」と受け取るのは、たいてい正確ではありません。&lt;/p&gt;
&lt;p&gt;こうした派生版で先に変わるのは次の点です。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;どれだけ拒否するか&lt;/li&gt;
&lt;li&gt;敏感な要求にどれだけ従うか&lt;/li&gt;
&lt;li&gt;最終回答にどれだけ安全フィルタが残るか&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;一方で、名前に &lt;code&gt;Uncensored&lt;/code&gt; と付いているからといって、次のものまで自動的に大きく向上するわけではありません。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;モデルアーキテクチャ&lt;/li&gt;
&lt;li&gt;コンテキスト長&lt;/li&gt;
&lt;li&gt;マルチモーダル能力&lt;/li&gt;
&lt;li&gt;推論能力の上限&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;より正確には、これは &lt;strong&gt;同じモデル系列の中で挙動の調整が違う版&lt;/strong&gt; と見るべきであり、上位モデルとみなすべきではありません。&lt;/p&gt;
&lt;h2 id=&#34;なぜ公式版のほうが保守的なのか&#34;&gt;なぜ公式版のほうが保守的なのか
&lt;/h2&gt;&lt;p&gt;Google の Gemma 公式文書は、この系列を Responsible AI 開発の文脈で位置づけています。Gemma のモデルカードでは誤用、有害コンテンツ、プライバシー、バイアスといったリスクが明示されており、Gemma Prohibited Use Policy では Gemma または派生モデルを次の用途に使うことを禁じています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;危険・違法・悪意ある活動&lt;/li&gt;
&lt;li&gt;有害、誤解を招く、欺瞞的なコンテンツ生成&lt;/li&gt;
&lt;li&gt;安全フィルタの上書きや回避&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;つまり、公式版が保守的なのは偶然ではなく、文書・ライセンス・運用前提が最初からそう設計されているためです。&lt;/p&gt;
&lt;h2 id=&#34;公式通常版が向いているケース&#34;&gt;公式通常版が向いているケース
&lt;/h2&gt;&lt;p&gt;次の点を重視するなら、まずは公式 &lt;code&gt;google/gemma-4-E4B-it&lt;/code&gt; のほうが適しています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;プロダクトへの組み込み&lt;/li&gt;
&lt;li&gt;チーム利用&lt;/li&gt;
&lt;li&gt;企業・公開向け運用&lt;/li&gt;
&lt;li&gt;ポリシーや法務リスクの低減&lt;/li&gt;
&lt;li&gt;出力挙動の説明可能性&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;多くの通常用途では、こちらが基本選択です。&lt;/p&gt;
&lt;h2 id=&#34;あえて脱獄版を試す人がいる理由&#34;&gt;あえて脱獄版を試す人がいる理由
&lt;/h2&gt;&lt;p&gt;こうした uncensored 派生版が選ばれるのは、たいてい次のような理由です。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ローカルでの私的実験&lt;/li&gt;
&lt;li&gt;公式版が早すぎる拒否をしていないかの確認&lt;/li&gt;
&lt;li&gt;ロールプレイや自由度の高い創作&lt;/li&gt;
&lt;li&gt;アラインメント違いの比較&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;ただし、その分だけ安全責任はモデル提供者ではなく利用者側に移ります。&lt;/p&gt;
&lt;h2 id=&#34;結論&#34;&gt;結論
&lt;/h2&gt;&lt;p&gt;Gemma 4 E4B のいわゆる「脱獄版」と公式通常版の最も大きな違いは次の通りです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;公式版は「ガードレール付きの実用性」を重視&lt;/li&gt;
&lt;li&gt;脱獄版は「拒否を減らした出力継続性」を重視&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これは &lt;strong&gt;自動的に高性能になることを意味しません&lt;/strong&gt;。主に &lt;strong&gt;より許容的になる&lt;/strong&gt; だけです。&lt;/p&gt;
&lt;p&gt;安定性、説明可能性、配備のしやすさを重視するなら、まず公式版を使うのが妥当です。ローカル実験目的で、安全性・コンプライアンス・出力リスクを自分で引き受けられる場合に限って、uncensored 派生版を「挙動違いの別バリアント」として比較するのが現実的です。&lt;/p&gt;
&lt;h2 id=&#34;参考リンク&#34;&gt;参考リンク
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;Hugging Face: &lt;a class=&#34;link&#34; href=&#34;https://huggingface.co/HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Hugging Face: &lt;a class=&#34;link&#34; href=&#34;https://huggingface.co/google/gemma-4-E4B-it&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;google/gemma-4-E4B-it&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Google AI for Developers: &lt;a class=&#34;link&#34; href=&#34;https://ai.google.dev/gemma/prohibited_use_policy&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Gemma Prohibited Use Policy&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Google AI for Developers: &lt;a class=&#34;link&#34; href=&#34;https://ai.google.dev/gemma/docs/core/model_card&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Gemma model card&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
