<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>大規模モデル API on KnightLiブログ</title>
        <link>https://www.knightli.com/ja/tags/%E5%A4%A7%E8%A6%8F%E6%A8%A1%E3%83%A2%E3%83%87%E3%83%AB-api/</link>
        <description>Recent content in 大規模モデル API on KnightLiブログ</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>ja</language>
        <lastBuildDate>Thu, 12 Feb 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://www.knightli.com/ja/tags/%E5%A4%A7%E8%A6%8F%E6%A8%A1%E3%83%A2%E3%83%87%E3%83%AB-api/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>AI ラージ モデル (LLM) API リソース インベントリ (無料でコスト効率が高い)</title>
        <link>https://www.knightli.com/ja/2026/02/12/ai-%E5%A4%A7%E6%A8%A1%E5%9E%8B-llm-api-%E8%B5%84%E6%BA%90%E7%9B%98%E7%82%B9/</link>
        <pubDate>Thu, 12 Feb 2026 00:00:00 +0000</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/02/12/ai-%E5%A4%A7%E6%A8%A1%E5%9E%8B-llm-api-%E8%B5%84%E6%BA%90%E7%9B%98%E7%82%B9/</guid>
        <description>&lt;h2 id=&#34;google-gemini-api-最強のフリーランチ&#34;&gt;Google Gemini API (最強のフリーランチ)
&lt;/h2&gt;&lt;p&gt;Gemini シリーズを促進するために、Google は現在市場で最も寛大な無料割り当てを提供しています。&lt;br&gt;
モデルと価格については、https://ai.google.dev/gemini-api/docs/pricing?hl=zh-cn を参照してください。&lt;/p&gt;
&lt;p&gt;モデル: Gemini 3 Flash プレビュー、Gemini 2.5 Pro。 2026-02-12対応モデルです。一般に、無料ではない最新の Pro モデルを除き、他のモデルには無料の割り当てがあります。&lt;br&gt;
クォータ: モデルによって制限は異なります。詳細については、上記のリンクを参照してください。&lt;br&gt;
利点: 無料の低レベル モデルのみを備えた他の Web サイトとは異なり、Google のトップ モデルには無料の割り当て、巨大なコンテキスト ウィンドウ (100 万以上のトークン)、およびマルチモダリティ (写真/ビデオのアップロード) の完全なサポートもあります。&lt;br&gt;
欠点:&lt;br&gt;
データ プライバシー: 無料利用枠からの入力データは、モデルを改善するために Google によって使用される場合があります (運用環境では注意して使用してください)。&lt;br&gt;
IP 制限: 非常に厳格です。サポートされているリージョンで IP ノードを使用する必要があります。使用しないと、エラー 403 またはユーザーの場所がサポートされていないことが報告されます。&lt;/p&gt;
&lt;h2 id=&#34;groq-キングオブスピード&#34;&gt;Groq (キング・オブ・スピード)
&lt;/h2&gt;&lt;p&gt;Groq は自社開発の LPU (Language Processing Unit) チップを利用して、驚くほど速い推論速度を提供します。&lt;br&gt;
モデルと価格については、https://groq.com/pricing を参照してください。&lt;/p&gt;
&lt;p&gt;モデル: GPT OSS / キミ K2 / ラマ 3,4 / Qwen3&lt;br&gt;
割り当て: 無料ではありませんが、価格は低くなります&lt;br&gt;
利点: 非常に高速で、最初の単語の遅延 (TTFT) は通常 200 ミリ秒以内で、リアルタイムの会話や音声アシスタントに非常に適しています。&lt;br&gt;
欠点:&lt;br&gt;
モデルの制限: オープンソース モデルのみがサポートされ、GPT-4 や Claude はサポートされません。&lt;/p&gt;
&lt;h2 id=&#34;siliconcloud国産光シリコン系モバイル&#34;&gt;SiliconCloud（国産光・シリコン系モバイル）
&lt;/h2&gt;&lt;p&gt;中国の新興推論加速プラットフォームには、多数の優れた国内オープンソース モデルが集まっています。&lt;br&gt;
モデルと価格については、https://siliconflow.cn/pricing を参照してください。&lt;/p&gt;
&lt;p&gt;モデル: Qwen 2.5 (7B/14B/72B)、DeepSeek-V2、Yi-1.5、Kimi K2。&lt;br&gt;
割り当て: 現在、一部のモデル (Qwen 7B、GLM-4-9B など) に対して永久無料通話が提供されています。&lt;br&gt;
アドバンテージ：&lt;br&gt;
国内直結：高速で特別なネットワーク環境は不要。&lt;br&gt;
新しいモデル: 国内のオープンソース モデルは非常に迅速に更新されます。&lt;br&gt;
短所: 無料は中小規模のパラメータ モデルに限定されており、上位モデル (72B/DeepSeek 236B など) は通常支払いが必要です。&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
