<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Google AI on KnightLi的博客</title>
        <link>https://www.knightli.com/zh-tw/tags/google-ai/</link>
        <description>Recent content in Google AI on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-tw</language>
        <lastBuildDate>Fri, 15 May 2026 23:45:34 +0800</lastBuildDate><atom:link href="https://www.knightli.com/zh-tw/tags/google-ai/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Gemini 3.5 Pro 提前曝光：Google 想用 Spark Agent 搶回 AI 編程入口</title>
        <link>https://www.knightli.com/zh-tw/2026/05/15/gemini-35-pro-spark-agent-ai-coding-race/</link>
        <pubDate>Fri, 15 May 2026 23:45:34 +0800</pubDate>
        
        <guid>https://www.knightli.com/zh-tw/2026/05/15/gemini-35-pro-spark-agent-ai-coding-race/</guid>
        <description>&lt;p&gt;Gemini 3.5 Pro 還沒正式發布，相關爆料已經開始升溫。&lt;/p&gt;
&lt;p&gt;這輪資訊裡有幾個關鍵詞：Gemini 3.5 Pro、代號 Cappuccino、Gemini Spark、AI 編程、MCP 工具接入。它們指向同一個方向：Google 不只是想更新一個聊天模型，而是想把模型、工具、Agent 和 Google 生態入口重新綁在一起。&lt;/p&gt;
&lt;p&gt;不過，在正式發布前，這些資訊都應該按「爆料」看待。真正值得關注的不是某一張截圖或某一個跑分，而是 Google 接下來可能要補的幾塊短板。&lt;/p&gt;
&lt;h2 id=&#34;gemini-35-pro-為什麼值得關注&#34;&gt;Gemini 3.5 Pro 為什麼值得關注
&lt;/h2&gt;&lt;p&gt;從曝光資訊看，Gemini 3.5 Pro 可能是一次跳級命名。&lt;/p&gt;
&lt;p&gt;此前外界還在討論 Gemini 3.2，隨後又出現 Gemini 3.5 Pro 的說法。如果命名屬實，說明 Google 想在新一輪發布裡講一個更大的版本故事，而不是只做常規小更新。&lt;/p&gt;
&lt;p&gt;目前流出的重點主要集中在三方面：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;編程和推理能力繼續提升；&lt;/li&gt;
&lt;li&gt;SVG、互動式頁面、動畫和 3D 生成能力增強；&lt;/li&gt;
&lt;li&gt;新的 Agent 產品 Gemini Spark 可能進入前台。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這些方向並不意外。Gemini 系列一直強調多模態，Google 也有足夠強的分發渠道。真正的問題是，它能不能在開發者工具和 Agent 工作流上趕上 OpenAI、Anthropic 的節奏。&lt;/p&gt;
&lt;h2 id=&#34;編程能力是-google-最需要補的課&#34;&gt;編程能力是 Google 最需要補的課
&lt;/h2&gt;&lt;p&gt;大模型競爭進入 2026 年後，編程已經不只是「模型能力測試項」，而是最直接的產品入口。&lt;/p&gt;
&lt;p&gt;原因很簡單：AI 編程工具有高頻使用場景，也能產生大量可回饋的資料。開發者每天讓模型讀程式碼、改程式碼、跑測試、修 bug，這些互動天然會推動下一代模型和工具鏈繼續進化。&lt;/p&gt;
&lt;p&gt;過去一年，Claude Code 在開發者群體裡聲量很高，OpenAI 也持續強化 Codex 與 ChatGPT 的協同。相比之下，Google 雖然有 Antigravity 等產品，但外部存在感並不算強。&lt;/p&gt;
&lt;p&gt;這也是 Gemini 3.5 Pro 被重點觀察的原因。如果它只是聊天更強、回答更快，意義有限；如果它能真正改善程式碼理解、跨檔案修改、工具呼叫和長任務執行，才可能改變開發者工作流。&lt;/p&gt;
&lt;h2 id=&#34;gemini-spark-可能是更大的變數&#34;&gt;Gemini Spark 可能是更大的變數
&lt;/h2&gt;&lt;p&gt;比模型本身更激進的，是傳聞中的 Gemini Spark。&lt;/p&gt;
&lt;p&gt;按照曝光描述，Spark 的定位不是普通聊天助手，而是全天候運行的 AI Agent。它可能接入郵件、日程、網頁、任務、帳號狀態和個人上下文，幫助使用者處理多步驟工作流。&lt;/p&gt;
&lt;p&gt;這類產品的想像空間很大。比如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;自動整理收件箱；&lt;/li&gt;
&lt;li&gt;幫使用者跟進任務；&lt;/li&gt;
&lt;li&gt;在網頁上執行操作；&lt;/li&gt;
&lt;li&gt;處理跨應用流程；&lt;/li&gt;
&lt;li&gt;根據個人偏好安排日常事務。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但風險也同樣明顯。一個全天候 Agent 如果能存取登入狀態、瀏覽器資料、檔案、位置和第三方服務，就必須回答幾個問題：什麼時候需要使用者確認？哪些操作必須禁止自動執行？資料會不會被分享給第三方？遠端瀏覽器和憑證如何隔離？&lt;/p&gt;
&lt;p&gt;所以 Spark 真正的看點，不只是「能不能幫你幹活」，而是 Google 能否把權限、稽核、確認機制和使用者控制做得足夠清楚。&lt;/p&gt;
&lt;h2 id=&#34;mcp-工具接入說明什麼&#34;&gt;MCP 工具接入說明什麼
&lt;/h2&gt;&lt;p&gt;爆料裡還提到，新的 Gemini 選擇器可能出現 MCP 相關模型或測試入口。&lt;/p&gt;
&lt;p&gt;如果這部分最終落地，說明 Google 也在把模型從「問答系統」推向「工具操作系統」。模型不再只是生成文字，而是要能呼叫外部工具、存取業務系統、讀寫檔案、執行命令，並在多個步驟之間保持任務狀態。&lt;/p&gt;
&lt;p&gt;這和 OpenAI、Anthropic 的方向是一致的。誰能讓模型更穩定地呼叫工具，誰就更容易把 AI 嵌進真實工作流。&lt;/p&gt;
&lt;p&gt;不過，MCP 接入本身不是終點。真正難的是穩定性：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;模型能否正確選擇工具；&lt;/li&gt;
&lt;li&gt;參數是否可靠；&lt;/li&gt;
&lt;li&gt;失敗後能不能恢復；&lt;/li&gt;
&lt;li&gt;權限邊界是否明確；&lt;/li&gt;
&lt;li&gt;使用者能不能追蹤每一步操作。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果這些問題沒解決，工具越多，出錯面也越大。&lt;/p&gt;
&lt;h2 id=&#34;多模態仍然是-google-的優勢牌&#34;&gt;多模態仍然是 Google 的優勢牌
&lt;/h2&gt;&lt;p&gt;Google 最有機會打出差異化的地方，仍然是多模態。&lt;/p&gt;
&lt;p&gt;從曝光的 SVG、互動式頁面、動畫和視覺生成案例看，Gemini 可能繼續強化「從提示詞生成可互動內容」的能力。相比單純寫一段程式碼，這更接近產品原型生成：使用者描述一個想法，模型直接給出可操作、可調節、可預覽的介面。&lt;/p&gt;
&lt;p&gt;這條路線很適合 Google。它既能承接 Gemini 的多模態能力，也能和 Android、Chrome、Workspace、搜尋、廣告、雲服務等入口結合。&lt;/p&gt;
&lt;p&gt;如果 Google 想避免只在「誰的程式碼模型更強」上硬拼，它很可能會把重點放到更完整的多模態 Agent 系統上。&lt;/p&gt;
&lt;h2 id=&#34;三家公司的打法正在分化&#34;&gt;三家公司的打法正在分化
&lt;/h2&gt;&lt;p&gt;現在的大模型競爭已經不是單一模型排行榜競爭。&lt;/p&gt;
&lt;p&gt;OpenAI 的優勢在產品迭代和分發節奏，Codex、ChatGPT、企業工具和 API 之間的聯動越來越緊。&lt;/p&gt;
&lt;p&gt;Anthropic 的優勢在開發者心智和程式碼模型品質，Claude Code 已經成了很多人預設的 AI 編程入口。&lt;/p&gt;
&lt;p&gt;Google 的優勢則是生態入口。Gmail、Docs、Chrome、Android、搜尋、YouTube、地圖和雲服務構成了一個巨大的個人與企業資料網路。只要 Agent 能安全接入這些入口，Google 就有機會從「模型追趕者」變成「工作流入口控制者」。&lt;/p&gt;
&lt;p&gt;這也是 Gemini Spark 值得關注的原因。它不一定需要在所有基準測試上第一，但只要能進入日常工作流，就可能形成自己的護城河。&lt;/p&gt;
&lt;h2 id=&#34;普通使用者該怎麼看&#34;&gt;普通使用者該怎麼看
&lt;/h2&gt;&lt;p&gt;對普通使用者來說，短期不必被每一次爆料牽著走。&lt;/p&gt;
&lt;p&gt;更實用的觀察點有三個：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Gemini 3.5 Pro 的編程能力是否真的改善，尤其是複雜倉庫、長上下文和工具呼叫。&lt;/li&gt;
&lt;li&gt;Gemini Spark 是否預設安全，敏感操作前是否有明確確認和可追蹤記錄。&lt;/li&gt;
&lt;li&gt;Google 是否給出清晰價格、額度和企業權限管理，而不是只展示演示效果。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果只是生成幾張漂亮截圖，價值有限。能不能穩定接入真實工作流，才是這一輪 AI Agent 產品的分水嶺。&lt;/p&gt;
&lt;h2 id=&#34;對開發者意味著什麼&#34;&gt;對開發者意味著什麼
&lt;/h2&gt;&lt;p&gt;開發者最應該關注的不是「哪個模型贏了」，而是自己的工作流是否可遷移。&lt;/p&gt;
&lt;p&gt;現在 Claude Code、Codex、Gemini、Antigravity、Cursor、Windsurf 等工具都在搶入口。如果把所有流程都綁死在某一個平台上，未來成本、額度、模型策略或權限規則一變，遷移會很痛。&lt;/p&gt;
&lt;p&gt;更穩妥的做法是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;重要專案保留標準 Git 工作流；&lt;/li&gt;
&lt;li&gt;自動修改後必須看 diff；&lt;/li&gt;
&lt;li&gt;關鍵任務用測試和 CI 兜底；&lt;/li&gt;
&lt;li&gt;不把生產憑證交給不透明 Agent；&lt;/li&gt;
&lt;li&gt;能用開放協議接工具時，優先選擇可替換方案。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;模型會繼續變強，但工程紀律不會過時。&lt;/p&gt;
&lt;h2 id=&#34;小結&#34;&gt;小結
&lt;/h2&gt;&lt;p&gt;Gemini 3.5 Pro 的爆料說明，Google 正在加速補齊 AI 編程和 Agent 入口。模型能力提升是一部分，Gemini Spark 這類全天候 Agent 可能才是更大的戰略動作。&lt;/p&gt;
&lt;p&gt;但越是能幫使用者「自動幹活」的系統，越需要嚴格的權限邊界和可驗證流程。對 Google 來說，真正的挑戰不只是追上 GPT-5.5 或 Claude，而是把強模型、安全機制和生態入口組合成一個可信的日常工作流。&lt;/p&gt;
&lt;p&gt;如果這一步做成，Gemini 不一定要在每個榜單上第一，也可能重新拿回一部分 AI 入口主動權。&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
