Avatar 🍥

KnightLi的博客

记录并分享日常

  1. 主页
  2. 关于
  3. 归档
  4. 搜索
  5. 链接
    1. 暗色模式

归档

2026 456
2025 23
2024 5
2023 9
2022 33
2021 5
2020 8

分类

AI工具 技术文档 硬件相关 AI行业 开发工具 运维 安全动态 商业观察

标签云

AI Agent AI工具 AI编程 开发工具 Codex Claude Code 本地大模型 OpenAI MCP Linux Claude Anthropic Ubuntu ChatGPT Llama.cpp Ollama Python 开源项目 Gemini NAS AI模型 Windows 提示词 AI绘图 DeepSeek Gemma 4 GGUF Google 网络安全 GPU
AI工具

Holo 3.1 本地 Agent 部署:用 llama.cpp 接入 OpenClaw

记录 Holo 3.1 本地 Agent 的部署流程:下载 llama.cpp,选择 GGUF 模型,启动 OpenAI-compatible 本地服务,并在 OpenClaw 中配置 API Base URL、安装浏览器自动化 skills。

2026-06-12
阅读时长: 4 分钟
中文繁體 English 日本語 Español
AI行业

GPT-5.6 传闻与 150 万上下文:大模型竞争正在转向长任务和算力成本

围绕 GPT-5.6、iris-alpha 和 150 万 token 上下文窗口的传闻,梳理 OpenAI、Anthropic 与 Google 在长上下文、Agent 编程、价格和算力基础设施上的竞争变化。

2026-06-12
阅读时长: 2 分钟
中文繁體 English 日本語 Español
开发工具

SpaceX-API:一个由粉丝维护的开源航天数据接口

SpaceX-API 曾因 r/SpaceX 社区维护的开放 REST 接口登上 GitHub 热榜。它把发射、火箭、飞船、星链、发射台等公开数据整理成 API,但仓库已在 2026 年 6 月归档,更适合作为历史数据和开源数据项目样本。

2026-06-12
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

OpenAI 收购 Ona 传闻:Codex 正在从代码助手走向云端 Agent 平台

围绕 OpenAI 拟收购 Ona 的报道,梳理 Codex 增长、云端沙箱、长任务执行和企业安全之间的关系。能确认的是 Codex 正在扩展到知识工作,收购 Ona 仍应以官方公告为准。

2026-06-12
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

Dario Amodei 新文解读:AI 跑太快,监管、就业和国际竞争都跟不上了

解读 Dario Amodei 2026 年 6 月长文 Policy on the AI Exponential:AI 能力指数级提升与政策系统缓慢反应之间的时间错位,正在迫使监管、就业、科学创新、公民自由和地缘政治重新设计。

2026-06-12
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

CLAUDE-FABLE-5.md 逐段读:这份系统提示词样本真正暴露了什么

按段解读 GitHub 仓库 CL4R1T4S 中的 CLAUDE-FABLE-5.md:它自称是 Claude Fable 5 的系统提示词,但更重要的是从中观察 AI 产品如何把安全边界、工具权限、搜索规则、版权限制和用户福祉写进系统层。

2026-06-12
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Gemma 4 MTP 实测调参:用 assistant 草稿模型冲 120 tokens/s

整理 Gemma 4 使用 assistant-MTP 草稿模型进行投机解码的命令行示例:如何用 llama-cli 挂载 draft 模型、理解 -md、--draft-max、-ngl 等参数,以及为什么 120 tokens/s 只能作为特定硬件下的调参目标。

2026-06-12
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Gemma 4 assistant-MTP 是什么:多 Token 预测草稿模型怎么加速推理

解释 Gemma 4 assistant-MTP 的作用:它不是独立聊天模型,而是配合主模型做 Multi-Token Prediction 和 speculative decoding 的草稿模型,用来在不改变最终输出的前提下提升生成速度。

2026-06-12
阅读时长: 3 分钟
中文繁體 English 日本語 Español
AI工具

8GB 显存跑 Gemma 4 12B:llama-cli 混合卸载参数怎么配

整理 8GB 显存机器上运行 Gemma 4 12B GGUF 的 llama-cli 参数:通过 GPU 层数卸载、Flash Attention、8K 上下文、mlock 和 CPU 线程控制,在显存吃紧时尽量稳定运行。

2026-06-12
阅读时长: 3 分钟
中文繁體 English 日本語 Español
AI工具

DiffusionGemma 本地部署:用 vLLM 跑起 Google 文本扩散模型

整理 DiffusionGemma 的本地部署和命令行使用方法:用 vLLM 启动 OpenAI-compatible 服务、用 curl 测试、理解 diffusion 参数、硬件要求和常见部署边界。

2026-06-12
阅读时长: 4 分钟
中文繁體 English 日本語 Español
AI工具

DiffusionGemma:Google 把扩散模型带进文本生成

整理 Google DeepMind DiffusionGemma 的核心信息:它用文本扩散替代逐 token 自回归生成,面向低延迟、本地交互、代码补全和非线性文本生成场景,但仍是实验模型,质量取舍与部署边界需要分清。

2026-06-12
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

AI 记忆系统怎么选:Mem0、Letta、Zep、Cognee、Memobase 对比

对比 Mem0、Letta、Zep/Graphiti、Cognee、Memobase、AgentMemory、Text2Mem、ReMe 和 memU 等 AI 记忆系统:它们分别适合外置记忆、自带记忆 Agent、时序记忆、知识图谱、用户画像和编程助手场景。

2026-06-11
阅读时长: 2 分钟
中文繁體 English 日本語 Español
硬件相关

AI 能看懂主板吗?WD PR2100 HDMI、UART 与背板接口判断过程

以 WD PR2100 主板接口识别为例,复盘一次 AI 辅助硬件功能分析:如何从照片中拆问题、找特征、建立证据链,并把 J12、J7、J50 等接口判断转成可实测的验证清单。

2026-06-11
阅读时长: 2 分钟
中文繁體 English 日本語 Español
开发工具

别只会用 Codex:Hook 才是进阶玩法

整理 Codex Hook 的核心用法:它能在 Codex 的关键生命周期事件中运行自定义脚本,适合做隐私检查、命令审查、会话记录、结果校验和团队规范约束。

2026-06-11
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI行业

Leiden Declaration:数学界如何回应 AI 进入研究现场

整理 Leiden Declaration on Artificial Intelligence and Mathematics 的核心内容:数学界为什么要回应 AI,声明担心哪些风险,又分别给个人研究者、学术组织、政策制定者和 AI 公司提出了哪些建议。

2026-06-11
阅读时长: 1 分钟
中文繁體 English 日本語 Español
安全动态

HTTP/2 Bomb 漏洞怎么处理?CVE-2026-49975 的影响范围与缓解思路

整理 HTTP/2 Bomb(CVE-2026-49975)的风险、影响范围和防守建议:它通过 HPACK 压缩放大与 HTTP/2 流控停滞造成内存耗尽,影响多类 HTTP/2 服务端实现。

2026-06-11
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

OpenTalking 和 LongCat-Video 怎么选?一个做实时对话,一个做高质量数字人视频

对比 OpenTalking 与 LongCat-Video-Avatar 的定位差异:OpenTalking 更像实时数字人对话链路的编排框架,LongCat-Video 更像长视频生成和高质量数字人动画的底层多模态模型。

2026-06-11
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI工具

OpenTalking 是什么?一个把 AI 数字人对话跑起来的开源框架

整理 datascale-ai/opentalking 的定位、架构和部署路线:它不是单一数字人模型,而是把前端交互、LLM、TTS、STT、WebRTC、角色资产和可插拔推理后端串起来的实时数字人对话框架。

2026-06-11
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

MeTube:给 yt-dlp 加一个浏览器下载面板

整理 MeTube 的核心用法:它把 yt-dlp 封装成自托管 Web 面板,支持视频、音频、字幕、播放列表、频道订阅和多层下载参数配置,适合 NAS 或家用服务器用户搭建统一下载入口。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

用 Claude Fable 5 做投资分析:资料整理、反方推演与风险清单

整理 Claude Fable 5 与 Mythos 5 发布后的关键信息,并讨论它在投资研究中的正确位置:适合做资料整理、交叉验证、情景推演和研究自动化,不适合直接替你判断买卖点。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Open-LLM-VTuber 怎么用?把本地 LLM 变成会说话的 Live2D 角色

整理 GitHub Weekly Trending 上的 Open-LLM-VTuber:它如何把 LLM、语音识别、语音合成、视觉感知和 Live2D 角色组合成本地可运行的 AI 伴侣。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI工具

turbovec 是什么?一个为本地 RAG 省内存的 Rust 向量索引

整理 GitHub Trending 上的 RyanCodrai/turbovec 项目:它用 TurboQuant 压缩向量索引,提供 Rust 核心和 Python 绑定,适合关注本地 RAG、内存占用、隐私和低延迟检索的开发者。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI行业

Probabilistic TRM:给小模型加一点随机性,推理成绩反而大涨

整理 arXiv 论文 Probabilistic Tiny Recursive Model:研究者在 TRM 推理阶段注入高斯噪声,并用模型已有的 Q head 选择最可信答案,在不重新训练的情况下显著提升数独和纸笔谜题表现。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI行业

SpaceX AI1 卫星曝光:把 AI 数据中心搬到轨道上,听起来很猛但难点也不少

整理 SpaceX AI1 轨道 AI 计算卫星的公开规格:150 kW 峰值计算负载、70 米翼展、液冷散热器、可更换计算模块,以及太空数据中心仍要面对的散热、成本和规模化挑战。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
运维

Antimalware Service Executable CPU 占用过高怎么办?先别急着关 Defender

整理 Antimalware Service Executable 高 CPU 占用的排查思路:确认触发原因、调整扫描计划、谨慎添加排除项,以及关闭 Windows Defender 的风险。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

苹果终于认真做 AI 了?WWDC26 Siri AI 和 Apple Intelligence 重点解读

梳理 WWDC26 上 Apple Intelligence、Siri AI、Gemini 合作和系统级 App 集成的重点,以及 Apple AI 落地仍要面对的限制。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Loops 取代 Prompts:循环工程正在改变 AI Agent 的用法

从提示词工程到循环工程,梳理 AI Agent 的工作模式变化、典型 Loop 流程,以及 Token 成本、状态复杂度和失控风险。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI工具

用 Codex 会花多少钱?新版费率表、Token 消耗和省钱方法

整理 OpenAI Codex 费率表的新版 Token 计费规则、适用套餐、旧版费率差异,以及查看和管理额度的注意事项。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Claude 额度机制怎么计算:5 小时窗口、周限额和 Token 消耗

梳理 Claude 的使用额度机制:5 小时滚动窗口、每周总量限制、Token 与附件消耗,以及减少额度触顶的实用方法。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
技术文档

Claude Fable 5 提示词指南:长任务、Agent 和高 effort 的迁移要点

整理 Anthropic 官方 Claude Fable 5 提示工程指南:effort 设置、长任务运行、进度校验、边界约束、子 Agent、记忆系统和迁移注意事项。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Claude Fable 5 产品页解读:适合长任务、Agent 和高难度编码

从 Anthropic 的 Claude Fable 5 产品页整理它的适用场景、API 接入、价格、安全回退、30 天数据留存和企业使用注意事项。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

Claude Fable 5 和 Mythos 5 发布:Anthropic 把 Mythos 级能力推向普通用户

整理 Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 的关键信息:能力定位、安全分流、受限访问、数据留存、价格和订阅可用性。

2026-06-10
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

Hermes Agent 桌面版发布:Windows、macOS、Linux 都能图形化上手

整理 Hermes Agent 官方桌面版的安装体验、云端与本地模型接入方式,以及它相比命令行部署更适合哪些用户。

2026-06-10
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

Vision Banana 论文解读:图像生成器正在变成通用视觉模型

解读 arXiv 论文 Image Generators are Generalist Vision Learners:Vision Banana 如何把图像生成器改造成通用视觉理解模型,以及它对计算机视觉范式的意义。

2026-06-09
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI行业

SpaceX IPO 解读:1.7 万亿美元估值、Starlink 现金流与 AI 基础设施叙事

基于 SpaceX 官方 IPO 公告和 SEC S-1/A 文件,整理发行规模、估值、Starlink 现金流、AI 基础设施叙事、双重股权结构和投资者需要关注的风险。

2026-06-08
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI行业

Anthropic Mythos / Oceanus 传闻解读:红队测试、定价猜测与开发者该看什么

整理 Anthropic Mythos / Oceanus 相关社区爆料、官方 Project Glasswing 背景、红队测试含义、传闻定价和开发者需要关注的验证点,区分已确认信息与未确认传闻。

2026-06-08
阅读时长: 2 分钟
中文繁體 English 日本語 Español
AI工具

MinerU 使用指南:把 PDF、Office 和图片解析成适合 RAG 的 Markdown/JSON

整理 opendatalab/MinerU 的能力、安装方式、命令行用法、部署选择和适用边界,帮助你把 PDF、Office 文档和图片解析成可用于 RAG 与 Agent 工作流的 Markdown/JSON。

2026-06-07
阅读时长: 2 分钟
中文繁體 English 日本語 Español
开发工具

Understand Anything 详细使用指南:安装、命令、Dashboard 与知识图谱工作流

整理 Understand Anything 的安装方式、常用命令、Dashboard 使用方法和典型工作流,帮助开发者用知识图谱快速理解陌生代码库。

2026-06-07
阅读时长: 2 分钟
中文繁體 English 日本語 Español
运维

群晖 DSM 7.3 部署 Syncthing:用 Container Manager 稳定运行

整理在群晖 DSM 7.3 中通过 Container Manager 部署 Syncthing 的关键步骤,包括 PUID/PGID、端口、目录映射和首次安全设置。

2026-06-07
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI工具

academic-research-skills 怎么用?Claude Code 学术研究 Skill 套件

整理 Imbad0202/academic-research-skills 项目:它如何把文献研究、论文写作、同行评审、修改和最终格式化做成 Claude Code Skill 工作流,并强调 human-in-the-loop 和引用校验。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

Agent-Reach 怎么用?给 AI Agent 接入多平台搜索和读取能力

整理 Panniantong/Agent-Reach 项目:它如何让 AI Agent 通过一个 CLI 读取和搜索 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书等平台信息,并尽量避免 API 费用。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI工具

career-ops 怎么用?用 Claude Code 管理求职流程

整理 santifer/career-ops 项目:它如何用 Claude Code、14 个 skill mode、Go dashboard、PDF 生成和批处理,把求职变成可自动化管理的系统。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

CopilotKit 怎么用?给前端应用接入 AI Copilot 和 Generative UI

整理 CopilotKit/CopilotKit 项目:它如何为 React、Angular、移动端、Slack 等场景提供 Agent 前端栈,并围绕 Generative UI 和 AG-UI Protocol 构建 AI Copilot 体验。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

DeepSeek-Reasonix 怎么用?DeepSeek 原生终端编程代理

整理 esengine/DeepSeek-Reasonix 项目:它如何围绕 DeepSeek prefix cache 设计终端编程代理,并通过 reasonix.toml、插件、MCP 兼容工具和多模型配置降低长会话成本。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

EverOS 怎么用?给 AI Agent 做长期记忆的本地框架

整理 EverMind-AI/EverOS 项目:它如何把对话、Agent 轨迹和文件变成可检索、可演化的长期记忆,并用 Markdown、SQLite 和 LanceDB 组成轻量本地存储。

2026-06-06
阅读时长: 2 分钟
中文繁體 English 日本語 Español
开发工具

Go 语言官方仓库怎么看?从源码理解 Go 的演进

整理 golang/go 官方仓库:它承载 Go 编程语言源码、标准库、编译器、runtime、issue 讨论和语言演进,是理解 Go 生态的核心入口。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

HyperFrames 怎么用?用 HTML 写视频的 Agent 友好工具

整理 heygen-com/hyperframes 项目:它如何让开发者和 AI Agent 用 HTML 描述视频画面,再渲染成视频,适合做产品演示、动态图文和程序化视频生成。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
AI工具

last30days-skill 怎么用?让 AI Agent 做最近 30 天趋势研究

整理 mvanhorn/last30days-skill 项目:它如何让 AI Agent 跨 Reddit、X、YouTube、Hacker News、Polymarket 和 Web 搜索最近 30 天信息,并生成带依据的趋势总结。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

MemPalace 怎么用?开源 AI 记忆系统适合哪些 Agent 场景

整理 MemPalace/mempalace 项目:它作为开源 AI 记忆系统,如何服务 LLM、Agent 和 MCP 场景,以及使用长期记忆时需要注意的边界。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
开发工具

Microsoft MXC 是什么?策略驱动的隔离和容器化实验

整理 microsoft/mxc 项目:它关注 policy-driven、layered isolation and containment,用 Rust 构建策略驱动的隔离和约束能力。

2026-06-06
阅读时长: 1 分钟
中文繁體 English 日本語 Español
1 2 3 4 5 11
© 2022 - 2026 KnightLi的博客
记录并分享
使用 Hugo 构建
主题 Stack 由 Jimmy 设计