Avatar 🍥

KnightLi的博客

记录并分享日常

  1. 主页
  2. 关于
  3. 归档
  4. 搜索
  5. 链接
    1. 暗色模式

归档

2026 104
2025 23
2024 5
2023 9
2022 33
2021 5
2020 8

分类

技术文档 AI工具 硬件相关 开发工具 运维 AI行业 区块链 效率工具

标签云

本地大模型 Ollama Ubuntu Gemma 4 AI Agent Python GPU Llama.cpp Windows Hugging Face Hugo Linux VS Code Agent Skills Claude Code Codex MCP Nginx OpenClaw 引脚定义 硬盘 AI工具 AI编程 Browser Automation ChatGPT Claude Docker GGUF Markdown OpenAI
效率工具

自动剪掉静音空白,再导出到 Premiere 和 Resolve, auto-editor功能介绍

整理 auto-editor 这个命令行自动剪辑工具的核心能力:按静音或运动自动做第一遍粗剪,支持导出到 Premiere、DaVinci Resolve、Final Cut Pro 等编辑器,也能直接输出成片。

2026-04-23
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

AI 名词解释:用大白话讲清楚 Agent、MCP、RAG 和 Token

整理 10 个常见 AI 名词的直白解释,包括 Agent、Skills、MCP、API、RAG、AIGC 和 Token,帮助新手先建立一套能听懂日常讨论的基础框架。

2026-04-23
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

8G 显存跑 llama.cpp 怎么调:32K 更稳,64K 要开 KV Cache 量化

整理 8G 显存场景下使用 llama.cpp 的几个关键调优结论:什么是 32K、64K 和 KV Cache,为什么 32K 往往更稳,64K 为什么更依赖缓存量化,以及为什么一味拉高 CPU 线程反而可能更慢。

2026-04-23
阅读时长: 1 分钟
中文繁體 English 日本語
硬件相关

如何检查 Tesla V100 是否存在 ECC 错误

用 nvidia-smi 快速查看 Tesla V100 的 ECC 状态,并判断哪些错误计数应为 0 或 N/A。

2026-04-23
阅读时长: 2 分钟
中文繁體 English 日本語
硬件相关

特斯拉 V100 现在还能买吗:选购、ECC 检查、散热改造与 DIY 避坑

梳理特斯拉 V100 的选购重点:年份和外观怎么查、ECC 数值怎么看、哪些卡可能被动过手脚,以及 DIY 散热和供电为什么最容易翻车。

2026-04-23
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

Claude Code 环境配置四件套:CLAUDE.md、Rules、Memory、Hooks 一次讲清

为什么 Claude Code 用久了之后,环境配置比提示词更重要?这篇文章把 CLAUDE.md、Rules、Memory、Hooks 四个层面一次讲清,并给出一套实用的上手顺序。

2026-04-23
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

llama.cpp ollama 显卡性能天梯:CUDA、ROCm、Vulkan

基于 GitHub Discussions 中 scoreboard 页面,整理 llama.cpp 在 CUDA、ROCm、Vulkan 下的完整 GPU 跑分表,并解释 pp512、tg128、Q4_0、FA 等指标到底怎么看。

2026-04-23
阅读时长: 27 分钟
中文繁體 English 日本語
AI工具

显卡推理速度测试的常用指标具体含义:FA、pp512、tg128、Q4_0 都是什么意思

显卡推理速度测试里经常会出现 FA、pp512、tg128、Q4_0、t/s 这些缩写。它们都和性能有关,但测的不是同一件事。这篇文章用更短的方式把它们分别解释清楚。

2026-04-23
阅读时长: 1 分钟
中文繁體 English 日本語
开发工具

2026 年嵌入式开发环境怎么选:Keil、STM32CubeIDE、VS Code 与 AI 协作

在 AI 写代码已经变得很普遍的 2026 年,嵌入式开发环境怎么选?相比单押某个 IDE,更现实的答案往往是 Keil 负责编译调试,VS Code 负责编辑与 AI 协作。

2026-04-22
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

大模型常见张量类型入门:FP32、FP16、BF16、TF32 与 FP8

用一篇文章梳理大模型里最常见的张量类型:FP32、FP16、BF16、TF32 和 FP8,各自的位宽结构、优缺点,以及它们为什么会影响训练与部署体验。

2026-04-22
阅读时长: 1 分钟
中文繁體 English 日本語
开发工具

8 种常见配置文件格式怎么选:INI、XML、JSON、YAML、TOML 到 Markdown

整理 8 种常见配置文件格式的特点与取舍,包括 INI、XML、JSON、YAML、TOML、Apache 配置、Protocol Buffers,以及 AI Agent 时代重新受关注的 Markdown。

2026-04-22
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

16G 显卡也能跑 35B 模型:LM Studio 下 MoE 模型的显存压缩思路

整理一套 16G 显卡运行 35B 级 MoE 模型的实测思路:只要选对架构并调好 LM Studio 参数,16G 显卡并不一定只能停留在 12B 到 14B 模型。

2026-04-22
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Claude Code 多 Agent 协作:Subagents 和 Agent Teams 怎么选

梳理 Claude Code 里 Subagents 和 Agent Teams 的差异、适用场景与取舍方法,帮助你在多 Agent 协作时更快选对方案。

2026-04-22
阅读时长: 3 分钟
中文繁體 English 日本語
AI工具

GPT Image 2 正式发布:从能生成到能商用的跨越

整理 GPT Image 2 发布后最值得关注的能力变化,包括文字渲染、照片级真实感、世界知识、UI 截图生成与局部编辑,并附上 ChatGPT 与 API 的使用方式,以及几个高频生图场景的提示词参考。

2026-04-22
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

nuwa-skill:把“蒸馏一个人”从灵感变成可执行流程

alchaincyf/nuwa-skill 不是简单模仿名人语气,而是把调研、提炼、验证一个人思维方式的过程做成了可复用的 Claude Code Skill。

2026-04-22
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

OpenAI 发布 ChatGPT Images 2.0:图像生成开始走向可直接交付

基于 OpenAI 2026 年 4 月 21 日发布的 ChatGPT Images 2.0 页面,梳理这次更新最值得关注的方向:更强的文字与版式控制、多语言能力、更宽的风格覆盖,以及图像生成从“出图”走向“可直接交付”。

2026-04-22
阅读时长: 1 分钟
中文繁體 English 日本語
硬件相关

12V-2x6 与 12VHPWR:显卡 16Pin 供电接口差在哪里

整理 12V-2x6 与 12VHPWR 这两代显卡 16Pin 供电接口的主要差异:线材兼容性、针脚长度、SENSE 逻辑、H++ 标识和 600W 输出能力。

2026-04-19
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Karpathy 的 65 行 CLAUDE.md:让 AI 编程少犯三类错误

整理 Karpathy 对 AI 编程的观察,以及 Forrest Cheung 将这些问题沉淀成 CLAUDE.md 行为准则的思路:先想再写、简单优先、精准修改和目标驱动。

2026-04-19
阅读时长: 1 分钟
中文繁體 English 日本語
硬件相关

Core Ultra 9 285T ES 折腾笔记:Q4A7、B860 工程板与 35W 功耗墙

整理 Core Ultra 9 285T ES 样品 Q4A7 的平台、主板、供电、内存、性能、游戏表现和购买建议:规格很香,但 35W 功耗墙、DDR5 高延迟、ES 主板稀缺和 BIOS 简陋让它更适合低功耗折腾,而不是游戏主机。

2026-04-19
阅读时长: 3 分钟
中文繁體 English 日本語
AI工具

Claude Code 额度省着用:模型选择、上下文、缓存与 /compact

整理 Claude Code 和 Claude Pro/Max 额度容易耗尽的原因:模型选择、5 小时用量窗口、长对话、文件和图片、缓存失效、CLAUDE.md、MCP 与 skills,并给出 /compact、/clear、/context、/status 等实用习惯。

2026-04-19
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

rembg 项目整理:本地图片背景移除工具

整理 danielgatis/rembg 的定位、安装方式、CLI 用法、Python 调用、HTTP 服务、Docker 运行、模型选择和适用场景,方便判断它是否适合本地图片背景移除流程。

2026-04-19
阅读时长: 3 分钟
中文繁體 English 日本語
AI工具

Ollama 多显卡使用笔记:显存叠加、GPU 选择和常见误区

整理 Ollama 多显卡使用中的关键信息:什么时候会跨 GPU 加载模型、如何用 CUDA_VISIBLE_DEVICES / ROCR_VISIBLE_DEVICES 限制显卡、显存是否能叠加、不同 GPU 能不能混用,以及 Docker、PCIe 带宽和性能方面的常见误区。

2026-04-19
阅读时长: 3 分钟
中文繁體 English 日本語
硬件相关

联想 HR630x / HR650x 折腾笔记:LGA3647、8259CL、Optane 与避坑

参考 HR630x 装机日志和 HR650x 踩坑记录,整理联想 HR630x / HR650x 这类 LGA3647 服务器准系统的选购思路、CPU 与 Optane 搭配、VRM 解锁、风扇调速、riser、背板和 BMC/UEFI 注意事项。

2026-04-18
阅读时长: 3 分钟
中文繁體 English 日本語
硬件相关

MCP2221A-I/ST 选型笔记:USB 转 I2C/UART 的小工具芯片

整理 Microchip MCP2221A-I/ST 的关键参数和使用注意点:USB 2.0 转 I2C/UART、GPIO 复用、供电范围、封装、速率限制,以及适合放进硬件调试工具箱的原因。

2026-04-18
阅读时长: 2 分钟
中文繁體 English 日本語
硬件相关

LGA3647 高 TDC OEM CPU 点亮思路:修改 VRM 的 ICC_MAX

整理 ServeTheHome 论坛中关于 LGA3647 平台高 TDC OEM Xeon 处理器的 VRM ICC_MAX 修改思路:为什么会不亮机、需要准备什么、具体主板接线、刷写命令、BIOS 修改和风险注意事项。

2026-04-18
阅读时长: 8 分钟
中文繁體 English 日本語
AI工具

Google App 桌面版体验:把 AI 搜索放进 Windows

介绍 Google App 桌面版的核心功能、安装条件、快捷键调用方式,以及如何使用 AI Mode、Google Lens、屏幕共享、文件上传和本地文件搜索来提升日常搜索效率。

2026-04-18
阅读时长: 2 分钟
中文繁體 English 日本語
运维

理解 nftables 框架:表、链、规则和集合

从概念层面梳理 nftables 框架:table、family、chain、rule、set、map 和 verdict map 分别解决什么问题,以及它们如何组合成可维护的防火墙规则。

2026-04-18
阅读时长: 1 分钟
中文繁體 English 日本語
运维

nftables 快速入门:表、链、规则和常用操作

整理 nftables 的入门思路:理解 table、chain、rule 的关系,并通过 IP、MAC、端口匹配、流量统计、限速和规则删除等常用命令快速上手。

2026-04-18
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

Gemma 4 E4B 越狱版和官方普通版有什么区别

对比非官方 Gemma-4-E4B-Uncensored-HauhauCS-Aggressive 与 Google 官方 Gemma 4 E4B-it,重点说明行为、拒答、安全、许可和部署层面的差异。

2026-04-18
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Windows 用 WSL + Ollama 本地部署 Hermes Agent,并接入 Telegram

整理一套适合 Windows 用户的 Hermes Agent 本地部署流程:先装 WSL 和 Ubuntu,再装 Ollama、Gemma 4,并完成 Hermes Agent 与 Telegram 的基础接入。

2026-04-18
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

llama-cli -hf 下载 Hugging Face 模型默认保存在哪里

整理 llama-cli -hf 从 Hugging Face 下载 GGUF 模型后的默认缓存位置,以及如何用 LLAMA_CACHE 或 Hugging Face 缓存变量修改缓存目录。

2026-04-17
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Windows 下 llama-cli 直连 Hugging Face 报 SSL 证书验证失败怎么办

整理 llama-cli 在 Windows 下通过 -hf 下载 Hugging Face 模型时遇到 SSL 证书验证失败的常见原因和处理方法。

2026-04-17
阅读时长: 1 分钟
中文繁體 English 日本語
硬件相关

CRPS 通用冗余服务器电源标准、引脚功能与常见型号

整理 CRPS / M-CRPS 通用冗余服务器电源标准、2x25 金手指引脚定义、PSON/12VSB/PMBus 等信号功能,以及常见 CRPS 电源型号。

2026-04-17
阅读时长: 4 分钟
中文繁體 English 日本語
硬件相关

CSPS 服务器通用槽位电源接口与引脚定义

整理 CSPS / Common Slot 服务器电源的接口特点、64 pin 金手指引脚定义、12V 输出启用方法、PMBus/SMBus 信号和转接板设计注意事项。

2026-04-16
阅读时长: 5 分钟
中文繁體 English 日本語
AI工具

ChatGPT Codex 配额使用情况查询面板:codex-quota的使用方法

`codex-quota` 是一个轻量工具,能查询 ChatGPT Codex 配额使用情况,整理本地 CLI、Web 服务和 Docker/Compose 使用方法

2026-04-16
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

在 VS Code 里接入 Claude:从 API 配置到网页生成

整理一套在 VS Code 里接入 Claude 类模型做 AI 编程的入门流程,包括插件安装、API 配置、实际生成页面时的交互方式,以及使用这类工具时更值得关注的边界。

2026-04-16
阅读时长: 1 分钟
中文繁體 English 日本語
开发工具

Windows 上在 VS Code 里构建 Docker 镜像:从环境准备到一键构建

整理在 Windows 上使用 VS Code 构建 Docker 镜像的核心流程,包括环境准备、生成 Dockerfile、镜像构建方式,以及常见排查要点。

2026-04-16
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Claude 身份验证说明:为什么要验证、需要什么材料、数据如何处理

整理 Anthropic 官方 Claude 身份验证文档,说明验证触发场景、所需证件、Persona 的角色、数据保护方式,以及验证失败或账号被禁用时的处理方法。

2026-04-16
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Codex 额度怎么算:5 小时限额、周限额和 Credit 消耗

解释 Codex 的 5 小时限额、周限额、Credit 消耗、local task 与 cloud task 的区别,以及为什么 5 小时额度没用完时周额度也会下降。

2026-04-15
阅读时长: 2 分钟
中文繁體 English 日本語
硬件相关

常见 U.2 企业级 SSD 系列整理

整理常见 U.2 企业级 SSD 系列,包括 Solidigm、Samsung、Western Digital、Micron 和 Kioxia 的代表型号,帮助快速理解各系列的大致定位与适用场景。

2026-04-15
阅读时长: 3 分钟
中文繁體 English 日本語
AI工具

RAGFlow 项目整理:开源 RAG 引擎的功能与使用方法

整理 infiniflow/ragflow 项目的核心定位、主要功能、部署方式和基本使用流程,帮助快速判断 RAGFlow 是否适合用于企业知识库和 AI 问答系统。

2026-04-15
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

Firecrawl 项目整理:给 AI Agent 用的网页搜索、抓取与交互 API

整理 Firecrawl GitHub 仓库的核心定位、主要功能、适用场景、自托管与许可边界,方便判断它是否适合作为 AI Agent 的网页数据入口。

2026-04-15
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

Playwright CLI 视频录制:录屏、章节标记、Overlay 与调试对比

基于官方 video-recording 参考文档,整理 Playwright CLI 中视频录制、章节标记、Overlay API,以及与 tracing 的使用区别。

2026-04-15
阅读时长: 4 分钟
中文繁體 English 日本語
AI工具

Playwright CLI 会话管理:多浏览器会话、隔离、持久化与清理

基于官方 session-management 参考文档,整理 Playwright CLI 中命名浏览器会话、会话隔离、持久化 profile、并发使用和清理命令的常用方法。

2026-04-15
阅读时长: 3 分钟
中文繁體 English 日本語
硬件相关

M.2 E Key B Key M Key脚位说明整理

整理 M.2 脚位说明文件的重点内容,保留 Key E、Key B、Key M 三种 M.2 Socket 的 Pinout Description 表格,并补充简体中文说明。

2026-04-15
阅读时长: 4 分钟
中文繁體 English 日本語
AI工具

Playwright CLI storage state 用法:保存登录态、读取 Cookies 与本地存储

基于官方 storage-state 参考文档,整理 Playwright CLI 中 storage state、Cookies、localStorage、sessionStorage 和 IndexedDB 的常用命令与简明说明。

2026-04-14
阅读时长: 1 分钟
中文繁體 English 日本語
AI工具

OpenHarness 是什么:这个开源 Agent Harness 能做什么

基于 HKUDS/OpenHarness 官方仓库与 README,总结 OpenHarness 的定位、核心功能、ohmo 个人助手能力,以及它适合哪些使用场景。

2026-04-12
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

Playwright CLI 使用入门:安装、Skills、会话管理与常用命令

基于 microsoft/playwright-cli 最新 README,快速了解 Playwright CLI 的定位、安装方式、Skills 用法、会话管理、监控面板与常用命令。

2026-04-12
阅读时长: 3 分钟
中文繁體 English 日本語
AI工具

Hermes Agent 是什么:简介、优点、快速上手与 OpenClaw 对比

一文看懂 Nous Research 的 Hermes Agent:它适合谁、强在哪里、怎么开始用,以及它和 OpenClaw 在定位与使用体验上的差异。

2026-04-12
阅读时长: 2 分钟
中文繁體 English 日本語
AI工具

OpenClaw 类脑记忆算法 Dreaming:机器开始做梦,人类却在失眠

OpenClaw 推出 Dreaming 记忆整理机制,用浅睡、深睡和 REM 模拟人类睡眠巩固记忆,让智能体更会记重点、也更会遗忘噪音。

2026-04-12
阅读时长: 1 分钟
中文繁體 English 日本語
1 2 3 4
© 2022 - 2026 KnightLi的博客
记录并分享
使用 Hugo 构建
主题 Stack 由 Jimmy 设计