军舰的日志 - 务实程序员的自我修炼

2026年7月26日星期日

Strix 部署 · 架构 · 实践完整指南

基于 strix 1.3.1 源码（https://github.com/usestrix/strix）逐行核对 CLI 与运行逻辑编写。所有命令参数对应真实代码位置，可直接复制使用。

⚠️ 合规前提：Strix 是自动化渗透测试工具，仅可用于你拥有或已获书面授权的应用/资产。未经授权扫描他人系统属于违法行为。本指南所有示例目标均假设你拥有测试权限。

一、项目定位

Strix 是一个开源 AI 渗透测试工具，部署自主 AI agent 团队对应用进行漏洞发现与验证。核心区别于静态扫描器（SAST）：agent 像真实红队一样动态运行代码、构造 PoC、验证可利用性，产出可复现的漏洞报告而非误报堆积。面向开发与安全团队，支持 CI/CD 集成。

仓库：https://github.com/usestrix/strix ｜版本：1.3.1 ｜ License：Apache-2.0

二、技术栈

2026-07-26 15:21

2026年7月25日星期六

游戏引擎对比分析

覆盖 8 款主流引擎，从开发语言、授权费用、2D/3D 能力、目标平台、学习曲线到生态资源全面对比。评分基于公开资料与社区共识，含主观判断，仅供选型参考。

游戏引擎对比分析

一、选型看哪些维度

① 开发语言：JS/TS 适合网页派；C# 门槛适中；C++ 性能强但陡峭；无代码更适合零基础。
② 授权与费用：开源免费（Godot / Phaser）最省心；Unity 订阅、Unreal 抽成，上线后都要算账。
③ 2D / 3D 能力：2D 多数引擎都强；3D 差距大，Unreal / Unity 领跑，Godot 4 进步明显。
④ 目标平台：纯网页 H5、微信小游戏、PC、手机 App、主机——覆盖度直接影响发行。
⑤ 学习曲线：无代码与 GDScript 上手快；C++ / 蓝图体系需要时间沉淀。
⑥ 生态与资源：教程、插件、素材商店的多寡，决定你卡壳时能不能自救。

二、综合对比表

2026-07-25 23:26

game engine godot unity unreal cocos phaser game-marker

AI OS：智能体操作系统的范式革命 —— 巨头布局、核心本质与架构设计深度调研

多智能体深度调研成果

一句话结论：六家科技巨头已全部下场做 AI OS，2025–2026 年集中爆发；学界与产业界对其核心要素（记忆 / 决策 / 行动 / 安全四大系统原语）的定义高度收敛——AI OS 已从营销概念变成架构共识，竞争焦点转向「协议路线 vs GUI 路线」与「重构 vs 叠加」。

【Kimi】AI OS:智能体操作系统的范式革命六巨头布局、核心本质与架构设计深度调研

Section 01 · 新闻背景

2026-07-13：阶跃星辰「四件套」发布，AI OS 之争进入白热化

上海「阶跃终端品牌暨新一代智能体战略发布会」上，大模型公司阶跃星辰一口气发布四件产品，宣称构建「模、软、硬」三位一体闭环，并提出智能体落地的「三堵墙」理论。[1][2]

品牌：STEPX —— 大模型原生 AI 终端品牌。阶跃公式：「Step 模型矩阵 × Step Agentic-native OS」。[3]
操作系统：Step AOS —— 「全球首个智能体原生操作系统」。官方口径为在 Android/Linux/RTOS 之上重构的智能体原生中间层，向下兼容。[4]
个人智能体：阶跃Amoo —— 拥有操作系统级身份：跨应用调度、端云协同、多设备任务接续，「越用越懂用户」。
硬件：STEPX Neo —— 大模型原生智能体手机，背部点阵 LED 像素副屏，华勤技术代工；WAIC 2026 首秀即获「镇馆之宝」。[5][6]

2026-07-25 20:25

aios agent step android linux rtos kimi-k3

OfficeCLI 研究与实践总结

对象：iOfficeAI/OfficeCLI（https://github.com/iOfficeAI/OfficeCLI）时间线：研究 → 安装到 WorkBuddy → 能力验证 → 三格式展示文档文档性质：将「深度研究」与「本机实践」合并沉淀，既含结论也含可复现的操作记录

【WorkBuddy】AIOS_智能体操作系统范式革命.pptx

〇、一句话结论

OfficeCLI 是面向 AI Agent 的 Office 自动化套件：一个单文件二进制（内嵌 .NET 运行时，零安装、零外部依赖），提供对 Word / Excel / PowerPoint 的读、改、建能力，并用「高保真渲染 + 确定性 JSON 路径寻址」让 Agent 既能算、也能看见自己生成的排版（render → look → fix 闭环）。经本机实测，README 宣称的核心能力全部成立。它当前仅作为 WorkBuddy 用户级技能 安装在本机（~/.workbuddy/skills/officecli/），可被本 WorkBuddy 实例直接调用。

一、项目研究结论（深度）

1.1 定位与本质类别：面向 AI Agent 的 Office 文档自动化工具 / AI 中间件（Agent 与 .docx/.xlsx/.pptx 之间的适配层，本身不是聊天机器人）。技术本质：单文件二进制：内嵌 .

2026-07-25 19:17

officecli skill agent office word excel ppt

MinerU 使用指南

面向 LLM · RAG · Agent 的高精度文档解析引擎｜实测版本 3.4.4 ｜含本地真实跑通经验与踩坑实录

【WorkBuddy】MinerU使用指南

一、介绍：MinerU 是什么

MinerU（opendatalab/MinerU）是一个面向 LLM · RAG · Agent 工作流 的高精度文档解析引擎。它把 PDF / 图片 / DOCX / PPTX / XLSX / 网页转换为机器可读的 Markdown / JSON，供下游检索、抽取与处理。它的起源是 InternLM 预训练过程中的科学文献符号（公式、表格）转换需求，因此对公式和表格的处理是强项。

一句话定位：把"人类看的文档"变成"模型能吃的干净结构化数据"——这是任何 RAG / 知识库 / 文档智能产品的第一道摄入层。

1.1 能力矩阵

2026-07-25 16:46

mineru rag llm pdf docx pptx xlsx markdown json

MarkItDown 使用指南（实战版）

基于本地实测（markitdown v0.1.6 · Python 3.13）编写，输出均为真实命令捕获，非示意。项目：https://github.com/microsoft/markitdown ｜许可证：MIT（可商用）｜维护：Microsoft AutoGen 团队

验证进度：9 种格式中，Excel / Word / HTML / ZIP / Image(EXIF) / Audio(容器元数据) 已在本地用真实文件跑通；PPT / PDF 表现与直觉有出入（已标注）；YouTube 因本环境代理重置其 TLS 而未在本机跑通，命令与用法见第 5 节，可在能直连 YouTube 的机器上验证。

1. 它到底是什么

一句话：把任意文件（PDF / Office / 图片 / 音频 / 网页 / 压缩包…）转换成对 LLM 友好的 Markdown 的轻量 Python 工具。

本质定位：AI 应用链路里「模型前面的数据入口」——在喂给 RAG / 知识库 / 检索之前，先把杂乱格式洗干净。 设计哲学：不追求高保真排版还原，只保留对机器有用的结构（标题、列表、表格、链接），输出给文本分析工具消费。

⚠️ 它不是排版转换工具。如果你要的是「合同归档 / 视觉一致的 PDF 重排」，它不合适。

2. 30 秒上手

2026-07-25 14:49

markitdown markdown pdf excel word html zip image audio youtube

企业 AI 助手安全使用完整方案

面向已部署 / 计划部署 AI 助手（如 WorkBuddy、ChatGPT Enterprise、Claude、内部 Copilot 等）的企业覆盖：治理 · 部署架构 · 数据防护 · 访问控制 · 合规审计 · 落地路线图

原则：把发给 AI 的每句话当公开

分级 · 脱敏 · 最小权限 · 审计可追溯

贴合《个人信息保护法》《数据安全法》

1. 总体原则与定位

企业用 AI 不是"禁不禁"的问题，而是"在哪里用、用什么数据、谁能看"的问题。

核心结论（来自社区实践与一线技术文章共识）：企业用 AI 确实存在数据泄露风险，但风险主要源于架构选型与治理缺失，而非 AI 技术本身。通过私有化部署、RAG 权限隔离、严密的脱敏与审计，可构建"数据不出域"的安全闭环。

📌 四条铁律：

假设公开：发给 AI 的内容视为可能公开，绝不粘贴凭证 / 完整 PII / 未脱敏商业机密。

最小必要：只发送完成任务所需的最少数据，敏感字段在发送前脱敏或剔除。

越敏感越本地：敏感度越高，处理越应留在内网 / 自托管模型。

可审计：每一次 AI 调用、数据交互、工具执行都可溯源。

2. 组织治理框架

技术只占三分之一，治理决定成败。建议建立三层治理结构：

2.1 组织

AI 治理委员会：由 IT、安全、法务、业务负责人组成，制定并监督 AI 使用安全标准。
数据保护官（DPO）/ 合规负责人：对接《个人信息保护法》义务，处理违规与事件上报。
部门 AI 管理员：负责本部门知识库权限、账号开通与日常培训。

2026-07-25 08:01

enterprise-ai security governance deployment data-protection access-control compliance roadmap

社交平台用户需求扫描与创业机会研究报告

——基于国内外主流社交平台（Reddit / Hacker News / Product Hunt / X / 小红书 / B站 / 知乎 / 即刻 / 微博）的需求信号挖掘、机会评估与技术验证路线图

报告日期：2026 年 7 月 25 日

摘要

本报告通过系统扫描国内外主流社交平台上用户的真实抱怨、许愿帖（"I wish there was an app…"类内容）、趋势报告与创业社区讨论，提炼出十大高频未被满足的需求信号，并构建六维加权评估模型筛选出五个最值得优先进行技术验证的创业方向：

排名	方向	加权得分（满分5）	一句话逻辑
1	垂直行业 AI 工作流 Agent（法律/会计/医疗/跨境电商等文档与流程自动化）	4.05	B 端付费意愿最强，"窄而痛"是 2026 年最确定的变现路径
2	适老化数字助手 / 亲情远程协助	4.05	2.8 亿老年网民 vs "教不会"的子女，竞争极稀疏
3	内容真实性与"去 AI 味"工具（B2B 营销侧）	3.85	AI slop 反弹下，"证明你是真人做的"成为新预算项
4	情绪陪伴 / 心理健康轻应用	3.75	孤独经济高速增长，但需严控合规与伦理
5	垂直窄教育 AI（出海优先）	3.75	已被中国小团队反复验证的现金牛模式

2026-07-25 01:25

social-platform startup

2026年7月24日星期五

图标工具开发最佳实践与经验总结

项目：icon-tool/（Next.js 16 + React 19 + Tailwind v4）面向设计师的公开图标工具：浏览 + 检索 + 一键导出（SVG / Sprite / 多尺寸 PNG）

一、项目背景与目标

一个给设计师用的图标工具，要解决的核心痛点是：跨库统一搜索 + 一键导出多格式。首版定位为「游客可用的公开原型」——聚合精选开源库、强搜索、一键导出，账号/云端与 AI 生成推迟到后续阶段。

首版交付范围（Phase 0–3）：

内置 Lucide、Tabler、Phosphor 三库共 10134 个图标（构建时抽成 public/icons.json，约 7MB）
关键词搜索 + 按图标集 / 风格筛选（客户端）
悬停快操作、多选、批量导出 SVG 压缩包与 SVG Sprite
图标详情页 + 多尺寸 PNG 导出与复制
上传 SVG、收藏（均存 localStorage）

二、开发过程时间线

timeline
    title 图标工具开发时间线
    需求沟通 : 4 轮结构化提问收敛方向<br/>核心=浏览+检索+导出，技术栈/库/视觉/范围敲定
    Phase 0-1 : 脚手架 + 三库索引脚本<br/>10134 图标入仓，网格渲染 + 悬停快操作
    Phase 2-3 : 客户端搜索筛选 + 上传 + 多选批量导出
    设计升级 : 用 /前端开发 技能重做 UI<br/>暖中性画廊色 + 玻璃态 + Framer Motion
    体验迭代 : 放大图标 + 操作条移底 + 详情页 + 多尺寸 PNG
    沉淀 : 流程固化为 icon-library-bundler 技能 + 本文档

三、系统架构

graph TB
    subgraph 构建时["构建时 (CI / npm run build:icons)"]
        L["lucide-static"]
        T["@tabler/icons (outline)"]
        P["@phosphor-icons/core<br/>(regular + duotone)"]
        S["scripts/build-icons.mjs<br/>读 SVG→压缩→分类 style→索引"]
        L --> S
        T --> S
        P --> S
        S --> JSON[("public/icons.json<br/>10134 图标 · 7MB")]
    end

    subgraph 运行时["运行时 (Next.js App Router · 纯客户端)"]
        PG["app/page.tsx<br/>状态编排"]
        TB["TopBar<br/>批量操作条"]
        SB["Sidebar<br/>搜索/筛选/上传"]
        IG["IconGrid<br/>网格+骨架+空态"]
        IC["IconCard<br/>图标卡+底部操作条"]
        DP["app/icon/page.tsx<br/>详情页"]
        LD["lib/iconData.ts<br/>loadIcons / findIconById (缓存)"]
        EX["lib/export.ts<br/>SVG / Sprite / PNG"]
        LS[("localStorage<br/>收藏 / 上传")]
    end

    JSON -. "fetch 一次" .-> LD
    LD --> PG
    PG --> TB
    PG --> SB
    PG --> IG
    IG --> IC
    IC -. "双击 / 打开详情" .-> DP
    DP --> EX
    TB --> EX
    PG <--> LS

    style JSON fill:#faf9f5,stroke:#d97757,color:#141413
    style LS fill:#faf9f5,stroke:#a8a29e,color:#141413

关键架构决策：索引前置 + 纯客户端。

三库的 SVG 在构建时被抽成一份统一 JSON，前端加载后做客户端搜索与渲染，无需后端查询、无数据库、可静态部署。几千~上万个图标的规模下，fetch 一次 JSON + 内存过滤足够快。

四、关键技术流程

4.1 图标索引构建

flowchart LR
    A[扫描 node_modules<br/>各库 SVG 目录] --> B[读取每个 .svg 文本]
    B --> C[SVG 压缩<br/>去注释/多余空格/统一 currentColor]
    C --> D[归类 style<br/>line / filled / duotone]
    D --> E[组装统一记录<br/>id, set, name, style, tags, license, svg]
    E --> F[写入 public/icons.json]

统一记录结构（lib/types.ts）：

2026-07-24 20:41

icon-tool frontend react nextjs tailwind

OfficeCLI 命令行工具完整使用手册（Skill）

名称：officecli

描述：通过 officecli 命令行工具创建、分析、校对、修改 Office 文档（.docx、.xlsx、.pptx）。适用于用户需要新建文档、查看内容、检查格式、排查问题、插入图表或修改 Office 文件的场景。

officecli

适配AI使用的命令行工具，支持 .docx、.xlsx、.pptx。单二进制文件，无外部依赖，无需预先安装 Office。

安装

若未安装 officecli：

# macOS / Linux
curl -fsSL https://d.officecli.ai/install.sh | bash

# Windows（PowerShell）
irm https://d.officecli.ai/install.ps1 | iex

执行 officecli --version 验证安装。安装完成仍提示命令不存在时，请打开新终端重试。

使用层级策略

L1（读取操作） → L2（文档DOM编辑） → L3（原始XML） 优先使用更高层级接口。添加参数 --json 可输出结构化数据。

处理文档前，请查阅【专用技能模块】（文档底部） 融资演示文稿、学术论文、财务模型、数据看板、平滑切换（Morph）动画需要先加载对应专用技能——执行一次 load_skill 后再执行操作。

帮助系统（重要）

不清楚属性名称、取值格式、命令语法时，务必查看帮助文档，不

2026-07-24 19:48

officecli skill command-line-tool docx xlsx pptx office document-processing

2026年7月23日星期四

智会 T1 (SmartMeet T1)

——写给完全不懂硬件的软件工程师的硬件设计入门读本

这份文档假设你从未接触过硬件设计。它一边讲这个项目做了什么、怎么做的，一边把理解每个环节所需的硬件基础知识讲清楚。读完后你应该能：看懂这套设计文件、知道每个文件是干什么的、并能自己动手改一个尺寸、重新生成模型、拿去 3D 打印。

1. 这个项目是什么

我们团队做了一套「AI 智能会议系统」软件：开会时实时把语音转成文字、区分是谁在说话（说话人分离）、会后自动生成会议纪要。这套软件完全离线跑在一台 NVIDIA Jetson AGX Thor 开发套件上（一块带强大 AI 算力的卡片式电脑，可以粗略理解为"一台浓缩到巴掌大、专门跑 AI 的小型工作站"）。

软件跑在芯片上，但芯片不能裸着摆在会议桌上。这个项目要做的，就是给这套软件造一个 "身体"：一台放在公司会议室（20 人以内）桌上的硬件终端——它有外壳、有麦克风阵列、有扬声器、有状态屏、有摄像头，内部把 Thor 开发套件和这些器件安排得井井有条。

这台终端叫 智会 T1 (SmartMeet T1)，长这样：

智会 T1 等轴测前视图

需要说明的是：本项目交付的是结构设计与工程文档（外壳和内部布局怎么设计、怎么装配、买什么零件），不包括电路设计和软件代码。

2026-07-23 21:04

smartmeet smartmeet-t1 meeting-terminal hardware design freecad cad 3d-printing step stl kimi-k3

智能自动脱敏工具 · 全景指南（规则 / 边界 / 流程 / 图像）

技能：image-text-desensitization（别名"智能自动脱敏工具"）v3.0.0 主类：SmartDesensitizer 能力：覆盖文本 / JSON / 图像三类对象的隐私脱敏，全程本地运行，不联网 安全背书：经腾讯云安全 cloudsec.tencent.com 与腾讯内部 tix.qq.com 扫描，状态均为"安全无风险（benign）"

颜色图例（贯穿全文）

颜色	类型
🟣 紫	手机号
🟠 橙	身份证
🩵 青	邮箱
🟢 绿	银行卡
🔴 红	IP 地址

① 能力总览

该技能是一个被动库——需要显式调用才生效，不会自动拦截对话。它提供三个入口方法：

入口	方法	说明
📝 文本脱敏	`desensitize_text(text)`	基于 5 条正则逐类替换。已验证可用，纯 Python 即可。
🧾 JSON 脱敏	`desensitize_json(json_str)`	按字段名命中 + 按值形态智能遮蔽。已验证可用。
🖼️ 图像脱敏	`desensitize_image_base64(b64)`	OCR 文字框 + 人脸检测后高斯模糊。需额外依赖（本地未装）。

② 文本脱敏规则 desensitize_text

源码写死 5 条正则，按固定顺序执行：手机 → 身份证 → 邮箱 → 银行卡 → IP。

2026-07-23 16:02

workbuddy image-text-desensitization desensitize privacy security python regex ocr opencv

2026年7月22日星期三

语音识别及说话人分离模型（MOSS-Transcribe-Diarize）本地部署最佳实践

基于一次真实落地经历整理：在 Apple M2 Max（64GB 统一内存）上部署 OpenMOSS/MOSS-Transcribe-Diarize（0.9B 端到端音频转写 + 说话人分离），并构建 Web 应用。过程中解决了长音频（30 分钟 / 1–2 小时）在 MPS 上 OOM / 静默卡死的问题。

本文不重复项目能力说明，只讲"怎么把它跑稳、跑长"。能力研究与部署步骤见 README.md，Web 后端实现见 webapp/app.py。

0. 一句话结论

不要在 Apple Silicon 上一次性推理超长音频。 端到端音频模型会把整段音频堆叠成一个巨型张量送编码器，自注意力矩阵大小 ∝ 音频长度²，几分钟可以、30 分钟必炸。正确做法是按 ≤300s 分块推理、块间重叠、时间戳偏移拼接、每块后释放 MPS 缓存。

1. 部署：把"能跑"变成"稳定跑"

1.1 固定依赖版本，杜绝解析回溯

torch>=2.8 + 未固定版本的 pip install -e . 会让 uv 陷入 version-resolution 回溯死循环（解析到 2.13、多个 transformers 版本，半小时不收敛）。

2026-07-22 21:07

moss transcribe diarize deploy fastapi python macos mps

2026年7月21日星期二

M2 Max 本地部署 MOSS-Transcribe-Diarize：离线多说话人音频转写 Web 应用完整实战

基于 OpenMOSS/MOSS-Transcribe-Diarize 的本地部署，并构建了一个 Web 应用：用户上传音频/视频，模型自动完成 转写 + 说话人分离（Diarization）+ 时间戳 + 声学事件感知，返回带说话人标签的结构化字幕。

mindmap
  root((MOSS-Transcribe-Diarize<br>本地部署与Web应用))
    模型与能力
      端到端音频理解（0.9B）
      联合ASR与说话人分离
      输出Sxx标签与时间戳
      声学事件感知
      支持50+语言
    部署环境
      Apple Silicon M2 Max
      Python 3.12 + venv
      PyTorch 2.11 + Transformers 5.10
      HF镜像下载
      FastAPI后端 + 静态前端
    长音频处理策略
      自动分块（默认300秒）
      块间重叠（15秒）
      绝对时间偏移与去重
      逐块释放MPS缓存
      跨块标签不对齐（需外部聚类）
    Web应用功能
      拖拽上传音视频
      异步任务轮询
      彩色说话人标签与时间轴
      点击段落定位播放
      导出SRT/JSON/TXT
      一键复制全文
    性能与边界
      RTF小于1（MPS加速）
      单块小于等于300秒稳定
      需注意MPS OOM风险
      支持环境变量调参

一、项目能力研究

定位

MOSS-Transcribe-Diarize 是 OpenMOSS 团队开源的 端到端（end-to-end）音频理解模型，当前版本 0.9B（2026-07-09 开源）。它一次性联合完成「语音识别 + 说话人分离」，而非传统 pipeline（ASR + 独立的 speaker diarization 再对齐）。

2026-07-14 获 INTERSPEECH 2026 第二届 MLC-SLM 挑战赛第一名（覆盖 14 种语言）。
更强版本 MOSS-Transcribe-Diarize Pro 即将以 API 形式提供。

核心能力

能力	说明
长音频多说话人转写	面向会议、电话、播客、访谈、讲座、视频等杂乱多说话人录音
说话人分离（Diarization）	输出一致的说话人标签 `[S01]` `[S02]` …
时间戳	秒级对齐，格式 `[start][Sxx]text[end]`
声学事件感知	可选输出，标注非语音声学事件
多语言	支持 50+ 种语言

2026-07-21 20:11

moss transcribe diarize deploy webapp fastapi python macos mps

2026年7月20日星期一

发布

考试助手：单文件离线题库检索工具

考试助手（exam-helper）是一个单文件 HTML 应用，用于本地加载 Excel/CSV 题库并快速检索、查看答案。它无需服务器、无需联网，打开即用。

核心特性

单文件离线使用：构建产物只有一个 exam-helper.html，双击即可在浏览器中运行。
自动递归加载目录：选择包含题库文件的文件夹后，自动读取 .xls、.xlsx、.csv 及子目录中的文件。
多种检索方式：
- 中文关键字
- 全拼，如 anquan
- 拼音首字母，如 aq
- 英文缩写（大写），如 GDW
- 空格分隔表示“且”关系
自适应展示：响应式网格布局，宽屏一行多个卡片；每页固定 10 行，根据列数自动计算题数。
答案高亮：单选题、多选题的正确选项自动标绿，判断题、简答题直接显示答案。
备注醒目：备注信息以红色加粗显示，重要提示一目了然。

快速开始

npm install
npm run build

构建完成后，用浏览器打开生成的 exam-helper.html，点击「选择题库目录」并选中题库文件夹，即可在搜索框中实时检索题目。

首次使用必须手动选择一次目录，后续打开会自动使用浏览器缓存的题库数据。

题库格式

题库文件使用 Excel 工作表，第一行为表头，必须包含以下列：

2026-07-20 21:29

exam-helper question-bank-tool single-file-app html javascript open-source

2026年7月18日星期六

WorkBuddy Prompt 模板文件

本文件研究了 /Applications/WorkBuddy.app/Contents/Resources/app.asar.unpacked/resources/templates 目录下的全部 *.tpl 模板（12个文件），每个文件作为独立章节，原文（含 Jinja 占位符与 XML 标签）原样保留在代码块中。基于你提供的 WorkBuddy Prompt 模板文件，以下是其整体架构与各模板关系的思维导图（Mermaid 格式）：

mindmap
  root((WorkBuddy Prompt 模板))
    分类与概览
      共12个模板
      分类：模式提醒 / 系统提醒 / 身份上下文 / 主Prompt
      主Prompt分4个场景：Ask·编码 / Ask·通用 / Craft·编码 / Craft·设计 / 专家·编码 / 专家·通用 / 通用Craft
    模式提醒片段
      ask-mode-reminder
        Ask模式硬性规则：只读·不编辑·不运行命令
        建议切换至Craft
      craft-mode-reminder
        Craft模式能力激活：可自由编辑与创建文件
        直接执行任务
    系统提醒片段
      system-reminder
        占位标签
        运行时由系统注入提醒
    身份上下文模板
      user-context-expert-identity
        专家模式身份注入
        含BOOTSTRAP.md / USER.md
        聚焦产品身份与语气占位
      user-context-identity
        通用身份注入
        含SOUL.md / IDENTITY.md / USER.md
        用户自定义指令与语气风格覆盖
    主Prompt·Ask模式
      workbuddy-ask-prompt
        纯对话场景
        只读工具·不可编辑
        可视化工具（read_me / show_widget）
        MCP配置引导
      workbuddy-ask-coding-prompt
        Ask + 编码场景
        与ask-prompt同源
        强调代码库上下文与只读分析
    主Prompt·Craft模式
      workbuddy-prompt
        通用Craft默认主提示
        能力总览·Agent循环·结果呈现
        自动化任务与技能管理
      workbuddy-craft-coding-prompt
        Craft + 编码场景
        Agent循环·任务管理工具
        技能积累与反思（SkillManage）
        自动化（automation_update）
        可视化与多模态生成
      workbuddy-craft-design-prompt
        Craft + 设计场景
        智能设计助手角色
        画布三段式回复格式
        文生UI·截图验证
        目标节点优先原则
    主Prompt·专家模式
      workbuddy-expert-prompt
        专家模式通用（AGENTIC）
        角色覆盖·产物概览
        松弛自然沟通风格
        多模态生成与技能积累
      workbuddy-expert-coding-prompt
        专家 + 编码场景
        与expert-prompt同源
        聚焦编码任务与产物交付

该图清晰呈现了：

4 大类模板（模式提醒、系统提醒、身份上下文、主 Prompt）
7 种主 Prompt 场景（Ask 通用、Ask 编码、Craft 通用、Craft 编码、Craft 设计、专家通用、专家编码）
各模板的核心定位与关键约束（只读/可编辑、身份注入、可视化、自动化、技能管理等）

模板概览

2026-07-18 23:51

workbuddy prompt templates coding design agent

Hallmark 使用指南

mindmap
  root((Hallmark))
    是什么
      反 AI 味的设计技能
      让 AI 生成的网页像人做的
      Together AI 出品 · MIT 开源
    给谁用
      Claude Code
      Cursor
      Codex
    核心功能 · 四个动词
      默认 · 新建设计
        预检扫描现有项目
        设计三问 · 受众/用途/基调
        先预览后写码
      audit · 体检
        给旧代码查 AI 味
        只出清单不改代码
      redesign · 重构
        留文案和品牌
        推翻视觉重做
      study · 提取 DNA
        从截图或 URL 学设计
        拒绝像素级抄袭
    凭什么不像 AI
      21 种页面结构
      20 个主题 · 4 流派
      58 道俗套检测门
      六维交付自评
    关键机制
      log.json 强制每次不重样
      tokens.css 设计系统可移植
      design.md 锁定整站风格
    怎么用
      npx skills add nutlope/hallmark

项目地址：https://github.com/Nutlope/hallmark 在线演示：https://www.usehallmark.com 许可证：MIT

一、这是什么

Hallmark 是一个面向 AI 编程助手（Claude Code、Cursor、Codex）的设计技能（Skill），由 Together AI 出品。它解决的问题很具体：大模型生成的网页 UI 总有股"一眼 AI"的味道——居中大标题、紫蓝渐变、三列等宽卡片、Inter 字体……Hallmark 用一套强制规则把这些"默认审美"全部禁掉。

它的核心理念是结构多样性优先于视觉多样性：两个不同需求（brief）生成的页面，不应该只是同一模板换了配色，而应该像两个真正不同的网站。为此它内置了：

21 种宏观结构（macrostructure）——页面的整体骨架，如 Bento Grid、Long Document、Manifesto、Marquee Hero、Stat-Led 等
20 个命名主题（theme）——分属四个流派（genre），外加一个"自定义主题"隐藏分支
50 个组件原型——9 种 Hero、14 种导航、8 种页脚、5 种节标题等
58 道"防俗套检测门"（slop test）+ 交付前六维自评——任何一项不达标就打回重做

2026-07-18 21:10

hallmark skill design ai coding ux

open-ai-eco 接入本地 Agent：ACP 协议开发实践与架构总结

本文记录 AI 生态工作台（open-ai-eco）通过 ACP（Agent Client Protocol） 接入本地 Agent 的完整实践：选型理由、架构设计、关键实现、踩坑经验与验证方法。

1. 背景与目标

工作台是组内的 Astro 站点，用于展示 AI 研究成果。日常工作中沉淀了一批 Agent 技能（Skill）：

研究 AI 项目：给一个 GitHub 地址，自动研究并把结构化信息写入项目 Excel；
AI 周报：每周一生成结构化行业周报 Markdown；
后续还会有更多同类技能。

这些技能原本只能在终端里通过 Claude Code / Kimi CLI 使用。目标是：在工作台网页里加一个交互入口，直接在页面上对话、调用技能、审批文件操作，把"打开终端敲命令"变成"打开网页点一下"。

约束条件：主要自用、部署在内网 Node 常驻服务上、本地同时装有 Claude Code 与 Kimi CLI 两个 Agent。

2. 为什么选 ACP

2026-07-18 18:43

open-ai-eco agent acp integration architecture skills

2026年7月17日星期五

发布

中国象棋：浏览器本地人机对弈游戏

中国象棋是什么

中国象棋是一款在浏览器中直接运行的纯前端人机对弈游戏，无需安装、无需后端，打开网页即可与电脑 AI 对弈。游戏完整实现象棋规则，棋盘采用 HTML5 Canvas 绘制木质风格界面，支持桌面与移动端触屏操作。

核心功能

人机对弈：玩家可选择执红先行或执黑后手，AI 即时应招。
三档 AI 难度：入门、业余、高手，对应搜索深度 2 / 3 / 4 层。
Minimax + Alpha-Beta 引擎：AI 基于 Minimax 搜索与 Alpha-Beta 剪枝，结合棋子价值与位置评估表决策。
完整规则判定：马蹩腿、象塞眼、炮隔子吃、兵卒过河、九宫限制、将帅照面（飞将）等规则全部实现。
终局判定：自动识别将军、将死与困毙（无棋可走），并弹出结算提示。
走法提示：点选棋子后高亮显示所有合法落点，可吃子目标以红圈标出。
中文棋谱：自动以「炮二平五」式中文记谱法记录双方着法，吃子附带标注。
悔棋 / 认输 / 提示：支持悔棋（回退一回合两步）、一键认输，以及让 AI 推荐当前最佳走法。
对局信息：实时显示当前回合、双方用时与总步数。
本地音效合成：使用 Web Audio API 实时合成走子与吃子音效，可随时开关。
响应式布局：桌面端棋盘居中、左右信息栏；窄屏自动堆叠，手机触屏也能流畅对弈。

使用方式

打开中国象棋。
在「设置」中选择执子方（执红先行 / 执黑后手）与 AI 难度。
点击己方棋子查看合法走法，再点击目标位置落子。
需要时使用「悔棋」「提示」按钮，或对局结束后点击「再来一局」。

2026-07-17 23:03

ai browser chess chinese-chess game html5-canvas minimax tool web-audio-api

用单文件 HTML 写一个能对弈的中国象棋 AI——从规则引擎到 Alpha-Beta 剪枝

一次「中国象棋 + 纯前端 + 自写搜索算法」的完整实践。零依赖、零构建，双击即玩。本文记录规则引擎、AI 搜索、Canvas 渲染的设计思路，以及布局调试中踩过的几个值得记住的坑。

WorkBuddy + GLM-5.2 开发的，花了 200 积分。开发出来第一个版本并没有花多少钱，问题是反复修改一些小问题，积分用量就上来了，感觉缓存并没有起作用。

一、需求与技术选型

需求很朴素：一款可以人机对弈的中国象棋 Web 应用。

权衡后定的方案：

维度	选择	理由
形态	单文件 `index.html`	双击即可运行，无需构建、无需服务器，便于分享
技术栈	原生 HTML5 + CSS3 + ES6	零依赖，引擎/AI/UI 全在一个文件里也能保持清晰
棋盘渲染	Canvas	棋盘线条、楚河汉界、九宫斜线用 Canvas 绘制最直接
AI 算法	Minimax + Alpha-Beta 剪枝	经典、可控、纯前端可跑，难度由搜索深度决定

架构上坚持一点：引擎层（棋盘状态 + 走子规则 + AI）与 UI 层（渲染 + 交互）彻底解耦。引擎函数只操作棋盘数组，不碰 DOM，方便单独测试和替换。

二、棋盘数据结构

中国象棋是 10 行 9 列的交叉点棋盘。用一个二维数组表示：

2026-07-17 23:03

ai browser chess chinese-chess game html5-canvas minimax tool web-audio-api

2026年7月26日 星期日

2026年7月25日 星期六

2026年7月24日 星期五

2026年7月23日 星期四

2026年7月22日 星期三

2026年7月21日 星期二

2026年7月20日 星期一

2026年7月18日 星期六

2026年7月17日 星期五