/ 19 个已上线项目

我构建的产品

上线中的产品、研究工具与 AI 实验——大多数都有真实用户。

any2md

大多数转换器会静默丢失公式、表格和交叉引用。any2md 采用双引擎架构——PyMuPDF 提取文本 + Qwen-VL 解析视觉布局——再由 DeepSeek LLM 通过分层 Prompt + Few-shot + CoT 重建上下文。处理速度 68 页/分钟，表格结构化准确率 85%，LaTeX 公式保留率 90%。一周内为团队知识库导入 20,000+ 页文档，人工清理量减少 70%。

PythonVLMLLM

Low-Altitude Economy Research

所有人都以为感知风险会阻碍低空出行的采纳。我们基于 2,609 份问卷（回收率 93.1%，KMO=0.951）构建 TAM-SEM 模型，结果恰好相反：风险感知正向驱动采纳意愿（β=0.262, p<0.001）。同时用 SnowNLP 对 1,695 条 Bilibili 评论进行情感挖掘，绘制公众情绪图谱。这一「风险悖论」颠覆了十年来的技术采纳研究。省级一等奖。

SEMNLPPython

Nebutra Sailor

企业级 Monorepo，从 6 个共享包驱动 4 个应用（官网、Dashboard、文档、Studio）。Next.js 16 + React 19 + Tailwind v4，配备自定义 Design Token 流水线、541 个可 Tree-Shaking 的图标组件，以及支持 6 套 oklch 配色方案的多主题引擎。功能交付速度比独立仓库快 3 倍。

Next.js 16TurborepoAI SaaS

Synergistic Equilibrium

MCM/ICM 2025（B 题）：构建系统动力学 + NSGA-III 多目标优化器，平衡游客流量、环境质量与社会满意度。三维耦合模型的游客预测误差 8.3%，R²>0.5。与全球 28,000+ 支队伍同台竞技，获 Honorable Mention。

NSGA-IIISystem DynamicsPCA-KMeans

Biomass Co-Pyrolysis Optimization

三模型集成（LightGBM + 高斯过程回归 + PSO），在 500+ 个热解数据点上测试，发现 28.44% 的生物质-煤混合比例能最大化清洁能源产出，预测精度 R²>0.95。熵权模糊评价框架量化了 3 种产物（气、炭、液）之间的非线性交互。评委认为该方法可迁移至多个能源领域。数维杯一等奖 + 最高创新奖。

LightGBMPSOEnergy

China Pet Industry Forecast

构建了整合预测框架（ARIMAX-GARCH + VAR + LASSO + Prophet），覆盖市场规模、宠物数量和食品制造。LASSO 回归识别关键驱动因子，R²=0.9850。采用 HHI 集中度指数对比美国/欧盟市场。预测 2026 年宠物数量达 1.4468 亿只，产能利用率 82.8%。

ARIMAX-GARCHLASSOProphet

Cursor Export Extension

Cursor IDE 扩展（7 个 GitHub star），将 AI 对话导出为结构化 Markdown。在 214 次对话（1,980 条消息）上测试：单次处理时间从 5.8 分钟降至 0.8 分钟，代码片段丢失率 <0.5%，吞吐量 12.5 次/分钟。跨平台 VSIX，Windows/macOS/Linux 安装成功率 >98%。

TypeScriptVSCode APIDeveloper Tool

林莓莓 Brand Strategy

主导了苏州「林莓莓」农产品品牌升级，基于 PEST-SWOT 驱动。调研 1,200+ 消费者，绘制购买驱动因素与价格敏感度图谱。部署 Claude + Flux + Midjourney AIGC 工具链生成品牌故事与吉祥物概念，创意迭代周期从数周缩短至数天。预计用户互动提升 40%+。全国二等奖。

AIGCBrandClaude

MinerU-Skill

开源 Claude Code 技能，封装 MinerU 引擎实现版面感知的 PDF/文档转换。一条命令安装，无需 API Key，支持 3 种格式（PDF、DOCX、PPTX）。可处理 100+ 页文档，保留表格与公式。已发布至 Smithery 市场，首周 5+ 社区安装。为 Claude Code 生态打造，自动识别文档类型并智能分块。

Claude CodeOpen SourcePDF

Warehouse Inventory Drone

多旋翼无人机自动盘库系统。集成 STM32 飞控 + OpenMV 视觉 + BLE 通信，实现三维货架结构下的自主航点导航与 QR 码扫描。激光校准下条码识别准确率 95%，完整库存遍历在 3 分钟内完成。

STM32OpenMVPID

CDTMP Agent Protocol

将随机的 Prompt 工程转化为结构化 Agent 协议：任务分解、状态机、重试策略、可审计中间态。在 120 个跨领域任务上测试：成功率从 63% 跃升至 81%，JSON 合规率从 72% 升至 94%，返工轮次减少 29%。框架无关——可接入 LangGraph、Semantic Kernel 或自定义执行器。

Agent ProtocolLLMOpen Source

Next-Unicorn

每个代码库都会积累 Vibe Coding 债务：手写日期格式化器、自制日志库、定制状态机。Next-Unicorn 通过 Context7 MCP 审计代码，识别重复造的轮子，生成迁移方案并输出删除清单。176 个测试通过，含 29 个属性测试。已发布至 Smithery + npm，支持 35+ AI Agent，包括 Claude Code、Cursor 和 OpenCode。

TypeScriptCode AuditMCP

HydroGem

React + TypeScript 监控系统，追踪 12 项水质参数（pH、浊度、溶解氧等），5 秒自动刷新，告警阈值可配置。集成流式数据可视化与历史趋势分析，面向环境监测场景。

ReactTypeScriptIoT

OCR-Auto

生产级文档页面元素自动标注系统。异步四阶段流水线配合 Qwen VL 模型，识别 50 种元素类型（12 种代码语言、13 种交互格式、12 种内容元素、13 种其他标签）。三层容错机制（Retry + RateLimit + CircuitBreaker），SHA256 内容寻址缓存，实时 SSE 监控面板。

PythonQwen VLAsync Pipeline

TikTok Visual Search Pipeline

基于 LLM 的多模态视觉搜索相关性标注流水线。处理图像 + 文本信号，涵盖 8 个标注维度（视觉相关性、内容相关性、Query/Doc 退化、功能对等、类目粒度、视觉相似度、模态印证）。19 个 Prompt 版本，配备自动对比与反思分析工具。

PythonGemini 2.5Multi-Modal

MLBB Video Analysis

跨平台视频内容分析系统，覆盖 YouTube、Instagram、TikTok、VK 和 Facebook。从遗留单体重构为模块化架构：5 个平台采集器、6 个批处理器、5 个视频分析器。快速文本分析准确率 90%+，相比人工审核加速 460 倍，累计处理 1,207+ 个视频。

PythonAI AnalysisMulti-Platform

Synapse-Quant

开源加密货币量化交易 Copilot。8 个微服务 + 9 个基础设施服务（共 17 个容器），统一 TUI 驾驶舱、41 个技术指标、实时行情流、上下文感知 AI Copilot。TypeScript 5.7 + Python 3.11+，GitHub Actions CI/CD。

TypeScriptPythonK8s

HM3D 3D Scene Evaluation

面向 Habitat-Matterport 3D Research Dataset（1,000 个真实 3D 场景）的综合质量评估框架。评估 15+ 维度，涵盖网格质量、纹理完整性、语义标注准确性和元数据完备性。整体得分 4.62/5，验收通过率 100%（8/8 标准）。需求符合度 95%。

3D EvaluationData QualityGLB/OBJ

Appen ARG Dashboard

为 Appen（纳斯达克：APT）构建多租户报表基础设施。Next.js 16 monorepo（5 个应用 + 10 个共享包）服务 TCS、ByteWorks、DataPower 三客户绩效看板，Upstash QStash 异步任务队列驱动 CSV 导入 → 报告生成 → 邮件发送全流程。核心突破：MSW + tRPC 请求拦截级别的演示模式，配备「schema 校验 → 数据脱敏 → 归一化 → 值协议」隐私保护管道，4 种行为策略，彻底解决企业 SaaS 销售的核心难题。

Next.js 16TurborepoUpstash QStash

T2V Hook Relabeling Pipeline

元标注流水线：使用 Gemini 2.5 Flash 多模态对 AI 生成视频训练数据进行审计和纠错。每个视频分类 6 个属性（质量判断、性别、年龄、种族、场景、季节），EWMA 自适应限流 + HTTP/2 并发。通过 Gemini Files API 处理 60MB+ 远程视频，无需本地下载。3 轮迭代标注 + 增量合并：高置信度标签保留，低置信度重新审查。人工标注成本约 ¥7/条，本管线约 ¥0.07/条，规模化后差距扩大十倍。

PythonGemini 2.5 FlashAsync

URL Consistency Annotator

生产级 URL 一致性标注流水线，在击败 TLS 指纹反爬的同时实现零边际 LLM 成本。curl_cffi 完整伪装 Chrome 124 的 ClientHello（加密套件、扩展项、顺序），而非仅修改 User-Agent。Playwright 渲染 JS 驱动的 SPA；本地 Qwen3:1.7b（Ollama）语义对比，无 API 费用、无 GDPR 风险。旋转广告检测三次重抓取识别域名变更。30 并发 HTTP + 5 Playwright + 5 LLM。

PythonPlaywrightLocal LLM

3DGS Vendor Evaluation

首个 3D 高斯散射（3DGS）内容供应商能力系统化评估框架。跨 6 维度多轮评分：HP/LP 几何精度（枢轴对齐 + retopo 验证）、PBR 贴图完整性（BaseColor/Normal/Metallic/AO）、文件命名规范、语义标注精度、预览图标准（8 张以上）及沟通 SLA。核心发现：供应商技术上并非无能，而是流程上不成熟。结构化 CSV 让每轮修改迭代可追溯、可审计。

3DGSQuality FrameworkEnterprise