/ 19 个已上线项目
上线中的产品、研究工具与 AI 实验——大多数都有真实用户。
大多数转换器会静默丢失公式、表格和交叉引用。any2md 采用双引擎架构——PyMuPDF 提取文本 + Qwen-VL 解析视觉布局——再由 DeepSeek LLM 通过分层 Prompt + Few-shot + CoT 重建上下文。处理速度 68 页/分钟,表格结构化准确率 85%,LaTeX 公式保留率 90%。一周内为团队知识库导入 20,000+ 页文档,人工清理量减少 70%。
所有人都以为感知风险会阻碍低空出行的采纳。我们基于 2,609 份问卷(回收率 93.1%,KMO=0.951)构建 TAM-SEM 模型,结果恰好相反:风险感知正向驱动采纳意愿(β=0.262, p<0.001)。同时用 SnowNLP 对 1,695 条 Bilibili 评论进行情感挖掘,绘制公众情绪图谱。这一「风险悖论」颠覆了十年来的技术采纳研究。省级一等奖。
企业级 Monorepo,从 6 个共享包驱动 4 个应用(官网、Dashboard、文档、Studio)。Next.js 16 + React 19 + Tailwind v4,配备自定义 Design Token 流水线、541 个可 Tree-Shaking 的图标组件,以及支持 6 套 oklch 配色方案的多主题引擎。功能交付速度比独立仓库快 3 倍。
MCM/ICM 2025(B 题):构建系统动力学 + NSGA-III 多目标优化器,平衡游客流量、环境质量与社会满意度。三维耦合模型的游客预测误差 8.3%,R²>0.5。与全球 28,000+ 支队伍同台竞技,获 Honorable Mention。
三模型集成(LightGBM + 高斯过程回归 + PSO),在 500+ 个热解数据点上测试,发现 28.44% 的生物质-煤混合比例能最大化清洁能源产出,预测精度 R²>0.95。熵权模糊评价框架量化了 3 种产物(气、炭、液)之间的非线性交互。评委认为该方法可迁移至多个能源领域。数维杯一等奖 + 最高创新奖。
构建了整合预测框架(ARIMAX-GARCH + VAR + LASSO + Prophet),覆盖市场规模、宠物数量和食品制造。LASSO 回归识别关键驱动因子,R²=0.9850。采用 HHI 集中度指数对比美国/欧盟市场。预测 2026 年宠物数量达 1.4468 亿只,产能利用率 82.8%。
Cursor IDE 扩展(7 个 GitHub star),将 AI 对话导出为结构化 Markdown。在 214 次对话(1,980 条消息)上测试:单次处理时间从 5.8 分钟降至 0.8 分钟,代码片段丢失率 <0.5%,吞吐量 12.5 次/分钟。跨平台 VSIX,Windows/macOS/Linux 安装成功率 >98%。
主导了苏州「林莓莓」农产品品牌升级,基于 PEST-SWOT 驱动。调研 1,200+ 消费者,绘制购买驱动因素与价格敏感度图谱。部署 Claude + Flux + Midjourney AIGC 工具链生成品牌故事与吉祥物概念,创意迭代周期从数周缩短至数天。预计用户互动提升 40%+。全国二等奖。
开源 Claude Code 技能,封装 MinerU 引擎实现版面感知的 PDF/文档转换。一条命令安装,无需 API Key,支持 3 种格式(PDF、DOCX、PPTX)。可处理 100+ 页文档,保留表格与公式。已发布至 Smithery 市场,首周 5+ 社区安装。为 Claude Code 生态打造,自动识别文档类型并智能分块。
多旋翼无人机自动盘库系统。集成 STM32 飞控 + OpenMV 视觉 + BLE 通信,实现三维货架结构下的自主航点导航与 QR 码扫描。激光校准下条码识别准确率 95%,完整库存遍历在 3 分钟内完成。
将随机的 Prompt 工程转化为结构化 Agent 协议:任务分解、状态机、重试策略、可审计中间态。在 120 个跨领域任务上测试:成功率从 63% 跃升至 81%,JSON 合规率从 72% 升至 94%,返工轮次减少 29%。框架无关——可接入 LangGraph、Semantic Kernel 或自定义执行器。
每个代码库都会积累 Vibe Coding 债务:手写日期格式化器、自制日志库、定制状态机。Next-Unicorn 通过 Context7 MCP 审计代码,识别重复造的轮子,生成迁移方案并输出删除清单。176 个测试通过,含 29 个属性测试。已发布至 Smithery + npm,支持 35+ AI Agent,包括 Claude Code、Cursor 和 OpenCode。
React + TypeScript 监控系统,追踪 12 项水质参数(pH、浊度、溶解氧等),5 秒自动刷新,告警阈值可配置。集成流式数据可视化与历史趋势分析,面向环境监测场景。
生产级文档页面元素自动标注系统。异步四阶段流水线配合 Qwen VL 模型,识别 50 种元素类型(12 种代码语言、13 种交互格式、12 种内容元素、13 种其他标签)。三层容错机制(Retry + RateLimit + CircuitBreaker),SHA256 内容寻址缓存,实时 SSE 监控面板。
基于 LLM 的多模态视觉搜索相关性标注流水线。处理图像 + 文本信号,涵盖 8 个标注维度(视觉相关性、内容相关性、Query/Doc 退化、功能对等、类目粒度、视觉相似度、模态印证)。19 个 Prompt 版本,配备自动对比与反思分析工具。
跨平台视频内容分析系统,覆盖 YouTube、Instagram、TikTok、VK 和 Facebook。从遗留单体重构为模块化架构:5 个平台采集器、6 个批处理器、5 个视频分析器。快速文本分析准确率 90%+,相比人工审核加速 460 倍,累计处理 1,207+ 个视频。
开源加密货币量化交易 Copilot。8 个微服务 + 9 个基础设施服务(共 17 个容器),统一 TUI 驾驶舱、41 个技术指标、实时行情流、上下文感知 AI Copilot。TypeScript 5.7 + Python 3.11+,GitHub Actions CI/CD。
面向 Habitat-Matterport 3D Research Dataset(1,000 个真实 3D 场景)的综合质量评估框架。评估 15+ 维度,涵盖网格质量、纹理完整性、语义标注准确性和元数据完备性。整体得分 4.62/5,验收通过率 100%(8/8 标准)。需求符合度 95%。
为 Appen(纳斯达克:APT)构建多租户报表基础设施。Next.js 16 monorepo(5 个应用 + 10 个共享包)服务 TCS、ByteWorks、DataPower 三客户绩效看板,Upstash QStash 异步任务队列驱动 CSV 导入 → 报告生成 → 邮件发送全流程。核心突破:MSW + tRPC 请求拦截级别的演示模式,配备「schema 校验 → 数据脱敏 → 归一化 → 值协议」隐私保护管道,4 种行为策略,彻底解决企业 SaaS 销售的核心难题。
元标注流水线:使用 Gemini 2.5 Flash 多模态对 AI 生成视频训练数据进行审计和纠错。每个视频分类 6 个属性(质量判断、性别、年龄、种族、场景、季节),EWMA 自适应限流 + HTTP/2 并发。通过 Gemini Files API 处理 60MB+ 远程视频,无需本地下载。3 轮迭代标注 + 增量合并:高置信度标签保留,低置信度重新审查。人工标注成本约 ¥7/条,本管线约 ¥0.07/条,规模化后差距扩大十倍。
生产级 URL 一致性标注流水线,在击败 TLS 指纹反爬的同时实现零边际 LLM 成本。curl_cffi 完整伪装 Chrome 124 的 ClientHello(加密套件、扩展项、顺序),而非仅修改 User-Agent。Playwright 渲染 JS 驱动的 SPA;本地 Qwen3:1.7b(Ollama)语义对比,无 API 费用、无 GDPR 风险。旋转广告检测三次重抓取识别域名变更。30 并发 HTTP + 5 Playwright + 5 LLM。
首个 3D 高斯散射(3DGS)内容供应商能力系统化评估框架。跨 6 维度多轮评分:HP/LP 几何精度(枢轴对齐 + retopo 验证)、PBR 贴图完整性(BaseColor/Normal/Metallic/AO)、文件命名规范、语义标注精度、预览图标准(8 张以上)及沟通 SLA。核心发现:供应商技术上并非无能,而是流程上不成熟。结构化 CSV 让每轮修改迭代可追溯、可审计。