姚钰珩Yao Yuheng Yao Yuheng姚钰珩

数据科学家 · AI 系统研究者 Data Scientist & AI Systems Researcher

新加坡南洋理工大学(NTU)数据科学硕士在读,北京航空航天大学统计学学士。专注 AI Agent 系统工程(从零复刻 Claude.ai 并用 Eval 驱动迭代)、LLM 应用(SFT 数据管线、GEO 搜索优化)、以及数据科学全栈 — 用代码验证想法,用数据说话。 Pursuing M.Sc. Data Science at Nanyang Technological University, Singapore. B.S. Statistics from Beihang University. Building AI agent systems from scratch (replicated Claude.ai, benchmarked with eval-driven methodology), LLM applications (SFT pipelines, GEO search optimization), and full-stack data science — shipping code, measuring impact.

01

项目Projects

Claude AI HarnessClaude AI Harness

从零复刻 Claude.ai 的 Agent 体验 — 搜索、代码执行、文档生成、Office 导出,纯 Node.js 单文件,800 行核心循环。 Replicated Claude.ai agent experience from scratch — search, code execution, doc generation, Office export. Pure Node.js, 800-line agentic loop.

Agent Eval BenchmarkAgent Eval Benchmark

用 GAIA + FRAMES 数据集量化自建 Agent 与 Claude.ai 的差距(37% vs 80%),逐题归因,Eval 驱动迭代。 Quantified DIY agent vs Claude.ai gap (37% vs 80%) using GAIA + FRAMES, with per-task failure attribution and eval-driven iteration.

FoundGEO — 生成式引擎优化FoundGEO — Generative Engine Optimization

GEO 研究项目,探索 AI 搜索时代的品牌可见性优化方法论与实践框架。 Research project on Generative Engine Optimization — brand visibility methodology for the AI search era.

LLM SQL 查询优化LLM SQL Query Optimization

NTU 毕设:用 LLM + 反例引导的 SQL 查询重写,基于 VeriEQL 形式化验证确保语义等价。 NTU capstone: counterexample-guided SQL rewriting with LLM, VeriEQL formal verification for semantic equivalence.

中文敏感数据 SFT 管线CN Sensitive SFT Pipeline

中文敏感内容的 SFT 数据采集与清洗管线,为 LLM 微调提供高质量对齐数据。 SFT data collection and cleaning pipeline for Chinese sensitive content, producing alignment data for LLM fine-tuning.

弹性福利报销系统Flexi-Benefits Claim System

基于 Next.js + 飞书的 HR 弹性福利报销后台,支持双向审批同步与报表导出。 Next.js + Feishu HR backend for flexi-benefits reimbursement with bidirectional approval sync.

02

技术栈Skills

AI Agent Systems Claude API / Tool Use Eval-Driven Development LLM Fine-tuning (SFT) Python Node.js TypeScript SQL / SQLite GEO / SEO LangGraph WebGL / Three.js Astro Data Visualization Machine Learning Statistical Modeling
03

公开资料Resources

资料分享Curated Resources

精选 AI、GEO、认知成长类文档,已转存为 Markdown 供离线阅读。 Curated documents on AI, GEO, and personal growth — converted to Markdown for offline reading.

04

学习专栏Learning

Deep Dive

AI Agent 设计与实现白皮书AI Agent Design & Implementation Whitepaper

拆解 Claude.ai、Claude Code、Codex、Cursor 的 Agent 架构,从模型层到系统工程层全面解析Dissecting the agent architectures of Claude.ai, Claude Code, Codex & Cursor — from model internals to systems engineering

AgentTool UseClaudeArchitecture
2026-05-05
05

文章Writing

订阅更新Stay Updated

新文章发布时收到邮件通知 Get notified when new posts are published

RSS Feed