后训练桌面端工程师
职位描述
岗位背景
我们在为大模型做「移动 & 桌面 & Web 应用开发」方向的后训练(SFT / RL / Agent 评测)。桌面端是当前模型能力最薄、但用户最在意的一块 —— Windows / macOS / Linux 三个平台、Electron / Tauri / Qt / 原生框架五花八门、还要跟图形栈(wgpu / Skia / DirectX / Metal)、系统级 API、accessibility tree 较劲。
模型能力的上限,本质上由训练数据和评测体系的质量决定,而桌面端这种"代码长得对没用、得真的能起窗口、能渲染、能被 Agent 点起来"的领域,造数据和搭评测的工程难度并不比训模型低。
我们需要一位真正懂桌面端的工程师,把数据合成、评测、桌面虚拟机和图形渲染这条链路做扎实。
你将负责
1. 训练数据构造:为桌面端方向(Electron / Tauri 跨端、SwiftUI / AppKit / WinUI / WPF / .NET MAUI / Qt 原生、Bevy / wgpu / Rust 图形底层 等)设计任务维度与配方,产出可用于 SFT / RL 的高质量数据,包括单文件代码题、多文件桌面 App 题、跨平台移植题、原生 API 调用题、图形 / 渲染管线题、多轮 Agent 任务等;
2. 自动化 / Agent / LLM 评测体系:设计与维护桌面端代码 / App 行为的自动化评测 —— 包括但不限于编译 / 打包验证、启动与进程健康检查、UI 比对、accessibility tree 对齐、跨平台行为一致性、Agent 端到端评测 —— 让"模型生成的桌面应用是不是真的能跑、窗口是不是真的对"可被自动打分;
3. 桌面虚拟机和沙盒集群:建设并维护 高并发、高可用、多样化 的桌面沙盒(QEMU / KVM / tart / Hyper-V / Parallels / Lima 等),覆盖 Windows / macOS / Linux 三平台与不同版本、不同图形栈,保证评测与训练场景的真实性与稳定性;扩展 Agent 在桌面环境里的能力边界 —— 截图、点窗、读 accessibility tree、装应用、跑测试。
职位要求
硬性要求
- 认可并深度拥抱 AI:这是岗位的前提 —— 本岗位的产出对象本身就是 AI,对 AI 抱观望或抵触态度的同学请绕道。要求把 AI 编程工具当成日常生产力的一部分,熟练使用 Claude Code / Cursor / Codex 等至少一款,持续关注前沿 Agent 框架与 harness(Claude Code、mini-swe-agent、OpenHands、SWE-agent 等),知道它们各自的设计取舍;了解 skill / plugin / sub-agent 等机制的原理与作用,知道在什么场景下该用哪种;
- 真正理解大模型与 Agent 的工作原理(这一条甚至比"会写桌面端"更重要):能清晰区分 SFT 数据 / RL reward / 评测集的差别,理解 prompt 设计 / tool calling / 多轮对话 / context engineering 这些概念到底在解决什么问题。不要求训过模型,但概念上要扎实 —— 你来这里不是写桌面应用的,是给模型造能力的,概念错了方向就错了;
- 1 年以上桌面端工程经验,Electron / Tauri / Qt / 原生(SwiftUI / AppKit / WinUI / WPF / .NET MAUI 任一)至少一栈真的写过、能上手;
- 熟悉 Windows / macOS / Linux 中至少两个平台的系统级开发(进程、IPC、文件系统、注册表 / plist、权限模型);
- Python 必备;TypeScript / Node.js 至少能读能改;
- 熟悉 Docker / Linux 与基础后端工程能力,熟悉至少一种桌面虚拟化方案(QEMU / KVM / Hyper-V / tart / Parallels);
- 会用桌面端自动化工具(WinAppDriver / pywinauto / accessibility API / UI Automation / AppleScript 任一)写脚本。
强加分项
- 做过 训练数据合成 / Benchmark 设计(尤其是桌面端 / GUI Agent benchmark);
- 在 Agent / MCP 生态里有过 深度参与(魔改过 harness、写过 MCP server、给开源 Agent 项目提过 PR 等),尤其有 computer-use / GUI Agent 方向的实战经验;
- Rust 图形 / 系统编程经验(wgpu / winit / Bevy / Tauri 内部机制);
- 跨端 UI 框架(Flutter Desktop / .NET MAUI / Compose Multiplatform)经验;
- 桌面端逆向 / 加固 / 安装包构建(MSI / NSIS / pkg / dmg / AppImage / Flatpak)经验;
- 了解 K8s / QEMU / 虚拟化 等基础设施技术,有 大规模桌面 VM 集群 或远程桌面池的搭建与维护经验;
- Go 工程经验。
投递