证据链Replay modeLive gates visible

不录视频,也能复原面试主过程。

这个产品不靠录像制造安全感,而是把 prompt、命令、diff、浏览器行为和评分动作结构化,最后形成可复核的判断链。

Prompt3含审批和拒绝理由
命令4失败到通过可复核
Diff2 files改动范围可解释
边界0 异常剪贴板和外部 AI 未越界
Session

候选人进入工作区

身份、同意项、设备和网络预检通过。

candidate_checked_in
Code

定位竞态窗口

打开 order_service.py,发现幂等检查在锁外执行。

file_opened + file_focused
AI

请求 AI 分析

候选人要求 AI 只分析根因,不直接改代码。

prompt_sent + response_received
Test

测试先失败

新增并发用例后,test_duplicate_submit 复现重复扣减。

terminal_cmd + test_run
Diff

补丁落地

将幂等检查移入锁内,同时保留订单级去重。

diff_snapshot
Test

测试通过

并发用例和订单服务测试全部通过,最终 diff 保持小范围。

terminal_cmd + test_run
Submit

提交冻结

测试通过,提交快照进入报告链路。

submission_frozen

AI 使用如何被解释

候选人的 AI 行为被当作协作过程,不是黑盒结论。

候选人先分析,不要改代码

帮我确认这段库存扣减逻辑在并发请求下是否存在竞态窗口。

合规
AIAI 回答

幂等检查发生在锁外,两个请求可能同时通过 existing 判断,然后分别进入扣减流程。

已记录
候选人审批补丁

接受把幂等检查移入锁内,但拒绝 AI 删除订单级唯一约束的建议。

人工确认
01

候选人没有直接复制 AI 补丁,而是要求 AI 先解释风险。

02

最终 diff 聚焦在锁内幂等检查,未引入大范围重构。

03

测试从失败到通过的路径完整,可复核。

04

剪贴板和外部 AI 边界没有异常事件。