Skip to content

Commit d557ed2

Browse files
committed
mod
1 parent 7ef887a commit d557ed2

12 files changed

Lines changed: 850 additions & 1 deletion

docs/00-statistician-simulation-process.md

Lines changed: 12 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -12,7 +12,18 @@
1212
统计学家的代码开发流程通常不是“先写最快的代码”,而是:
1313

1414
```text
15-
先构造可控数据 -> 写清楚可信的参考实现 -> 用 simulation 暴露失败模式 -> 修改统计定义或实现细节 -> 再逐步放大数据规模 -> 只优化真正成为瓶颈的计算模式
15+
1. 定义问题与目标;
16+
2. 建立数学模型;
17+
3. 生成数据;
18+
4. 验证模型;
19+
4.1 在小数据上验证模型;
20+
4.2 在大数据上验证模型;
21+
4.3 在不同场景下验证模型;
22+
5. 优化模型;
23+
5.1 在不同场景下优化模型;
24+
5.2 针对性优化失败案例
25+
6. 验证优化后的模型;
26+
7. 重复上述过程,直到模型收敛或达到预设的停止条件。
1627
```
1728

1829
因此,对统计计算来说,理想的 Python 工具链不只是追求 benchmark 上的最低 runtime,而是要在以下目标之间取得平衡:

0 commit comments

Comments
 (0)