场景设定
- 词表(可押选项):
、、、
- 上下文长度:2
- 目标词:
第一轮下注
线索词: +
- 脑子里综合感觉:有点动作的意思
- 查经验表(初始随机)分钱:
| 词 |
押的钱 |
| 我 |
25 |
| 爱 |
25 |
| 吃 |
25 |
| 苹果 |
25 |
💡 初始完全随机,没有任何经验
目标词反馈:
- 你押给吃的钱太少(只有 25)
- 裁判说:“吃押太少,下一次多押点;其它押多了,少押点”
调整经验表
- 吃:+10 → 35
- 我:-5 → 20
- 爱:-5 → 20
- 苹果:-0 → 25
第二轮下注
线索词: +
| 词 |
押的钱 |
| 我 |
20 |
| 爱 |
20 |
| 吃 |
35 |
| 苹果 |
25 |
- 总押 = 100
- 目标词:
- 裁判反馈:
- 吃押 35 还不够 → +10
- 其它押多了 → -3、-2
调整经验表
| 词 |
调整后押的钱 |
| 我 |
17 |
| 爱 |
18 |
| 吃 |
45 |
| 苹果 |
20 |
第三轮下注
线索词: +
| 词 |
押的钱 |
| 我 |
17 |
| 爱 |
18 |
| 吃 |
45 |
| 苹果 |
20 |
调整后:
| 词 |
押的钱 |
| 我 |
15 |
| 爱 |
17 |
| 吃 |
50 |
| 苹果 |
18 |
第四轮下注
线索词: +
| 词 |
押的钱 |
| 我 |
15 |
| 爱 |
17 |
| 吃 |
50 |
| 苹果 |
18 |
调整后:
| 词 |
押的钱 |
| 我 |
14 |
| 爱 |
16 |
| 吃 |
53 |
| 苹果 |
17 |
第五轮下注
线索词: +
| 词 |
押的钱 |
| 我 |
14 |
| 爱 |
16 |
| 吃 |
53 |
| 苹果 |
17 |
调整后:
| 词 |
押的钱 |
| 我 |
13 |
| 爱 |
15 |
| 吃 |
55 |
| 苹果 |
16 |
✅ 总结这个多轮下注示例
- 每一轮都是:
- 线索词 → 综合感觉 → 查经验表 → 分钱
- 裁判反馈 → 调整经验表
- 经验表慢慢形成:
- 对特定上下文组合 → “吃”的押注越来越高
- 但不会到 100,因为其它场景可能需要不同押法
- 通过多轮、不同线索组合的练习,模型(你脑里的下注系统)逐渐学会在各种上下文下押最合理的钱
如果你愿意,我可以帮你画一个多轮下注流程图,让这个循环可视化,用颜色和箭头表示押钱增加/减少的变化,这样你可以完全在脑子里看到 CBOW 的动态训练过程。
你想让我画吗?