選單

腦力小體操:國際象棋特級大師的6張牌puzzle

上一期 股票下車的最佳時間點和撲克遊戲

將一副(52張)紙牌混洗,然後面朝下放在桌子上。一張一張地翻轉。

規則:

如果出現黑牌,您將贏得$ 1。00;

如果出現紅牌,您將損失$ 1。00。

您無需花錢就可以開始遊戲,可以隨時叫停拿錢走人。現在的問題是,為了最大獲利,您有啥最佳的停止策略嗎?

答案

最先給出結果的

wwt

動態規劃:f[i][j]表示剩餘i張黑牌j張紅牌最優策略下期望能獲得的收益,則有f[i][j] = max(0, i / (i+j) * (1 + f[i-1][j]) + j / (i+j) * (-1 + f[i][j-1])),即選擇跑(收益為0)或跟(收益為期望值)。計算得f[26][26] = 2。624476

非常細心,把各個回覆裡的方案統統模擬了一遍的

魚魚魚蔥卷

我總結下吧。#28 的 simulate 函式可以模擬上述所有策略(除了出千):

一、只在第一張是黑牌時跑(#23):simulate(n, (1:52) 。< 2),期望收益是 0。50 元。二、有賺就跑(#1、#3、#9):simulate(n, (1:52) 。< 52),期望收益是 0。96 元。三、翻完第 13 張黑牌且有賺時跑(#7):simulate(n, max。(0, 26 。- (1:52))),期望收益是 1。66 元。四、賺夠 4 元就跑(#6,在 #11 修正):simulate(n, ((1:52) 。< 52) * 4),期望收益是 2。18 元。五、賺夠 4 元或剩餘黑紅比例小於 3:4 時跑(#26),期望收益是 2。50 元。六、#8、#11–12、#15 的策略(三者等價),期望收益是 2。62 元。出千(#22)也是個有趣的策略。我把這個理解為透視眼,直接在最大值處停下。用 sum([maximum(cumsum(shuffle(deck))) for i = 1:n]) / n 計算,期望收益是 4。04 元。要是厲害到能換牌,那就保證能賺 26 元了。

《智者為王》第三季,小明和小紅殺入年度決賽。兩人比分非常接近,下一局任何一位拿到100分就能贏下年度冠軍。

主持人抽到了下一輪的競技遊戲。

規則如下

桌面上一共扣有6張卡片(背朝上)。卡牌正面是數字1-6。雙方每人選一張(按兩人積分大小排先後)。

開牌之後,數字大的一方獲勝。贏家積分+100——等於直接奪冠。當然,這裡還有個特殊的規則。

兩個選手面前有用來答題的數字板。抽到牌後,數字答題板會出現一個交易按鈕。在45秒的思考時間內,任一方可以點選交易,提出交換雙方手牌。另一方可以點確定,也可以點選拒絕。如果點選確定,則雙方手牌就會被交換——然後就直接開牌比大小。

現在實際局勢如下:

小明抽到了2!

然後在45秒的分析時間內,小紅提出了交易。現在問:如果你是小明,你會點選同意嗎?

ps 前兩天先在往期ted上看到國際象棋大師Maurice Ashley提出了這個問題,然後又在微博上看到了…上天在反覆提示我用這個…YouTube上一位著名的數學科普作者Presh Talwalkar說,這個問題集中展示了博弈論為什麼不是機率論。