納什均衡(Nash equilibrium)——完全信息靜態博弈

納什均衡
,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。

一個策略組合被稱為納什均衡,當每個博弈者的均衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。 

納什均衡例子

博弈論中一個著名的例子就是囚徒困境。囚徒困境是一個非零和博弈,說的是兩個嫌疑犯甲和乙私人民宅聯手作案,被警方逮住但未獲證據。警方於是將兩個嫌疑犯分開審訊。警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑3個月,對方將被判刑10年;若兩人都不招供則因未獲證據但私人民宅將各拘留1年;如果兩人均招供,每人將被判刑5年。於是,兩個人同時陷入招供還是不招供的兩難處境。結果是,儘管甲不知乙是否招供,但他認為自己選擇“招供”最好,因而甲會選擇“招供”,同樣乙也會選擇“招供”,兩人各判5年。而兩人都選擇不招供,雖證據不足但因私人民宅將各拘留1年的結果是不會出現的。


在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。納什均衡又稱為非合作博弈均衡,是博弈論的一個重要術語,它是以美國數學家、日後成為電影《美麗心靈》主人公的納什的名字命名的。在上述囚徒困境例子中,兩個囚犯符合自己利益的選擇是坦白招供。這種兩人都選擇坦白的策略以及因此被判刑五年的結局就是“納什均衡”。

arrow
arrow
    全站熱搜

    Janet 發表在 痞客邦 留言(0) 人氣()