休日の本棚　ゲーム理論入門の入門 - 中小企業が日本を救うbusiness-doctor-28

f:id:business-doctor-28:20210502080242j:plain

おはようございます。

昨日の新規感染者は全国で５９８６人、そのうち東京１０５０人、神奈川２７５人、埼玉２３６人、千葉９５人、愛知３９８人、大阪１２６２人、兵庫５３９人、京都１５８人、福岡３５２人、沖縄１０５人、北海道１８０人などとなっています。全国各地で感染者は増加し、重症者は３か月ぶりに１０００人を超えました。大阪では過去最多の感染者数となり死者も４１人と過去２番目に高い数字になっています。第４波では５０代以下や基礎疾患のない人が死亡する割合が増えています。病床のひっ迫で重症患者でも十分な治療が受けられず死に至るというのであれば、これは人災以外の何ものでもありません。政府は緊急事態宣言を延長するかどうかGW明けに判断するようですが、現状では延期はやむを得ないところです。中途半端な状況で解除し再び感染拡大、再発令ということにならないように、専門家の意見に真摯に耳を傾け慎重に判断してもらいたいものです。

さて、今日は、鎌田雄一郎著「ゲーム理論入門の入門」（岩波新書）を紹介します。これまでも、行動経済学やゲーム理論に関する本を紹介しました。一年以上前に、トム・ジーグフリード著「最も美しい数学　ゲーム理論」を紹介した際に、鎌田氏の「ゲーム理論入門の入門」も取り上げました。改めて、ゲーム理論の入門書として紹介したいと思います。

ゲーム理論とは、ある種の意思決定を行った場合、何が起きるかを予想する理論です。要は相手の出方をどう読むかということです。自分にとって得か損かは相手の出方によって決まることが多いので相手の出方を読む必要があるのです。これは経済に限ったことではなく、あらゆることに当てはまり、当然企業の戦略にも当てはまります。

この本の「はじめに」でも

「もしあなたが重要な戦略決定（たとえば、新商品の価格決定や、新規市場への参入戦略の策定）に携わるビジネスパーソンなら、ゲーム理論の基礎を理解していることは欠かせないだろう」

と言っています。この本の著者の鎌田氏は、カリフォルニア大学バークレー校ハース経営大学院助教授で、専門はゲーム理論・政治経済学・マーケティングなどです。

第１章　ゲーム理論とは―戦略的思考の理論

　世の中には３つの意思決定問題があります。それは、①ラスベガスのカジノでの意思決定、②競馬での意思決定、③じゃんけんでの意思決定です。ルーレットのどのスロットにボールが入るか、サイコロの目がどういう確率で出るかは客観的予想で、1/36, 1/6とか、その確率は計算できます。競馬の場合には、過去のデータや当日の馬の状態などをどう見るか主観的予想が絡みます。

　じゃんけんの場合、相手はサイコロではないので、グーを出す確率、チョキを出す確率、パーを出す確率は1/3とはならず、主観的予想に基づく確率です。この主観的予測は、これまでの対戦での相手の傾向（過去のデータ）だけでなく、「自分は相手の出方を予想して意思決定するし、相手も自分の出方を予想して意思決定する」という戦略的状況によっても変化します。この戦略的状況をゲームと呼び、この最も難しい意思決定問題で何が起きるかを予測するのが、ゲーム理論です。

　ゲーム理論はじゃんけんの結果を予測するのに有効なだけではありません。NTTドコモとソフトバンクとａｕは新しいスマホ格安プランをリリースしています。顧客は各ブランドの値段や品質を見比べて、どれを買うか、どの料金プランにするかなどを決めます。ドコモは他の二社がいくらにするか、どんなプランを用意してくるか、どんな広告を打ってくるかを予想し、ソフトバンク（又はａｕ）が他社の戦略についてどのように予想しているかについて予想しなければなりません。自社の戦略を決定するためには、「ドコモは、ソフトバンクが（ａｕが）・・・どう考えているのか・・・さらにそのように考えているドコモについて、ソフトバンクが（ａＵが）どう考えているか・・・」と企業間の無限の思考の連鎖が必要になるのです。

　この複雑怪奇な戦略状況でどのように予測を立てていくかがゲーム理論なのです。

第２章　ナッシュ均衡ー相手の動きを読め！

　戦略的状況での行動＝相手が何をするかに対するベストな反応

という式によって表される状態がナッシュ均衡です。各プレーヤーが他のプレーヤーの戦略を予想して利得を最大化することを最適反応と言いますが、各プレーヤーが選んだ戦略が互いに最適反応の戦略になっていればナッシュ均衡です。ドコモの戦略がソフトバンクの戦略とａｕの戦略に対するベストの反応（最適反応）で、ソフトバンクの戦略がドコモの戦略とａｕの戦略に対するベストの反応（最適反応）で、ａｕの戦略がドコモの戦略とソフトバンクの戦略とベストな反応（最適反応）である状態のことです。

　「囚人のジレンマ」を例に挙げます。

　２人の囚人が別々に尋問を受けています。２人ともある犯罪に加担したことは分かっていますが、その詳細が分かりません。各人の取る戦略は、黙秘するか自白するかの２つです。両者が黙秘すると、結局判明している軽微な罪で懲役１年で済みます。両者が自白するとすべての犯行がバレて懲役３年になってしまいます。片方が黙秘しているのに自分一人が自白すると、自白した捜査に協力した者は無罪放免となり、黙秘していたものは悪質と懲役５年の刑に処せられるとします。お互いが自白するよりも黙秘していた方がよいことは明らかですが、このケースのナッシュ均衡は「お互いが自白する」ということになります。相手が何をやっても最適な戦略、つまり支配戦略は「自白する」ということです。

第３章　複数均衡の問題―どのナッシュ均衡？

　この章ではナッシュ均衡の予測が一筋縄でいかない状況のうち、ナッシュ均衡が１つではなく複数存在するケースが紹介されます。ここでは１組の男女が同じ携帯電話会社を選ぶ問題から、キーボードの配列はなぜこうもメチャクチャなのか、関東のエスカレーターでは左側に立つのに大阪では右側に立つのか、といったような問題が取り上げられています。

　パソコンのキーボードは「QWERTY配列」となっています。このような並び方になった理由は諸説あるようですが、タイプライターのアーム同士の衝突を避けるためというのが有力な説です。現在ではアームの衝突という問題はありません。それなのに、いまだに「QWERTY配列」となっているのでしょうか。「ドボラック配列」という左手で母音、右手で子音をタイプする方法がデザインされていますが、一向に流行りません。世の中のほとんどの人がＱWERTY配列を使っている以上、自分も同じものを使った方がいいという状態で、世の中全体がQWERTY配列から抜け出せないのです。

　東京ではエスカレータに立つ人は左側、歩く人は右側ですが、大阪では全く逆になっています。それぞれ異なるナッシュ均衡が成立した例です。

第４章　非存在の問題ーナッシュ均衡がない？！

　この章では、ナッシュ均衡が見つからないケースが紹介されています。そのようなケースではどのように予測を立てたらいいのか、サッカーのＰＫ、選挙戦で候補者がどのような政策をマニュフェストとして発表するかという問題が取り上げられています。

　第１章で取り上げたじゃんけんにはナッシュ均衡はありません。こちらがパーを出しているなら、相手はベストな反応をしなければならないのでチョキを出しているはずです。しかし、もし相手がチョキを出しているなら自分にとってパーを出すというのはベストな反応ではありません。したがって、じゃんけんにナッシュ均衡は存在しないのです。しかし、このでナッシュ均衡が存在しないのは、意思決定者がグーチョキパーのどれかを１００％の確率で選ぶという戦略に限定して考えたからで、その３つの手に確率を割り振るというような状況を考えれば、ナッシュ均衡は存在することになります。つまり、相手が「グーチョキパーをそれぞれ33.3％で出す」という戦略ならば自分も「グーチョキパーをそれぞれ33.3％で出す」というのがベストな反応になるわけです。

　サッカーのＰＫにおいて、キーパーがそれぞれの方向にジャンプする回数のデータが「キッカーがどの方向にけっても同じ確率で得点できる」という理論の予測と整合的であること、キッカーがそれぞれの方向にボールをける回数のデータが「キーパーは左右どちらにジャンプしても同じ確率で得点を防げる」という理論の予測Rと整合的であることが分かっています。

　第５章　完全情報ゲームと後ろ向き帰納法ー将来のことから考える

　これまでは全員の戦略決定が同時に行われることが前提とされていました。ここからは戦略決定が同時とは限らない状況が前提とされています。ラーメン店が新店舗をオープンすべきかどうかという問題を軸に、同時に意思決定がなされない場合のために考案された「後ろ向き帰納法」が説明されています。

　帰納法というのは、まず１つ目を分析し、それを基にすると２つ目のことが分かり、それを基にすると…といった解法ですが、一番将来に起きることを分析し、その分析結果を基にその直前に起きることを分析し、と後ろ向きに過去にさかのぼって問題を考える方法を「後ろ向き帰納法」と言っています。

　ここでは、一風堂がバークレーラーメン界で断トツの人気店ですが、ここに、博多天神が出店を考えているというケースについて説明されています。博多天神が出店しなければこの地域では一風堂の独り勝ちになります。仮に博多天神が出店した場合にどれくらいの利益が見込まれるかは一風堂の反応にかかってきます。一風堂が積極的な値下げ攻勢を仕掛けてきたら、低価格での競争を強いられ初期費用を回収できなくなってしまいます。しかし、一風堂が高値をキープして共存を目指したなら、博多天神も値段を高く設定することができ黒字を出すことができます。市場に参入すべきかどうかという問題は、新規事業を立ち上げる時にはたいてい既存企業がいるもので、その既存企業の反応を予想しながら事業立ち上げをすべきかを考えなければなりません。

　まず後ろ向き帰納法で、一番将来に起きることを考えます。それは、一風堂の意思決定の問題です。一風堂には「値下げ攻勢」と「高値キープ」の選択肢がありますが、値下げ攻勢を仕掛ければ赤字化する危険もあり、一風堂の意思決定としては「高値キープ」ということになります。博多天神はもし出店しなければ利潤ゼロなので、一風堂の意思決定が「高値キープ」と予想されるので、出店すれば黒字となり、博多天神のベストな反応は「出店する」こととなります。

　第６章　不完全情報ゲームと完全ベイジアン均衡そして前向き帰納法ー過去について考える。

　ここでは、過去になされた意思決定が観察されないかもしれないケースが紹介されます。「完全ベイジリアン均衡」「前向き帰納法」が説明されます。

　ここでは、画家の師匠、その画家の少し生意気な弟子、成金の大金持ちが繰り広げるゲームが取り上げられています。金持ちが自宅の応接間に飾る絵を画家に依頼しました。画家は自分で描くか弟子に仕事を丸投げするかを選びます。仕事を任された弟子は、師匠に言われたとおりに描くか、何もせずにほったらかしにするかを選びます。師匠が描くか弟子が描いた場合絵は完成し、金持ちは芸術のセンスがないので誰が描いたかは分かりません。金持ちは自分では絵の価値が分かりませんが、商談に来る取引相手は絵に詳しいとします。師匠の絵であればそれを見てビジネスチャンスにつながるかもしれませんが、弟子が描いた絵を見て「こんなつまらん絵を飾る人物は信用できない」とビジネスチャンスを失うかもしれません。師匠。弟子、金持ちの意思決定は枝分かれしたしたゲームの木で表すことができます。

　ここでは、他の意思決定者が何をしてきたかについてわからないという状況にあります。だからこそ、不完全情報ゲームと言われます。このような状況はビジネスの様々な局面で起こりえます。例えばあなたの会社にあるベンチャー企業が新しいソフトウェアの販売営業に来たとします。あなたにとってはそのソフトウェアが実際誰がどれくらいの時間をかけて開発制作したものか分かりません。でもわからないながら何らかの予測に基づいて購入するかどうかの意思決定をしなければなりません。またベンチャー企業ん方も、営業先の企業や担当者が不完全な情報を基に意思決定しなければいけないということを念頭に置いてセールストークしなければなりません。どのような多岐にわたるビジネスシーンもちゃんと枝分かれした「ゲームの木」で描き表すことができます。その分析ツールが「完全ベイジアン均衡」です。

この本は「ゲーム理論の入門の入門」と言いながらもかなり専門的な内容が展開されています。しかし、そこで挙げられている事例は面白く、なるほどと納得させられます。ゲーム理論を始めて学ぶにはよい本です。

f:id:business-doctor-28:20210502124044j:plain