人は生活する上で、他者との協力が欠かせない。だからこそ、さまざまな思惑や悩みも生じる。人の協力の進化について研究する立正大学の山本仁志先生は、実験を通じて「人は裏切られても協力する」という結果を導き出した。どのような実験だったのか、またこの研究のベースにある「ゲーム理論」とはどのようなものか。さらには、その理論や実験から得られる知見を日常生活で生かす方法などについて、山本先生にざっくばらんに伺った。
人は、自分の利得を追求するものだが…
「人は裏切られても協力する」という結果は、どのような実験で導き出されたのだろうか。まずは、その実験の前提にあるゲーム理論の概略について、素人にもわかるように山本先生に教えてもらった。
「人は、いろいろな場面で『もっともよい状態』をめざします。例えば、仕事と趣味と日常生活のバランスを考えたり、効率のよい電車の乗り換え方法をアプリで探したりしますよね。自分の利得が一番になるように行動するのが当たり前です。
一方、ゲーム理論の世界では、自分の利得が、自分の選択だけでなく相手の行動によっても左右されます。自分がベストだと思った方法が、相手の行動によって最悪になることもあり得ます。お互いに影響を与えあう状況でどう行動すればよいのかを考えるのがゲーム理論なのです。今回の実験はゲーム理論の中でも、もっとも単純化したゲームのひとつ、『囚人のジレンマ』を用いて行っています」

山本先生

(山本先生の資料をもとに、ほとんど0円大学編集部で作成)
「囚人のジレンマ」では、2人のプレイヤーが登場して、それぞれが「協力」「非協力」のどちらかの行動を選ぶ。そして、自分の行動と相手の行動がどんな組み合わせになるかによって、それぞれの利益が決まる。両者が「協力」ならお互いに+3点。両者が「非協力」ならお互いに+1点。
それなら両者とも「協力」を選べばよさそうなものだが、そう単純ではない。自分が「協力」を選んだとしても相手が「非協力」を選べば、相手だけが得をする(自分は+0点、相手は+5点)からだ。逆に、相手が協力を選んだときに自分が非協力を選べば、自分だけが得をする(自分は+5点、相手は+0点)。
この場合、どう行動するのが最適なのだろう? 「非協力を選ぶと悪者みたいになるから……」などと躊躇してしまいそうだが、そのあたりの感情を脇におき、ただの手札として考えれば「答えは明確です」と山本先生は断言する。
「相手がどちらを選ぶとしても自分は非協力を取るほうが利益が多く、相手側から見ても同じことがいえます。だから、非協力を取るのが合理的な判断です。ただ、双方が協力すれば誰も損しないので、その方が明らかによい。でも、もし相手が非協力を選んだら……と考えると無限ループにはまってしまう。まさにこれがジレンマなのです」

(山本先生の資料をもとに、ほとんど0円大学編集部にて作成)
社会にはジレンマがいっぱい
「こうした状況は社会にも多く見られます」と山本先生。例えば、牛丼チェーン店の価格設定。競合する2社が適正な価格で勝負すればそこそこ利益は上がるが、どちらか一方が値下げをして客を集め、もう1社も対抗して値下げすれば、不毛な値下げ合戦に突入しかねない。
環境問題も同様だ。他国が二酸化炭素排出量を減らすなか、自国だけが排出量を気にせず生産拡大すれば利益を上げることができる。だからといって、すべての国がどんどん二酸化炭素を排出すれば大変なことになってしまう。

「みんなが『自分だけ得しよう』と行動すると、結局、お互いの利益にならないところに帰着してしまう。それが『囚人のジレンマ』です。人間関係があるところにジレンマあり。社会にはこうした状況がたくさんあります。そのとき、どんな仕掛け・仕組みがあれば協力がうまくいくのかについて、私はいろいろな角度から研究をしています」
「囚人のジレンマ」に関してはシミュレーションや実験により多くの研究がなされている。今回、山本先生は被験者を募り、ゲームから離脱するオプションの導入や手番のタイプなど、いくつかの拡張をおこなった実験を実施したところ、従来のゲーム理論モデルとは異なる予想外の結果になったという。
実験は被験者が得点を競うオンラインゲームで、2人だけで何回かプレイしてもらうというもの。じゃんけんのように一緒のタイミングに選択する「同時手番」と、順番に選択する「逐次手番」の2パターンで、計194名のにより行われた。

(山本先生の資料をもとに、ほとんど0円大学編集部にて作成)
山本先生によると、「同時手番」が囚人のジレンマの典型であり、一方、自然界では「逐次手番」の方が多いそうだ。なお、実験では被験者に予見を与えないよう事前にプレイ回数は教えず、「協力」「非協力」という表現も使わなかったという。
理論モデルでは、逐次手番で相手が非協力だった場合、次の手番で自分が協力するケースは0%に近い数字になるはずだった。ところが実験結果は61.0%と、予想よりずっと高い割合になったのだ(※)。わかりやすく表現すると、約6割の被験者が「裏切られた後でも協力しようとした」といえる。
※「同時手番」では52.3%だった
「人で実験したところ、理論上の最適解である『相手が非協力であれば自分も非協力』とは異なる結果になりました。理論で予想したよりも、より寛容になっています。
その理由については推測でしかありませんが、おそらく、人は1回の非協力は許して様子を見るのではないでしょうか。『仏の顔も3度まで』といいますが、1、2回のエラーや間違いに対して少し遊びをもたせるということでしょう。日常生活でいうと、親切にしたかったけど忙しかったなど、悪意じゃない場合もあります。人が“様子見戦略”を取っていることが今回の結果に反映されたと考えています」
科学技術が発達して生成AIなども登場したが、人には、コンピュータでは計算しきれない部分があると改めてわかって非常に興味深い。
人にとって、「寛容」が本来の姿なのかも
実は、協力は動物にもあるという。「動物界だけでなく、細菌レベルでも自己の利益を犠牲にして他者に利益を与える行動が広く見られます」と山本先生は話す。
協力には直接互恵と間接互恵の2種類があり、人以外の動物には直接互恵のみが見られるという。直接互恵とは同じ相手と繰り返し出会うことを前提に、その人に対して協力するかしないかを選ぶこと。たとえば恩返しはプラスの直接互恵で、復讐はマイナスの直接互恵にあたる。
間接互恵は、第三者からの評判を通して得られる協力・非協力の関係をいい、これはほぼ人間にしかないそうだ。

(山本先生の解説をもとに、ほとんど0円大学編集部で作成)
「ことわざの『情けは人のためならず』は、まさに間接互恵のこと。間接互恵には3者以上がかかわる社会構造と、評判を伝える言語能力が必要なので、人類にしか成り立ちません。間接互恵は人間どうしの協力を促し、人類が大きく成功し発展した基盤といえます」
今回、紹介した実験は直接互恵にあたるが、山本先生はこの間接互恵についても今後、取り上げたいとのこと。実際のところ、人は直接互恵と間接互恵の両方を考えて暮らしているので、両者をうまく統合する枠組みをつくって実験やシミュレーションをしたいという。また、人とAIが共存してこうした互恵的状況にAIが入ってきたとき、人はどう変わるのか、AIはどう振る舞うべきかも考えていきたいと話し、すでにこの観点からの研究も進めているという。
最後に、ゲーム理論や「囚人のジレンマ」の研究から、私たちがヒントにするべきことを聞いてみると、「寛容の重要さ」だと答えてくれた。
「ゲーム理論は、自分がもっとも高い利得を得るにはどう行動すればよいかを理論的に研究するものなので、ある意味で冷たい学問だといえます。その世界でさえ、寛容に振る舞うことが高い利益を得られる作戦になるとの研究結果が出ています。
寛容や許しは道徳的に正しいからそうあるべきだという考えはもちろんありますが、実は寛容であることは本人の利得につながり、より生き残りに有利であるということはゲーム理論からも言えるかもしれません」
最適解を求めるはずの実験でも、寛容さの重要性が見られるというのが意外だ。不寛容な時代、不寛容社会などといわれて久しいが、人にとっては寛容があるべき姿なのかもしれない。
「もちろん、ひたすら寛容であってもダメなので、寛容でありながらも最後の防波堤のようなものはつくる必要があります。どういう形がベストかは、今まさに研究を進めているところです」
山本先生の「協力は動物にもあるが、間接互恵はほぼ人間にしかない」という話は興味深い。人間社会をより心地のよいものにするには、きっと間接互恵が大きな役割を持つ。直接には知らない誰かに対しても寛容であることが大切なのだろうと感じた。