朝日新聞の記事の問題

 朝日新聞の記事の話題が、かなり盛り上がっている。報道内容の真実性や速やかに誤報を謝罪しないからだそうだ。
 福島第一原発吉田昌郎元所長の調書がその一つ。もう一つは朝鮮人従軍慰安婦吉田清治氏の証言に関する報道がそれに該当する。

 ここで取り上げるのは、「吉田」だ。日本人の姓は一説によれば三十万種と評価されているが、同じ吉田が主要記事で出現した不思議さ、稀さが大いに気になるのである。片方の吉田調書ではその信頼性は高いとみられ、もう一つの戦後の済州島の強制徴用の吉田証言は信憑性は疑わしいという落差がある。「吉田」は兼好法師の姓であったが、吉田神道の家系であるかもしれない。

 アダシゴトはさて置き、
  どれくらいの頻度でこんな珍事が起きるのであろうか?

 それを確率論でザックリ評価してみよう。
モデルを複雑化する手間を省くために「誕生日パラドックス」の評価式を用いるとしよう。
 一クラスn人の中で誕生日が同じになる確率という奴である。
これを次のように読み替える。
 時事問題の主要記事ではn人の姓が含まれるとする。その時にm種の姓が存在するものとしよう。主要記事とは朝刊の一面だとしておこう。犯罪、芸能やスポーツなど三面記事までは含めない。
 ここでの仮定はnという箱が固定されているということと、姓をm種に限定するのだ。

 という前提で、問題は下記のように定式化できる。

 「吉田」や「鈴木」というような同じ姓の日本人が二人以上、主要記事に存在する確率を求めよ

これは「吉田」でなくても「百目鬼」や「御手洗」のような珍名さんでもいい。とにかく日本人の姓の集合から2つ以上が、出現する確率を求めればいい。

 m種の姓があるとして、n人の日本人が主要記事に2人以上存在する確率の式はこうなる。

 mをどのくらい数にするかが問題だ。nは100件未満で評価しておけばいいだろう。

しょうが無いのでmを100から10000まで幾つか設定してみよう。
すると上式よりこういう計算表が生成できる。n=10から50まで、mは100から50000くらいまで、30個の組合せを近似計算した。

 

 ここから、何が読み取れるだろうか?
日本人の姓はいくら多いとしても、数千種で9割以上の人口をカバーするであろう。また、主要記事はたかだか20から30人くらいしか人名を含まない。
 そうするとm=5000のn=20から30人の辺りの確率が、今回のような「吉田」現象の
確率の見積もりになるとしてもいいだろう。
 0.04から0.08の確率である。20回に1回は起きている勘定だ。それほど稀ではない。
田中や鈴木では気づかないだけなのだろう。

【追記】歴史での類似現象
科学史で同じようなことが起きることもある。量子力学の初期段階。といっても40年くらいのスパンだろうが、ボーアとボルンとボームというBoで始まる名前が輩出したことがある。