いろいろなことを考察する

高橋泰氏の「感染7段階モデル」の誤りと思われる点について

修正履歴 1 2 3 4

高橋泰氏は、 「新型コロナ、日本で重症化率・死亡率が低いワケ」 などで「感染7段階モデル」(以下、単に「7段階説」と書きます)を示しました。

これに関して 「高橋泰氏の「感染7段階モデル」に対する船曳氏の反論を検討してみました」 というエントリを書いていたところ、高橋氏の7段階説のいくつかの誤りと思われる点に気がつきました。
元のエントリは長くなったので、この誤りに関する検討をこちらに書きます。

本エントリを書くに当って、上記 東洋経済記事 の他に、以下の3つの論考や記事も参照しました。

ただしこれらを全て精読、把握できたわけではありません。特に「提言」は把握しきれませんでした。本来ならば最も詳しい「提言」を把握すべきところです。

(1)要点

  • (論点1)7段階説の「発症」とは何なのか
    主に7段階説における用語の不明確な部分を論じました。

  • (論点2)7段階説のいくつかの誤りと思われる箇所
    7段階説に、いくつかの誤りと思われる箇所を見つけました。
    特に (3b) は、7段階説に小さくない修正を要請するかも知れません。

(2)7段階説における「発症」とは何か(論点1)

本項は、7段階説における用語の定義を論じています。
興味が無い人は読む必要はありません。

7段階説では「発症者死亡率」への言及があります。これは「発症した人のうち、新型コロナを原因として死亡した人の比率」でしょう。
では「発症した人」というのは、7段階説においてどのステージに該当するのでしょうか。

結論は「ほぼ」明らかであり、ステージ3以降の人を指すと思われます。「ほぼ」と書いたのは、参照した資料に誤記と思える部分があり、その分確信を損ねたからです。

「提言」 の、 13/21 ページ(ノンブル20)に以下の記述があります。

ステージ5以降の重症に進むのは、20歳代発症者の場合10万人中5人(=0・0001%/1・9999%)

この計算は、(20歳代ステージ5以降) / (20歳代発症者) を計算しているはずなのですが、同じ資料の「表1」に、「20歳代」の数字はありません。
「20歳代」ではなく、「0-29歳」の誤記ではないでしょうか。

以下、ここを「0-29歳」と読み替えて検討します。
表1の「0-29歳」の欄で、「0・0001%」「1・9999%」「ステージ5以降」「発症」で探していくと、次の数字が見つかります。

  • 「ステージ5以降」の比率:0.0001 %
  • 「ステージ3+4」の比率:1.9999 %

上の引用した数式に出ているのはこれだと思われます。計算してみましょう。

(0-29 歳がステージ5以降の重症に進む比率) = 0.0001 / 1.9999 = 約 0.00005

これは、10万人中5人に相当し、「提言」本文の記述と一致します。

つまり、「発症」は「ステージ3以降」ということになります。

なぜこんな基本的なことを確認したのかというと、私の探し方が悪いのでしょうが、冒頭に掲げた7段階説に関する記事や論考に、この点についての明示的な説明が見当たらなかったのです。

しかも7段階説で何度も出てくる「7段階の表」、すなわち「提言」 の表1や、東洋経済記事 の表を見ると、表現が紛らわしくて迷うのです。そこでは以下のように説明されています。

  • ステージ0:症状:無症状
  • ステージ1:症状:ほぼ無症状
  • ステージ2:症状:ほぼ無症状 と 風邪様症状
  • ステージ3:症状:風邪様症状 と 隔離入院
    (以下略)

この中で「発症」はどこからなのでしょうか。

「ステージ0」と「ステージ1」は含まれないでしょう。「ステージ3」は含まれるでしょう。これらは問題ない。
では「ステージ2」はどっちなのか。

「ステージ2」の「症状」の1つに、「風邪様症状」と明記されています。何か症状があるのです。
「何か症状がある」=「有症」と考えてしまったので、私は当初、「発症」には「ステージ2」の一部が含まれる可能性を排除できないと考えました。そこでこの論点を検討したのです。

結局、本項前半で述べた誤記を前提した上ではありますが、

  • 「7段階説における「発症」とは「ステージ3以降」を意味している

と考えることができました。

(3)7段階説のいくつかの誤りと思われる箇所(論点2)

(3a)「提言」2/21 ページの件

「提言」 には、少なくとも1箇所、誤りがあると思われます。

2/21 ページ(ノンブル 7)一番下の段に、同じページの表2を参照しながら、

「①29歳以下の重篤化率が0.3%以下(人口1000人当り3人以下)」

との記述があります。これは表2との整合性を考えると、

「①29歳以下の重篤化率が0.2%以下(PCR陽性感染者1000人当り2人以下)」

の誤記ではないでしょうか。つまり2つの誤りがあり、

  • 「人口1000人当り」ではなく「PCR陽性感染者1000人当り」ではないか。
  • 「0.3%以下」ではなく「0.2%以下」ではないか。

「0.2%以下」の計算式は、表2を参照して
(1 + 1 + 4) / (253 + 356 + 2458) × 100 = 0.196 %
です。

もしかしたら文の表記ではなく、表2が誤っているのかも知れません。

これは論旨の骨格を揺るがすものではないと思われますが、確信はありません。
論考の冒頭付近でこうなっていると、若干心配な気持ちになります。

(3b) 最大の疑問点: 70歳以上の「暴露者死亡率」についての件

本エントリの中で、この件が一番大きな問題ではないかと思われます。
以下、手順は細かいが、簡単な計算をしているだけです。
順を追ってみていきましょう。

  • (3b1) 7段階説では「70歳以上の発症者死亡率は0.4%」としています。 例えば ここ の上の方。 7段階説に関して何度も出てくる数字です。

  • (3b2) 7段階説では「70歳以上のステージ1+2は、暴露した国民の中の97.996%」です。 例えば ここ の表。

  • (3b3) したがって、「70歳以上でのステージ3以降は、暴露した国民の中の2.004%」と計算できます。
    2.004 の計算式は: (全体) - (ステージ1+2の比率) = 100 - 97.996 = 2.004

  • (3b4) 先ほど(2)で検討したように、7段階説での「発症」とは、ステージ3以降を指すと思われます。

  • (3b5) 上記の (3b3) と (3b4) から「70歳以上で発症したのは、暴露した国民の中の2.004%」となります。

  • (3b6) 上記の (3b1) と (3b5) から「70歳以上で死亡したのは、暴露した国民の中の0.008%」と計算できます。
    0.008 の計算式は:2.004 × 0.4 % = 約 0.008

  • (3b7) ところが、このページ の表などには、「70歳以上で死亡したのは、暴露した国民の中の0.0044%」との記載があります。表の一番右下の数字です。

  • (3b8) ここで (3b6) と (3b7) を比較して頂きたい。「70歳以上で死亡した人の暴露した国民の中の比率」が、一方は 0.008% であり、他方は 0.0044% です。
    ここには2倍程度の開きがあります。


7段階説の数字のどこかに誤りがあると思われます。

今の推論の中で(2)の検討の結果を使いました。ここで何か間違ったのでしょうか。
しかし(2)の検討が誤っていて、「発症」がステージ2の一部を含むとすると、「70歳以上で発症した、暴露した国民の中の比率」は上記 (3b5) で計算した 2.004% より高くなります。すると (3b8) の2つの数字の乖離はより大きくなります。つまり7段階説の誤りは一層大きくなってしまいます。

仮に私の指摘通りに7段階説に誤りがあるとしても、これが7段階説全体にどの程度の影響を与えるのかはわかりません。
死者の比率に関する事項なので、7段階説に付随してよく言及される「全国で3800人以上死ぬことはなさそう」も修正されるのかも知れません。
とすると、これは影響が小さいとは言えないでしょう。

7段階説に誤りがあるとすると、どこなのでしょう。
例えば、7段階説は高齢者の暴露比率を高く見積もり過ぎていないでしょうか。高齢者は諸施設に入っているため、あるいは活動的ではないため、他の世代よりも暴露比率が低い可能性があります。
あるいは、7段階説の表 における高齢者のステージ3以降の確率は、若い世代より目立って高いのではないでしょうか。
ただしこれらを変更した時に、(3b8) で指摘した2つの数字の乖離がどう変動するのかはよくわかりません。

(3c) 7段階の説明図表で 100% になるべきものがなっていない件

7段階説に出てくる 7段階の説明図表 に、少し気になるところがあります。
この図表には、各世代別、ステージ毎の、暴露者の中の比率が予測されています。
比率なので、縦に足し算すると 100% になることが期待されます。

しかし実際は、「30-59歳」「70歳以上」においては、100% から少しずれています。それぞれ、100.0001%、100.0003% です。
計算式は
30-59歳: 98.0000 + 1.9994 + 0.0006 + 0.0001 = 100.0001
70歳以上: 97.9960 + 1.9940 + 0.0059 + 0.0044 = 100.0003

数字を調節した際の丸め誤差のようなものが出ているのでしょうか。
これは7段階説の論旨の骨格を揺るがすような問題ではありません。
しかしこれらの比率は、「最もありそうだ」とした推定値なのだから、丸め誤差などが出た際には調整できる性質のものと思われます。
ここの合計は 100% ぴったりであって欲しい。

(4)7段階説モデルの作成に関して

7段階説のようなモデルを作成する際は、まずはある時点で「最もありそう」な数値を決定していくのでしょう。
まずまずの解を得るのもかなり苦労しそうです。

しかしデータの方は随時更新されていきます。
新しいデータは新しい実態を示しているのだから、対応したくなります。
すると、苦労して決定した「最もありそう」な数値を修正することになります。

この修正は、初期段階ではほぼ手動で行うでしょうから、相当に神経を使う作業になります。
ちょっとした修正が全体のバランスを崩すかも知れません。
さらに、もしモデルに言及した文章があれば、そちらとの整合性も確保しなければなりません。
細かなミスはあちこちで発生するでしょう。

自分たちの「最もありそう」基準をルール化し、部分的にでもプログラムなどで監視するのでしょう。プログラムに数字を自動修正させると、いわゆる循環参照のような問題が発生しそうなので、警告を表示するようにしていくのだと思われます。
先ほどの (3c)「合計が 100% なっていない」みたいな論点の監視も、プログラムに向いた作業です。

(5)謝辞など

本エントリでは7段階説のいくつかの誤りと思われる点について述べました。

もちろん私は、7段階説に関する全ての論点を網羅的に調べたわけではありません。
特に 「提言」 は、読み込んだら得るものが大きそうなのですが、誤りと思われる箇所を発見したこともあり、気力を保てませんでした。

高橋氏、武藤氏、加藤氏は、7段階説を提示してくれました。敬意を表します。

7段階説は、新型コロナウイルスの理解進展に資するでしょう。
例えばスウェーデンの状況を7段階説で分析したら、日本と全く異なる様相を呈すると思われます。

文中、敬称を略したところもあります。お許しいただきたい。



  1. 修正履歴 2020-08-11: 目次を追加。

  2. 修正履歴 2020-08-31: 参照資料のページ表記に、pdf のページ番号を追加しました。

  3. 修正履歴 2020-10-09: 表現の小修正。

  4. 修正履歴 2020-12-13: 「である」調を「ですます」調に変えました。細かな文言も修正。