いろいろなことを考察する

西浦氏の Scientific Reports 論文について(6)論文の実効再生産数と活動度の一部期間での一致


私がネット上でしていることの まとめ は、こちらに。
https://sarkov28.hatenablog.com/entry/2022/03/29/160915



目次


(1)序論

西浦氏らのグループは、2023-10 に Scientific Reports にコロナワクチンに関する論文を発表しました。
後に「コロナワクチンで死者9割以上減 京都大チームが推計」と共同が報じた論文です。(以下、西浦論文、と書きます。)
Evaluating the COVID-19 vaccination program in Japan, 2021 using the counterfactual reproduction number

本稿は、西浦論文 Figure 2B と、西浦論文 式(4)  h_t の一部とが、ある期間にはほとんど一致すること、その後の両者の上下関係、これらについての大筋での検討を行います。

西浦論文については、複数のエントリで書いています。

(1-1) 図6.1と図6.2

図6.1 (a) 西浦論文の実効再生産数 Figure 2B。(b) 西浦論文の活動度 式(4) h_t。(c) (a)と(b)を重ね合わせたグラフ。
図6.1 (a) は、西浦論文の実効再生産数 Figure 2B。(b) は、西浦論文の活動度 式(4)  h_t の一部(reporting coverage=0.25)。(c) は (a) と (b) との重ね合わせ。(c) の左方で (a) と (b) はほとんど一致している。この期間の実効再生産数の変動が、活動度の変動でほとんど説明できることを示している。

図6.1(c) の左部分で、実効再生産数が活動度とほとんど一致しているのが目を引きます。この図6.1(c) に説明を加筆したのが図6.2です。

図6.2 西浦論文の実効再生産数 Figure 2B と、西浦論文の活動度 式(4) h_t との重ね合わせとその説明
図6.2 西浦論文の実効再生産数 Figure 2B と、西浦論文の活動度 式(4)  h_t の一部 との重ね合わせとその説明

図6.2の期間(1)では、実効再生産数  R_t が活動度  h_t とほとんど一致しています。この期間の実効再生産数の変動が、活動度の変動でほとんど説明できることを示しています。期間(2)では、実効再生産数が活動度より大きくなります。活動度以外の感染拡大要因があったことになりますが、これはデルタ株の比率増加によると思われます。期間(3)では、実効再生産数が活動度より小さくなります。デルタ株による感染拡大効果を上回る感染抑制要因があったことになりますが、これは主にワクチンによる免役だと思われます。ただし、論文からワクチンの効果を定量的に見積もるのは困難です。

(2) では図6.1(c)を作図した意図を説明します。(3) では図6.1(c)の作図方法を説明します。(4) では、図6.2の期間(1)~期間(3)などについて分かる範囲で説明します。(5) では本稿の結論を述べます。(6) は、補足事項です。

(1-2) 本稿の考察の限界

期間(1)で実効再生産数  R_t と活動度  h_t がほとんど一致するのは、(4) に示すように少し考えれば意外なことではなく、むしろ当たり前です。しかし私はこの一致を興味深いと思ったので本エントリを書いてご説明しています。この一致をご説明できるのは、西浦論文 式(3)の重要パラメータの値が期間(1)ではかなり特定できる、という特殊な事情があるからです。

(4) では、図6.2の期間(2)や期間(3)についても検討しますが、これらの期間について言えることはかなり限定されます。というのも、これら期間での西浦論文 式(3)の重要パラメータの値は、大雑把にしか把握できないからです。

西浦論文の重要なパラメータである実効再生産数は、論文 式(3)によって他のパラメータから計算されます。本稿は、これらパラメータ同士がどういう関係にあるのかを検討します。検討は入手しやすい情報のみに基づいていて、前提とする西浦論文のパラメータの妥当性は検討しない上、一部のパラメータは論文での詳細開示がないことから、検討は限定的なものになります。

また論文が対象とする期間の一部(図6.2の期間(1))では定量的な議論ができていますが、他の期間で行っているのはできているとしても定性的な議論です。例えば、図6.2で期間(2)と期間(3)の境界の、縦線(C)の位置を他の資料から見積もり、論文 Figure 2B における位置と照合することはできていません。

こうした事情があるので、本稿が西浦論文の計算の一般的な妥当性を支えることはありません。

(1-3) 比較対象となる実効再生産数は「描かれていない」

なお、図6.1(c)図6.2 を私が作図した主たる意図は、青線で示した活動度と実効再生産数の比較です。ところが本来比較すべき実効再生産数は "Early schedule" と "Late schedule" の中間にある「描かれていない曲線」です。この事情は (6-1) に書きました。

(2)図6.1(c)を作図した意図

私は 別稿 で、西浦論文 式(4)の  h_tグラフ を示し、さらにその一部を 西浦論文 Figure 1重ね合わせたグラフ を示しました。この重ね合わせグラフを示したのは、 h_t の細かな上下が Figure 1 の細かな上下に反映されているのを示すためでした。

この重ね合わせも興味深いものでしたが、 h_t を重ね合わせるグラフは、西浦論文の Figure 1 ではなく、Figure 2B にすべきでした。なぜなら、 h_t は活動度なので、その影響が直接及ぶのは新規感染者数(やその予測値)を描いた Figure 1 ではなく、実効再生産数を描いた Figure 2B だからです。

(3)図6.1(c)の作図方法

図6.1(c) は、以下の要領で作図しました。

  • (3a) まず横方向に、2枚のグラフの日付を合わせました。
  • (3b) 次に縦方向に、Figure 2B の左方のできるだけ広い範囲に論文 式(4)  h_t の一部が重なるように、 h_t を上下に移動し、上下に伸縮しました。

(3b) でパラメータ  h_t を上下に移動し、上下に伸縮させたパラメータを、 h_t^{'} とします。すると両者の間には以下の関係があります。

 h_t^{'} = w_1 h_t + w_2 ...... 式(1)

 w_1,\ w_2 は定数です。( h_t を上下に移動することは、 w_2 を加算することに対応しています。 h_t を上下に伸縮することは、 w_1 を掛算することに対応しています。)

これまで、図6.1(c) や図6.2 で実効再生産数に重ね合わせた活動度を、 h_t と書いてきましたが、このように作図したのですから、正確に言うと重ね合わせたのは( h_t ではなく) h_t^{'} です。

なお重ねる範囲として Figure 2B の左方を選んだのは、この時期の実効再生産数が活動度  h_t^{'} にほとんど一致することが、計算モデル上、予想されるからです。詳細は (4-1-1) に。

(4)図6.2の期間(1)~期間(3)などについての検討

図6.2 を再掲します。

図6.2 [西浦論文の実効再生産数 Figure 2B](https://github.com/sarkov28/storage/blob/master/2023-10_Nishiura_Scientific_Reports/Figure_2B.png?raw=true) と、西浦論文の活動度 式(4) h_t との重ね合わせとその説明
図6.2 西浦論文の実効再生産数 Figure 2B と、西浦論文の活動度 式(4)  h_t の一部 との重ね合わせとその説明

図6.2で、縦線(A)から(B)の期間が期間(1)から期間(2)への移行期で、縦線(C)が期間(2)から期間(3)への移行期です。

以下で実効再生産数  R_t と活動度  h_t の関係を検討する際、西浦論文 式(3)

 \displaystyle R_{ab, t} = \left(1 - l_{a, t} - \frac{\sum_{k=1}^{t-1}{i_{a, k}}}{n_a}\right) K_{ab}\ p\ h_t\ d_t\ c_t ...... 論文 式(3)

を以下のように読み替えた式を使います。

 \displaystyle R_t = \left(1 - l_t - \frac{\sum_{k=1}^{t-1}{i_k}}{n}\right) K\ p\ h_t\ r\ u_t\ c_t ...... 式(2)

論文 式(3)から年齢層の要素を除いたのが式(2)です。ここで  R_t は全体の実効再生産数、 l_t は全体のワクチン免疫比率、 i_k は全体の新規感染者数、 n は全人口、(したがって、 \sum_{k=1}^{t-1}{i_k}/n は全体の既感染者割合)、 K は次世代を定める定数です。式(2)は年齢層の要素を除いているので厳密には成立しませんが、大筋では成立しています。

(4-1) 実効再生産数の動きの説明がある程度可能な前半

(4-1-1) 実効再生産数が活動度にほとんど一致する、期間(1)

図6.2 の期間(1)は、2021-03-04~2021-05-10 ごろの期間です。期間(1)では、実効再生産数  R_t が青線の活動度  h_t にほとんど一致しています。この期間の式(2)

 \displaystyle R_t = \left(1 - l_t - \frac{\sum_{k=1}^{t-1}{i_k}}{n}\right) K\ p\ h_t\ r\ u_t\ c_t ...... 式(2)

では、以下のように見なすことができます。

これらから式(2)は、

 R_t = K\ p\ r\ h_t ...... 式(3)

となります。(式(3)は、期間(1)でのみ成立します。)

期間(1)では、 R_t h_t の間に式(3)のシンプルな関係があることが分かりました。(3) の方法で  h_t を変形した  h_t^{'} R_t にほとんど一致する 図6.1図6.2 が得られたのは、 R_t h_t にこうした関係があったからです。

なおこの時期、Figure 2B の4つのシナリオの実効再生産数もほとんど一致しています。この時期にはワクチン接種者がほとんどいないので、異なる接種状況を想定する各シナリオが、実効再生産数に影響しないのです。

(4-1-2) 実効再生産数と活動度の、よりシンプルな関係式

式(3)( R_t = K\ p\ r\ h_t)であり、式(1)( h_t^{'} = w_1 h_t + w_2)であり、期間(1) ではほとんど  R_t = h_t^{'} ですから、概ね、

 h_t^{'} = K\ p\ r\ h_t = w_1 h_t + w_2 ...... 式(4)

と書くことができます。式(4)が複数の  t で成立することから、

 (w_1,\ w_2) = (K\ p\ r,\ 0) ...... 式(5)

を導けます。これは期間(1) の状況から得た値ですが、式(1)( h_t^{'} = w_1 h_t + w_2)のパラメータ  w_1,\ w_2 は研究期間全体で一定(=そのように作図している)なので、式(5)は研究期間全体で成立します。

これを使うと式(1)は、

 h_t^{'} = K\ p\ r\ h_t ...... 式(6)

と書くことができ、式(6)を用いると、式(2)

 \displaystyle R_t = \left(1 - l_t - \frac{\sum_{k=1}^{t-1}{i_k}}{n}\right) K\ p\ h_t\ r\ u_t\ c_t ...... 式(2)

 \displaystyle R_t = \left(1 - l_t - \frac{\sum_{k=1}^{t-1}{i_k}}{n}\right) h_t^{'} u_t\ c_t ...... 式(7)

となります。式(7)は、式(2)よりも見通しが良くなっています。(式(7)は研究期間全体で大筋で成立します。)

本項での検討を言葉で書くと、

私が図6.1(c)で行った作図が満たす式(6)を、図6.2 期間(1)でグラフがほとんど一致していることなどから導き、式(6)を式(2)に代入し、式(7)を得た、

となります。

(4-1-3) 期間(1)から期間(2)への移行期の、縦線(A)から縦線(B)

図6.2 の期間(1)(2021-03-04~2021-05-10 ごろ)の間、実効再生産数はほとんど活動度のみによって上下します。しかし、4月末の縦線(A)のころから、図6.2 の実効再生産数のピンク線が、活動度の青線の僅かに上で推移するようになり、ピンク線の幅程度の差が生じています。

これは4月末からのゴールデンウィークが連休として処理されていることによると思われます。ただし、西浦論文 補足情報 Table S1 のパラメータ  e にある通り、連休による感染拡大の効果は1日あたり2%以下なので、それほど大きくはありません。

(4-1-4) 実効再生産数が活動度を上回る期間(2)の前半

図6.2 の 2021-05-20 ごろの縦線(B) を過ぎたところから、実効再生産数のピンク線は、活動度の青線をはっきり上回るようになります。このころ、上で求めた式(7)

 \displaystyle R_t = \left(1 - l_t - \frac{\sum_{k=1}^{t-1}{i_k}}{n}\right) h_t^{'} u_t\ c_t ...... 式(7)

の各パラメータは、

という値なので、およそ、

 \displaystyle R_t = h_t^{'} u_t ...... 式(8)

となり、増加中のデルタ株比率 を反映した  u_t の分だけ、 R_t h_t^{'} より大きくなります。(デルタ株比率は、0~1ですが、パラメータ  u_t は 1~1.5 だと思われます。別稿(2-11) に関連があります。)

この間、(感染を抑制する)ワクチン免疫比率も上昇しますが、(感染を拡大する)デルタ株比率の上昇が先行するため、実効再生産数  R_t は活動度  h_t^{'} より上を推移することになります。

実効再生産数の動きをある程度説明できるのは、この7月末ごろまでです。

(4-2) 実効再生産数の動きの説明が困難な後半

デルタ株比率のパラメータ  u_t は、8月初めごろから上昇が鈍くなり始め、8月末には明らかに鈍くなります。したがってこの時期の実効再生産数と活動度の関係への  u_t の寄与は小さくなり、Figure S2 の年齢層別のワクチン免疫比率 の寄与が大きくなってきます。

ワクチン免疫比率は、8月に入ると年齢層により上昇するものと下降するものが混ざるようになります。ただしこの時期でも、下降する年齢層は70歳以上に限られること、下降の速度は上昇する年齢層の速度を上回ることから、全年齢層でのワクチン免疫比率  l_t は上昇しているでしょう。ただし全年齢層の免疫比率がどの程度の水準になっているかは見積もりにくいです。このため、 l_t が重要な役割果たす式(7)

 \displaystyle R_t = \left(1 - l_t - \frac{\sum_{k=1}^{t-1}{i_k}}{n}\right) h_t^{'} u_t\ c_t ...... 式(7)

の様子も見積もりにくくなります。したがって、実効再生産数  R_t と活動度  h_t^{'} の関係をこれまでの時期のように説明することは難しくなります。

図6.2 R_t h_t^{'} との関係からは、

  • (4-2a) 図6.2 期間(2)の後半(7月末ごろ~8月半ばごろ)は、 R_t h_t^{'} が近づいています。したがって、 u_t による感染拡大効果を  l_t による感染抑制効果(少し細かく書くと、 (1 - l_t) による効果)が打ち消しつつあるはずです。
  • (4-2b) 図6.2 縦線(C)(8月半ばごろ)付近では  R_t h_t^{'} が交差しています。この時期は、 u_t の効果と  h_t^{'} の効果が「釣り合う」状態になっているはずです。
  • (4-2c) 図6.2 期間(3)(8月半ばごろ~)は、 R_t h_t^{'} を下回り、さらにその差が徐々に拡大しています。したがって、 u_t の効果を、 l_t の効果が上回り、その差を拡大しているはずです。

図6.2 から得られる(4-2a)~(4-2c)の「・・・はずです」との推測を、 u_t を示している Figure S5 や、 l_t の年齢層別の値である Figure S2 の動きと照合することもある程度は行えるかも知れませんが、本稿での検討はここまでにしておきます。

(5)結論

西浦論文の実効再生産数のグラフ Figure 2B に、論文 式(4)の活動度  h_t の グラフを重ね合わせた 図6.1 と、説明を加筆した 図6.2 を作成しました。

図6.2 期間(1) では、活動度は実効再生産数にほとんど一致し、実効再生産数の動きを活動度だけでほとんど説明できることが分かりました。

また、図6.2 期間(2) の途中までは両者の関係をある程度説明できました。その後は、特にワクチン接種による感染予防効果がどの程度なのかが見積もりにくいため、説明が困難になりました。図6.2 期間(2) はデルタ株比率の上昇による感染拡大効果が強い時期だと思われ、期間(3) はデルタ株の効果をワクチンの効果が上回る時期だと思われるのですが、このことを論文のパラメータの動きと照合して説明することはほとんどできませんでした。

(6)補足事項

(6-1) 活動度と比較すべき実効再生産数について

西浦論文の Figure 2B は、4つのワクチン接種シナリオ(早いスケジュール "Early schedule"、遅いスケジュール "Late schedule"、高い接種率 "Elevated coverage"、ワクチンなし "Without vaccination")別の、実効再生産数です。

図6.3 西浦論文の Figure 2B
図6.3 西浦論文の Figure 2B

本来、論文 式(4)  h_t と比較すべきなのは、これら4つのシナリオの実効再生産数ではなく現実と同じスケジュールで接種した場合の実効再生産数ですが、それは論文中に示されていません。

比較すべき「現実と同じスケジュールで接種した場合の実効再生産数」の線は、Figure 2B の「早いスケジュール "Early schedule"」(緑線)と「遅いスケジュール "Late schedule"」(灰色線)との中間付近にあるはずです。この線は Figure 2B に描かれていないので、分かりにくく、比較しにくいです。

(6-2) 重ね合わせに使った西浦論文 式(4) h_t について

私が 別稿 で示した、西浦論文 式(4)の  h_t はこちらです。

図4 西浦論文 式(4)の h_t
図4 西浦論文 式(4)の  h_t

別稿では、西浦論文 Figure 1 に  h_t を重ね合わせていました。このため、使ったのは図4のうち報告率 reporting coverage=1 のグラフであり、横軸範囲は 2021-02-17 から 2021-11-30 でした。

本稿では、西浦論文 Figure 2B に重ね合わせるので、図4のうち 報告率 0.25 のグラフ を使い、横軸範囲は 2021-03-01 から 2021-11-30 にしました。グラフの曲線の色は、Figure 2B の他の線と区別しやすい色にしました。

グラフを作成したデータは、こちらの csv 形式のデータ の、報告率 reporting coverage=0.25 の、期間 2021-03-01~2021-11-30 です。重ね合わせの作図方法は、(3) で説明しました。

(99)更新履歴

  • 2024-01-23
    公開
  • 2024-01-30
    (1-2) から (1-3) を分離しました。
    (1)の記述の一部を (1-2) に移動すると共に、(1-2) に加筆しました。