いろいろなことを考察する

西浦氏の Scientific Reports 論文について(5)論文 Figure 1 を構成しているパラメータの検討


私がネット上でしていることの まとめ は、こちらに。
https://sarkov28.hatenablog.com/entry/2022/03/29/160915



目次


(1)序論

西浦氏らのグループは、2023-10 に Scientific Reports にコロナワクチンに関する論文を発表しました。
後に「コロナワクチンで死者9割以上減 京都大チームが推計」と共同が報じた論文です。
本稿では Scientific Reports 論文を西浦論文と書きます。
Evaluating the COVID-19 vaccination program in Japan, 2021 using the counterfactual reproduction number

図5.1 西浦論文の Figure 1
図5.1 西浦論文の Figure 1

本稿は、西浦論文 Figure 1 を構成している主なパラメータについて検討します。

Figure 1 では、予測値が実測値に概ね一致して見えます。これに対し、「一致しているのは、論文執筆者が裁量でパラメータの値を調整して「作った」からなのでは」との疑問があります。このため、以下では、「論文執筆者の裁量が入る余地がどの程度あるか」に注意しながら各パラメータを検討します。

西浦論文については、複数のエントリで書いています。

(2) Figure 1 を構成しているパラメータに論文執筆者の裁量余地はあるか

まず (2-01) に Figure 1 を構成しているパラメータを挙げ、その後の各項で各パラメータについて検討していきます。 この際、各パラメータに、西浦論文 Figure 1 をフィットさせるための論文執筆者の裁量が入る余地がどの程度あるかを見ていきます。

(2-01) パラメータのリスト

  •  l_{a,t}: 年齢層  a の時刻  t におけるワクチンによる感染予防効果。
  •  v_{a,t}: 年齢層  a の時刻  t におけるワクチン接種者数。
  •  h_t(論文 式(1)): 接種から時間  t が経過した時のワクチンの感染予防効果。
  •  i_{a,t}: 年齢層  a の時刻  t における新規感染者数。
  •  R_{ab,t}: 時刻  t において、一人の年齢層  b から生じる年齢層  a の新規感染者の平均数。実効再生産数。
  •  g_t: 感染から時間  t が経過した時の世代時間の確率密度関数
  •  K_{ab}: 年齢層  b から年齢層  a への次世代行列(の要素)。
  •  p: 調整パラメータ。
  •  h_t(論文 式(3)): 時刻  t における活動度。
  •  d_t: 時刻  t におけるデルタ株による感染性の増強効果。
  •  c_t: 時刻  t における休日による感染性の増強効果。

このうち、 h_t に関しては、不適切なことに論文 式(1)と論文 式 (3) で同じ文字が別の意味に使われています。

(以下の各項の見出しで、本来なら「 l_{a,t}」などと書いてあるべきところが「l_{a,t}」のようになっているのは、見出しに数式表現を使うと目次で期待通りに表示されなかったためです。もし対策をご存じでしたら、https://twitter.com/sarkov28 までお知らせ頂けると助かります。)

(2-02) l_{a,t}: 年齢層 a の時刻 t におけるワクチンによる感染予防効果

西浦論文は、 l_{a,t} で、年齢層  a の時刻  t におけるワクチンによる感染予防効果を組み入れています。このパラメータは、

  • (2-03)  v_{a,t} 年齢層  a の時刻  t におけるワクチン接種者数
  • (2-04)  h_t(論文 式(1)) 接種から時間  t が経過した時のワクチンの感染予防効果

から計算されています。(2-03)(2-04)の検討を踏まえると、 l_{a,t} に論文執筆者の裁量が入る余地は、あってもさほど大きくないのではと思います。

(2-03) v_{a,t}: 年齢層 a の時刻 t におけるワクチン接種者数

 v_{a,t} は、各年齢層毎の実際のワクチン接種数に依っていると説明されているので、ここに論文執筆者の裁量が入る余地はほとんどないと思われます。

(2-04) h_t(論文 式(1)): 接種から時間 t が経過した時のワクチンの感染予防効果

 h_t は接種者本人への感染予防効果を示すパラメータであり、西浦論文はこれを参考文献 53, 54, 19 から得たと説明しています。しかし西浦論文が  h_t をどのようにモデル化したのかの詳細は示されていません。数式もグラフも示されていないので、これはやや不可解です。

上述のように  v_{a,t} と本項  h_t から  l_{a,t} を計算しているのですが、このうち、

ところが、(2-04) の  h_t についてはなにもありません。(西浦論文 参考文献 19 の補足情報 Figure S6 が  h_t のグラフなのかも知れません。)
この説明欠落はやや気になるのですが、一般的に考えれば、 h_t に Figure 1 をフィットさせるための論文執筆者の裁量が入る余地は、あってもさほど大きくないと思われます。なぜなら、このパラメータ  h_t t が、 R_{ab,t} t とは異なる時間軸だからです。前者は接種からの時間であり、後者はカレンダー時刻です。また、 h_t には少なくとも、接種後しばらくは単調増加し、その後は単調減少するとの制約があるからです。

(2-05) i_{a,t}: 年齢層 a の時刻 t における新規感染者数

 i_{a,t} は、実測された新規感染者数に関する情報を感染時点に換算することで得ているようです。 この換算に(確率分布のパラメータのある程度の選択など)多少の裁量はあり得ますが、Figure 1 の形状を調整するような細かな裁量が入ることはないと思われます。

(2-06) R_{ab,t}: 時刻 t において、一人の年齢層の感染者 b から生じる年齢層 a の新規感染者の平均数。実効再生産数

 R_{ab,t} は、これまで述べてきたパラメータや、(2-07)~(2-12) のパラメータから、論文 式(3)で計算されています。

 \displaystyle R_{ab, t} = \left(1 - l_{a, t} - \frac{\sum_{k=1}^{t-1}{i_{a, k}}}{n_a}\right) K_{ab}\ p\ h_t\ d_t\ c_t ...... 論文 式(3)

各パラメータを検討したところ、私は、 R_{ab,t} に論文執筆者の裁量が入る余地は、あってもさほど大きくないと思います。

(2-07) g_t: 感染から時間 t が経過した時の世代時間の確率密度関数

 g_t は、論文 式(2)に出てくる変数です。

 \displaystyle i_{a,t} = \sum_{b=1}^{10}\ \sum_{τ=1}^{t-1}\ R_{ab,t}\ i_{b,t-τ}\ g_{τ} ...... 論文 式(2)

このパラメータで Figure 1 の形状を調整できるとは私には思えません。パラメータ  g_t t が、 R_{ab,t} t とは異なる時間軸だからです。前者は感染からの時間であり、後者はカレンダー時刻です。

(2-08) K_{ab}: 年齢層 b から年齢層 a への次世代行列(の要素)

 K_{ab} について、私はあまり調べていません。 K_{ab} はカレンダー時刻で変化するパラメータではないため、このパラメータで Figure 1 の形状を調整をすることは困難ではないかと思います。

(2-09) p: 調整パラメータ

パラメータ  p は、正に調整のためにあるのですが、これはカレンダー時刻では変化しない、一定の値を取るパラメータです。(一定であることは、西浦論文 補足情報 Table S1 からも分かります。)したがってこのパラメータでカレンダー時刻での変化を調整することは困難だと思われます。
 p については、別稿(2)(3)(4) でも触れています。

(2-10) h_t(論文 式(3)): 時刻 t における活動度

パラメータ  h_t については、別稿(3) で検討しています。他に、別稿(2)(4) でも触れています。

論文 式(3)の  h_t は、論文 式(4)

 h_t = ω^{community}\ α_t^{community} + ω^{house}\ α_t^{house} + ω^{work}\ α_t^{work} ...... 論文 式(4)

で計算されるのですが、このうち3つの  αgoogle mobility データを加工したものです。(別稿で再現しました。図4 と図5。)この加工には、(6つある google mobility の指標のうちどれを使うかなどに、)ある程度の裁量があるかも知れませんが、これは Figure 1 の形状を調整できるようなものではありません。また3つの  ω のうち1つの値は定義により決まっていて、残り2つの値は尤度関数(論文 式(8))を用いて最尤推定されます。したがってこの  h_t に裁量が入る余地は一般的にはないと考えられます。

(2-11) d_t: 時刻 t におけるデルタ株による感染性の増強効果

パラメータ  d_t は、 d_t = r\ u_t だと論文に説明されています。
このうち  r は、論文 式(8)を用いて最尤推定されるパラメータなので、ここに裁量が入る余地は一般的にはないと考えられます。
 u_t は市中におけるデルタ株の比率を示す指標です。西浦論文における  u_t の説明は細部が不明ですが、西浦論文 補足情報 Figure S5 は、実測の「 \circ」に沿うようにロジスティック曲線をフィットさせた説明されています。
図5.2 西浦論文 補足情報 Figure S5
図5.2 西浦論文 補足情報 Figure S5(クリックすると拡大します)

このフィットには図にあるように多少ずれてますが、実測に縛られているので、ここでの裁量はあっても小さいと思われます。
論文によると、Figure S5 を 1~1.5 になるよう調整して  u_t とし、さらにパラメータ  r を掛算して、 d_t を得ているようです。この処理ならば、パラメータ  d_t に Figure 1 の形状を調整する裁量が入る余地があるようには見えません。

なお、パラメータ  r 付近に無駄なパラメータがあるという件を 別稿(2) で、関連を別稿 (3)(4) で検討しています。

(2-12) c_t: 時刻 t における休日による感染性の増強効果

西浦論文のパラメータ  c_t の説明は分かりにくいのですが、このパラメータは以下の値を取ります。

 c_t = e\ \ (if\ \  t = 対象日)
 \ \ \ = 1\ \  (else)

このうちパラメータ  e は論文 式(8)を用いて最尤推定されます。したがってパラメータ  c_t に裁量が入る余地はないと思われます。

(3) 結論

西浦論文 Figure 1 を構成している主なパラメータについて、特に論文執筆者が Figure 1 の形状を調整するような裁量があるかを検討しました。各パラメータの裁量の余地はないか、あっても小さいと思われます。

検討は項目ごとに行ったので、複数のパラメータを組み合わせによる、Figure 1 の形状の調整については検討していません。しかし、一般論になりますが、大きな裁量のない複数のパラメータを組み合わせて、Figure 1 の形状の調整を行うことは、相当に困難だと思われます。

(99)更新履歴

  • 2024-01-23
    公開。