報告・討論(3) コロナ禍における休校が家族に及ぼす影響

フォーラム名
第120回労働政策フォーラム「ワーク・ライフ・バランス研究の新局面─データ活用基盤の整備に向けて─」(2022年3月3日)
報告
横山 泉
一橋大学大学院 経済学研究科 准教授
討論
中村 さやか
名古屋大学大学院 経済学研究科 准教授

報告

本日報告する内容は、一橋大学の高久玲音准教授と私の共著で Journal of Public Economics に掲載された論文に基づいています。この研究では、2020年3月の休校の影響を分析しました。まず研究の背景を説明します。

シート1のグラフで紫色のマルが示すように、全国の学校で休校が始まった2020年3月2日に、「離婚」という単語のGoogleでの検索数が急増しました。これは、休校が婚姻関係に影響した可能性を示唆するとも取れるエビデンスだと考え、これがひとつのきっかけとなり、この研究に着手しました。

シート1 BACKGROUND
• To control the spread of COVID COVID-19, the Japanese government suddenly closed schools on March 2 , 2020 2020.
• A sharp increase in the number of Google searches for the word “divorce” on March 2.
“Did school closure cause substantial confusion in families?”

もしこの仮説が本当なら、つまり、休校が婚姻関係に影響していたならば、婚姻関係は当事者どうしはもちろん、子どもにも様々な影響を与える可能性があるため、家族全体の様々な変数に関して包括的に休校の影響をみることが必要だと考えました。ですので、私たちの論文のリサーチクエスチョンは「2020年3月の休校は、子どもやその家族にどのような影響を及ぼしたか」になります。

出生の時期がほぼ同じだが休校の扱いが異なる事実に着眼

当時、小学校は全国的に休校となりましたが、保育園や幼稚園では政府による休園の強制はなく、そこに大きな扱いの差がありました。当時の小学1年生で一番若い3月生まれの子と、保育園・幼稚園の年長で一番月齢が大きい4月生まれの子では、生まれたタイミングは1カ月の差しかありません。しかし、休校に対する政府からの扱いが全く異なるという事実にわれわれは着眼しました。

生まれたタイミングにほぼ差がないということは、成長段階に関しても似たような状況にあると考えられます。また、新型コロナの拡大によって受ける脅威や、3密を避けるといったコロナ対策から受ける影響は、酷似していると考えられます。

一方で、生まれたタイミングがほぼ同じにも関わらず、3月時点での休校・休園の状態は両グループで全く異なります。つまり、この両グループを比較すると休校の状態以外は同じで、3月時点の休校の状態だけが異なります。そのため、直面する休校の状態の違いのみが、どのようにアウトカムに影響するかを抽出してみることができる、というアイデアに基づき、われわれは3月の休校の効果を推定しています。(4月には3月の休校当時、保育園の年長さんだった子も小学生になり休校に直面するため、両グループに差がなくなります。したがって、両者に差が生じていた3月のみの休校の効果を測定したことになります。)

ロックダウンと休校の効果を分離できない他国と異なる政策が研究のポイント

休校の効果について分析した先行研究をみると、例えばアメリカの有名な研究で、幼児虐待への効果を分析したものがあります。この論文では、休校の結果として虐待が見つかりづらくなった、過小報告につながったという結果が得られています。その他の研究では、ロックダウンが肥満児の生活様式やDV(ドメスティック・バイオレンス)に与えた影響など、何か1つのアウトカムに着目した研究が大半です。論文執筆当時は子どもと親の双方への影響を包括的にみた研究は、ほとんど存在しない状況でした。一方で、ロックダウンがDVに与えた影響を調べた研究は、比較的多くありました。

しかし実際には、他国ではロックダウンと休校は同時に実施されているケースばかりですので、他の新型コロナ対策の政策の効果から切り離して、休校の効果のみを識別することは非常に困難です。一方で日本は、ロックダウンのような非常に強い制約が休校時に発生したわけではありません。

そのため、他国の研究が抱えるような問題、つまりロックダウンと休校の効果を分離できないという問題が他国ではあるのに対して、日本を対象としたわれわれの研究ではそのような問題に直面していないというのがポイントです。加えて、政府の休校要請が小学校以上であったため、保育園・幼稚園は対象外で、休校に関する状況が全く異なる2つのグループの比較が可能となっています。

休校の効果の推定について、このように日本が偶然に持った強みを生かして、われわれは日本のデータで分析しました。研究の内容に入る前に、この研究の貢献を3点紹介します。

まず1点目は、日本の当時の新型コロナ対策の特徴などをうまく利用して、回帰不連続デザイン(RDD)によって純粋な休校の効果の推定に成功していることです。2点目は、調査票を独自に作成して、大規模なインターネット調査を被験者の記憶が薄れてしまう前の、かなり早い時期に実施したことです。これにより、既存のデータでは把握できないような、様々なユニークな事項を調査することができました。そして3点目は、政策的示唆につながる頑健で重要な発見があったことです。

参加者の同意のうえ、センシティブな内容も質問

調査はインターネット調査会社を用いて、2020年7月から8月に実施しました。対象は、休校が義務化されたかどうかの閾値である小学校入学前後の3学年、つまり4歳から10歳の長子を持ち、彼らと同居している既婚女性としました。

まず、モニターに登録している4万4,218人の女性に、調査への参加を促すメールを送りました。条件を満たし、かつ反応があった人は約半分です。本調査では夫婦間の関係性やDVといった、センシティブな内容も質問しています。そのため本調査へ進む前に、調査への参加の同意を確認する質問項目を設けました。これに同意した人が1万7,860人で、さらに約40問の設問にすべて回答した人が1万5,836人です。これが最終的なサンプルです。

研究の主なアウトカムは、子どもと親の両方を対象としています。子どもについては、「保育園に通う子どもと小学校に通う子どもを比べても、かなり違うのではないか」と誰もが思うでしょう。その点には次のように非常に気を遣いました。

具体的には、「コロナ禍に伴う変化として、該当するものを選んでください」という質問項目では、休校前後の「変化」に着目したものとしました。つまり水準の差はコントロール済みのDifferenced RDDとなっています。例えば「体重はコロナ前よりコロナ後のほうが増えましたか」という聞き方です。こうすることで、早生まれの差や、ここ1年間の過ごし方の差などを気にする必要はなくなり、かつ親の特徴や社会的地位の閾値周りでの差もコントロール済みとなります。体重以外の質問についても、同様に「変化」を尋ねました。

両親の間の関係性に関しては、アメリカの先行研究をみると、DVを対象としたものが多くあります。それとの比較をするため、過去の研究で使用されている典型的な指標にプラスして、結婚満足度や、複数の質問をもとにスコア化した離婚の危機度や結婚の質に関する指標を用いました。

代表性のある別の調査と比較することで、サンプルの偏りの有無を確認

シート2は使用したサンプルの記述統計です。インターネット調査では、サンプルの代表性を確保できることが、非常に重要な問題となってきます。これを確認するために、「まちと家族の健康調査(J-SHINE)」という、代表性があり、かつDVに関する設問を含むアンケート調査とわれわれの調査のサンプルを比較しました。これにより、われわれの調査が偏ったサンプルを抽出しているわけではないという、外的な正当性を強調しています。

シート2 DESCRIPTIVE STATISTICS
• To check the representativeness of the respondents in our survey, we utilized J-SHINE that asks about the incidence of DVs and also includes other basic variables common to our covariates.
• We do not see any large difference between our data and andJ-SHINE in most of the mean values of basic covariates as well as the incidence of physical DVs.
This supports that our survey did not pick up a very specific population in terms of marital quality and family environment related to children.

シート3左図は、横軸が調査時点の子どもの月齢を、縦軸が学校や保育園などが利用可能な割合を示しています。調査時点の月齢89カ月は、2020年の調査時点である8月時点で未就学児と小学生を分ける閾値となっています。この図ではこの月齢89カ月を境界として、学校や保育園などが利用可能な割合と、そうでない割合を示しています。89カ月より前は利用可能が8割ほどですが、月齢が89カ月、つまり小学生になると利用不可能が100%になっています。

シート3 IMPACT OF SCHOOL CLOSURE ON “NON-SCHOOLING”
• The cutoff value 89 corresponds to the age-in-months (evaluated in August 2020) for children to move from preschool to elementary school.
• We utilize the increase in the probability of ‘‘non-schooling” at the threshold to identify the effects of schooling.

右図は実際に起こったことを示しています。この図では、学校や保育園などに行かなかった確率を月齢別に表しています、89カ月の閾値の部分で、学校に行かない確率が62.3%ポイントも増えています。この図はRDDを当てはめたもので、操作変数法の一段階目にあたります。学校や保育園などに行かなかった確率が、閾値の前後で0%から100%に変化しているならSharp RDDの概念に該当します。しかし実際には、保育園や幼稚園でも、休園や登園自粛要請などもあり、未就学児でも登園しなかった人が4割程度いました。そのため、これはSharp RDDではなくFuzzy RDDの構造となっています。

スクリーニング調査の情報を利用して、観測できない属性の影響も確認

RDDでは、観測できる属性と観測できない性質の両方が、閾値の前後で連続性があることが仮定として大変重要になってきます。観測できる属性では、子どもの数、子どもの性別、学歴、祖父母のサポートの有無、2020年2月時点で正規労働者だったか、働いてなかったか、これらの変数について連続性を確認しました。いずれも統計的に有意な断層はありませんでした。つまり観測できる属性に関しては、完全に連続性の仮定が満たされています。

一方、観測できない性質は、どのように検証すればよいでしょうか。われわれが行ったのは、スクリーニング調査でDrop outした割合の閾値前後での比較です。先ほど説明したように、アンケート調査にはセンシティブな質問項目が含まれており、それを理解した上で本調査に進むかどうかを、スクリーニング調査の段階で尋ねました。そして、本調査に進まなかった確率が、月齢89カ月の前後で連続かどうかをチェックしました。

例えば考えられる1つのシナリオとして、3月に休校を経験して少し鬱のような状態になった結果、「こんなアンケート調査に参加している暇もないし、心の余裕もない。センシティブな事は聞かれたくない」と思う人がいたならば、89カ月以上でサンプルの脱落が多くなり、結果として休校の効果を過小評価するようなバイアスが発生します。われわれの研究では、そのようなことが発生していないことも確認したうえで、研究を進めました。

休校で子どもの体重が増加

シート4が分析結果です。左図はメインの分析結果で、横軸は月齢を、縦軸は子どもの体重が増えたと回答した母親の割合を示しています。

シート4 EMPIRICAL RESULTS RELATED TO CHILDREN
AGAIN:「コロナ禍に伴う変化として該当するものをお選びください。」という質問項目。休校前後の変化に注目。プラス、前の年の平時のことも聞き、断層はないことを確認。
⇒レベルの差はコントロール済み(Differenced RDD)
⇒こうすることで、早生まれの差や、ここ1年間の過ごし方、親の生み分けに関わる社会的地位の閾値周りでの差なども関係なくなる。(注:そもそもレベルでもObservable, Unobservableの両方に差はなかったことに注意。)

この図をみると89カ月の前後で断層があり、89カ月以上を境に子どもの体重が増えたと解答した母親の割合はかなり上昇しています。右図は同様に、子どもの教育方針に関して悩むことが増えたかどうかをみたもので、こちらも少し断層があります。その他にも、子どもとの関係性について悩むことが増えた、子どもだけで留守番させる時間が長くなった、といった項目についても89カ月の前後で断層があり、統計的に有意な結果が得られました。

これらの分析結果のなかでも、体重の増加が一番はっきりした結果となっています。注意していただきたいのは、ここでは「水準」ではなく「変化」を尋ねていることです。つまり、水準の差はコントロール済みです。ですので、そこはピュアな効果が得られていると考えています。

休校によるDVの増加は確認されず

一方で、もともとの研究のきっかけとなったエビデンスとそれに基づく仮説、つまり「休校で両親の婚姻関係が悪くなったのではないか」という仮説に関しては、DVに関する様々な指標を足しあわせたスコアや主観的な結婚満足度、離婚リスクや結婚の質を示す指標に関して分析しましたが、89カ月の前後での顕著な断層は見られませんでした。心配していた婚姻関係への影響については、統計的に有意な結果は得られませんでした。

この分析結果について、「調査時点の8月では、すでに3月の休校の効果が弱まっていたのでは」と思われるかもしれません。しかし、過去を振り返って3月時点のことを想起してもらい、8月と比較して3月の状況がどうだったかについても尋ねましたが、3月時点でもやはり同じようにDV等について統計的に有意な結果は特に得られませんでした。

サンプルを属性によって分けた分析では、例えば子どもの祖父母からのサポートを得られない場合や、一人っ子の場合に体重増加がより顕著になるという結果も得られました。この結果は腑に落ちるものだと思います。また、感染率の高い都道府県に住む母親で、特に不安が高まっていることも分かりました。これについては、ストレスが高まって不安障害が発生している可能性もありますし、こちらも納得のいく結果かと思います。

学校はアカデミックな機能だけでなく、学業以外の効果もある

まとめますと、分析から3つのことがわかりました。1つ目は、「子どもの体重が増えた」と回答する母親が、休校によって14.4~15.4%ポイント増えたことです。2つ目は、「子どもをどうやって育てていけばよいか心配し始めた」と回答した母親も、休校によって増えたことです。最後の3つ目は、DVや結婚の質といった両親の婚姻関係に関するアウトカムでは、休校の影響について統計的に有意な結果は得られませんでした。

研究からのインプリケーションは、学校は単にアカデミックな機能だけを果たしているのではなく、通学や給食などで子どもの健康にも寄与しており、学業以外の効果もあるということです。それを踏まえると、オンラインでの教育は、対面での教育の完全な代替物にはなり得ないでしょう。また、教育方針への不安が広がったという結果から、適切なオンライン教育のあり方や、どうすれば家でより健康的に過ごせるのかというガイドラインも提示する必要があると思います。


討論

横山氏の報告に対するコメント

重要なリサーチクエスチョンから興味深い結果を提示

中村 最初に、私が考えるこの論文の貢献について話します。まず、リサーチクエスチョンが重要なものです。2020年3月の小学校の全国一斉休校が、子どもと両親にどのような影響を与えたのかを分析しています。分析には、この休校の数カ月後に実施されたアンケート調査による大規模な個票データを用い、出生時期による月齢のわずかな差で就学と未就学に分かれたことを利用して、回帰不連続デザイン(RDD)で因果的影響を推定しています。結果も非常に興味深いものです。休校を経験することで母親が子どもの体重増加を感じた、子育てや親子関係について悩むことが増えた、というものです。

園児と小1生の比較であり、コロナの影響が同等でない可能性

横山先生にコメントのスライドを事前に見ていただいたので、すでに発表のなかで横山先生にリプライをしてもらった形ですが、それを踏まえてもやはり、コメントの内容は基本的にはそれほど変化していません。4点コメントします。シートが1つ目のコメントです。閾値前後では、一斉休校の影響を受けたグループはコロナ禍が始まったときに小学1年生、受けなかったグループは未就学児です。未就学児と小学校1年生を比較していますので、コロナの影響が同じではなかった可能性があります。一斉休校の影響を受けたグループは、小学校に通い、徐々に要求される水準が高くなる、あるいは小学校に入り体重が増えてきたところで新型コロナが流行し、一斉休校の影響を受けなかった未就学児とは一斉休校以外にも新型コロナの影響が異なっていた可能性があります。

シート 閾値前後の調査前の状況比較
2020年3月の月齢の閾値前後で、調査前の状況に休校期間が1か月違う以外にも大きな違いがある
月齢≦88:2020年3月に園児、4月に小学校入学
月齢≧89:2020年3月に小1、4月から小2
3月休校を経験した月齢89+の子は経験しなかった月齢88-の子より小学校入学からの期間が1年間長い
→小学生になって長いと体重や母親の子育ての悩みも増える?

早生まれとそうでない子では影響が異なるのではないか

2つ目は、生まれ月の影響です。閾値前後で、一斉休校の影響を受けたグループは早生まれ、受けなかったグループは遅生まれです。こちらもすでにリプライをもらっていますが、やはり早生まれが非常に不利であることは、日本のデータからも確認されています。テストの成績が悪いとか、教育年数が短くなるといったものです。また国際的には、早生まれがいじめられやすいことも指摘されています。そうした不利な状況にあった子どもと、そうでない子どもでは、新型コロナの影響がやはり異なっていたのではないかとも考えました。

それと、ややマイナーな点ですが、早生まれは0歳での保育所への入所が難しいです。なぜかというと、保育所が不足している場合、4月に入園しなければ入園が困難なことが多いですが、0歳が4月に入園するためには4月時点で生後2カ月、できれば6カ月以上でなければいけません。そうすると、早生まれは保育園に入ることができず、母親は職場復帰が難しくなります。

親が出生時期を選択する可能性がある

3つ目は、親による出生時期の選択です。新型コロナによる休校は予見不可能ですので、新型コロナの休校を見越して出生時期を選ぶことは、当然不可能です。しかし、さきほど説明した早生まれの不利を考慮して、親が子づくりのタイミングや出生時期を選択する可能性はあります。帝王切開や陣痛促進剤のタイミングを遅らせることで、また子宮収縮抑制剤の使用や母親が安静にすることで、出生のタイミングを遅らせることが多少は可能です。

ある研究によれば、日本では4月1日までの週に出産が減少し、4月2日からの週に増加しており、また3月生まれの子どもの両親、特に父親の社会経済的地位が低いことが指摘されています。それを踏まえると、アンケート調査で新型コロナの影響を尋ねて早生まれと遅生まれを比較すると、両親の社会経済的地位による差は当然大きいと思いますので、比較対象として少し問題があると思いました。

そもそも、この研究ではビフォー・アフターの厳密な比較はできておらず、主観的な新型コロナの影響を聞いており、厳密な差の差法ではありません。休校を経験した子どもと経験していない子どもでベースラインに非常に大きな差があり、効果の異質性が存在するならば、仮に母親の変化についての質問でビフォー・アフターの差が正確に計測されていたとしても、やはりこれらの批判が成り立つと思います。また、純粋にビフォー・アフターの比較ができていたのか、つまり、差の差法を、変化を尋ねる質問で代替できるのかという問題もあります。

インターネットのモニターのバイアスが起きている可能性

最後に、データについて議論したいと思います。論文からは回収率が分からないですが、それほど高くないかもしれません。また、インターネットのモニター調査を使用したということで、やはりバイアスが起きている可能性があります。

このアンケート調査では休校後にデータを収集しており、「変化」について質問しています。ビフォー・アフターの状況を、その時々で実際に観察しているわけではありません。やむを得ないことですが、やはり公的機関が継続的に代表性の高い大規模データを収集して、それを利用できることが、研究上は非常にメリットがあるでしょう。

厚生労働省「国民生活基礎調査」や「国民健康栄養調査」は2020年調査が中止になりました。「非常時に調査が中止されなかったらよかったのに」と思います。やむを得ない事情があったのでしょうが、非常時も調査を中止にしない仕組み作りが必要です。

この研究のデータはクロスセクションデータです。RDDはクロスセクションデータでも行えますが、やはり前提条件が非常に厳しい手法ですので、それらの前提条件を完全に満たすことはなかなか難しいと思います。パネルデータやリピーテッド・クロスセクションデータでは差の差法による分析が可能ですので、そういったデータでは分析可能性が大きく向上すると思います。

中村氏のコメントへのリプライ

早生まれの生み分けから生じる閾値前後での有意な断層はないという判断

横山 中村先生、コメントをありがとうございました。まず、分析手法としてDifferenced RDDを使ったことについてです。これは、投稿した論文を査読したレフェリーとも、厳密にやり取りをしました。レフェリーとの議論の結果、早生まれの生み分けから生じる閾値前後での有意な断層はないという判断となりました。

その理由を、報告時の最後のほうのスライドを引用して説明させていただきます。早生まれの影響は、もしそれがあるならば、89カ月のマイナス36カ月、マイナス24カ月、マイナス12カ月でも断層があるはずです。しかし、そのような断層は見つかりませんでした。アンケートでは平時の1年前のことについても尋ねましたが、平時の図でも断層はありませんでした。このように、われわれとしてはできる範囲の検証は行ったつもりです。

中村先生からご指摘を受けた早生まれの影響を真摯に受け止めて、関数形を仮定するパラメトリックな形式にして、モデルに生まれ月のダミー変数を入れることも可能です。研究の過程でそうした議論もありました。しかしRDDを利用する最近の研究では、局所線形回帰(Local Linear Regression)による分析の一択であり、パラメトリックな分析はしないようにとレフェリーから指示を受けました。われわれもこれに同意します。平時の1年前のグラフや、マイナス36カ月、マイナス24カ月、マイナス12カ月で断層がみられないことが全てだと私は認識しています。

また、ここではDifferenced RDDが用いられているので、万が一、アウトカムの「水準」に影響があったとしても、コロナの前後で一階の階差を取った場合、その水準の差は消失することにもご留意されたいと思います。

「水準」において閾値の前後に差があるのか、それが一階の差分(first difference)をとれば消失するのか、はたまた、一階の差分を取っても消えない断層なのかは、本当にこと細かく話し合ったつもりで、それに応じて論文の結果の強調の仕方も、書き方も誤解のないように書いているつもりです。

コロナの前後でも取り除けない変化としては、例えばスクリーンメディア等への依存は、小学生のほうがSwitchなどのゲーム機を持っている人も多く、そのような場合はコロナ禍の前後でも階差をとったとしても、変化幅さえ閾値の前後で異なる可能性がありますので、これはレフェリーに掲載を却下されました。ですので、出版されました論文で掲載されている結果は、完全に連続性の仮定を満たしているものだけです。

早生まれ遅生まれの間に存在する両親の社会的地位についてもコメントをいただきました。早生まれ遅生まれ自体に断層がないことは、すでに前述のとおりです。さらにわれわれの研究では、アウトカムは主に子どもの体重です。この点は理解していただきたいと思います。一般的に考えて、未就学児と小学生の間で大きな違いがあっても、両親に関してはそれほど大きな違いがないというのが、私たち著者はもちろん、いろいろな研究者やレフェリーの見解でした。さらに、ご指摘の可能性も考慮して、後半のサブサンプル分析でも両親の学歴の違いにより、推定値が異なるかも検証していますが、特に異なる結果は得られませんでした。

子どものアウトカムで強い結果を確認

今回の研究で強い結果が見つかったのは、子どものアウトカムです。論文ではそこを最も強調しています。ほかのアウトカムは、論文の概要に書くほど強い結果ではないものとして扱いました。頂いたコメントへのリプライは以上です。本当にありがとうございました。


プロフィール

横山 泉(よこやま・いずみ)

一橋大学大学院 経済学研究科 准教授

2005年3月一橋大学経済学部卒、2006年3月一橋大学経済学研究科修士課程修了(5年一貫プログラム一期生)、2013年ミシガン大学Ph.D. (Economics) 取得。2013年に一橋大学経済学研究科から講師として採用され、2018年より一橋大学経済学研究科准教授に昇進。専門は労働経済学と応用計量経済学。代表作に、"What the COVID-19 School Closure Left in Its Wake: Evidence from a Regression Discontinuity Analysis in Japan" (with Reo Takaku), 2021, Journal of Public Economics, Volume 195, 104364など。2021年より現在まで、岸田政権の全世代型社会保障構築会議での有識者も務めている。

中村 さやか(なかむら・さやか)

名古屋大学大学院 経済学研究科 准教授(開催当時) 現在は上智大学経済学部教授、日本学術会議 連携会員

1998年国際基督教大学教養学部社会科学科卒、2000年東京大学大学院経済学研究科修士課程修了、2006年ノースウェスタン大学Ph.D. (Economics) 取得。2006年ライス大学ベイカー研究所シド・リチャードソン医療経済学研究員、2008年横浜市立大学国際総合科学部・国際マネジメント研究科准教授、2011年より名古屋大学大学院 経済学研究科准教授、2022年4月から上智大学経済学部教授。応用ミクロ計量経済学および医療経済学専攻。

GET Adobe Acrobat Reader新しいウィンドウ PDF形式のファイルをご覧になるためにはAdobe Acrobat Readerが必要です。バナーのリンク先から最新版をダウンロードしてご利用ください(無償)。