独立行政法人 国立健康・栄養研究所
SASによる大量データの複合的な集計・分析で 日本人の栄養摂取状況を明らかに
厚生労働省の食事摂取基準の策定も支援
独立行政法人国立健康・栄養研究所(以下、国立健康・栄養研究所)の栄養疫学研究部は、厚生労働省が実施する国民健康・栄養調査によって得られるデータを精査・集計・分析するツールにSASを利用している。同研究部が10年以上にわたってSASを使い続けているのは、大量で複雑なデータを高速に処理できるパフォーマンスや、データ品質の確保、集計・分析結果に対する信頼性の高さを評価しているためだ。同研究部がSASを使ってとりまとめた調査結果は、21世紀における国民健康づくり運動である「健康日本21( 第二次)」の目標値の策定や、厚生労働省が2014年3月に公表した日本人の食事摂取基準の妥当性を裏付ける根拠など、国民の健康増進の推進を図るための基礎資料として広く活用されている。
実効的な公共政策の策定を支援
国立健康・栄養研究所は、公衆衛生の向上・増進に寄与することを目的に設置された組織だ。国民の健康づくり、生活習慣病の予防、食の安全・安心、QOL(quality of life)の向上、well-beingの確保がミッションであり、食生活と栄養、食品、身体活動・運動に関連するさまざまな調査・研究を行う。厚生労働省をはじめ、内閣府、消費者庁などが主導する公共政策をサポートするための情報提供も主な業務の1つだ。
同機関において、疫学的手法を用いた栄養学研究で食生活・栄養の健康への影響を明らかにしているのが栄養疫学研究部だ。栄養疫学研究部 部長 医学博士 瀧本 秀美氏は、「われわれの研究成果は、たとえば、日本人が健康な生活を送るためにどのような栄養素を、どのくらい摂取すればよいかという基準値を定めるために使われています」と語る。
同研究部は、厚生労働省が毎年11月に実施する「国民健康・栄養調査」に深く関与している。健康増進法に基づいて実施されるこの調査の目的は、国民の食生活状況や身体状況、飲酒、喫煙、運動習慣などを明らかにし、実効的な健康増進対策や生活習慣病対策を立案・実行するための基礎情報を得ること。同研究部は調査結果をとりまとめた報告書を厚生労働省に提出するが、その際のデータ集計・分析に使用しているのがSASだ。
データ品質を高め集計する
国民健康・栄養調査は、栄養摂取状況、生活習慣、および身体状況の3つの調査で構成される。調査対象は、全国の約3500世帯、約9000人。栄養摂取状況や生活習慣の調査については、全国約300の保健所のスタッフが調査対象者に趣旨を説明し、栄養摂取状況調査票と生活習慣調査票を配布。調査対象者への聞き取り調査も行い、詳細かつ高精度な調査票データとして記録する。さらに、医師や保健師が身体状況の調査項目を埋めるための計測や問診を行う。
その後、各保健所のスタッフは栄養摂取状況調査票の内容を専用システムに入力する。このシステムは料理名/食品名/使用量/廃棄量/世帯員のだれがどれだけ食べたかという案分など、食物摂取状況を細かく入力できる仕様だ。入力完了後、各調査員は集計・分析対象となるデータをCD-Rに書き込むなどして、同研究部に提出する。
データを受け取った同研究部は、集計・分析対象のデータと調査票の情報をつきあわせ、データに不備がないことを手作業で確認する。その後、身体状況調査票や生活習慣調査票のデータと共にSASを利用したデータの精査を行い、異常値があれば再度手作業で照合する。こうして精査された高品質なデータが、SASの集計対象になる。
栄養疫学研究部 国民健康・栄養調査研究室 中出 麻紀子氏は、「2012年度の調査は数年に一度の大がかりなもので、調査対象者数が例年の約4倍に増えました。データ入力に慣れていない保健所スタッフの協力も得たため、食品名は入力されていても摂取量が漏れているなどのデータの不備が散見されました。入力漏れや、事前に設定したしきい値を超える数値入力があれば検知してくれるなど、過去に定義したロジックを再利用できるSASが大いに役立ちました」と話す。
計算スピードが速く、集計結果の信頼度も高い
栄養疫学研究部では、SASプログラムをベースに必要なデータ集計・分析を行っている。いまや、栄養摂取状況を把握するためのデータ集計においてSASは欠かせない存在だ。料理だけを取っても、調査対象者にはそれぞれ、朝食、昼食、夕食、間食別に食べた料理、食材、摂取量、世帯内の案分などのデータがひもづく。さらに、食材は栄養素へと展開しなければならない。このため、集計・分析ツールには大量で複雑なデータを柔軟かつ高速に処理できることが求められるのだ。
瀧本氏は、「1日に摂取した栄養素を性別や年齢階層別で調べる際には、膨大なデータを処理しなければいけません。SASは、調査対象者が、穀類、いも類、豆類、野菜類、きのこ類、藻類、魚介類、肉類など、どのカテゴリの食品由来でどれだけの栄養素を摂取したかという数値を算出する複雑なデータ分析のニーズにもこたえてくれます」と語る。
SASを利用することで、突発的なデータ集計依頼にも対応できる。最近では、新たに作成したSASプログラムをベースに、日本人の体格(BMI:body mass index)と栄養素摂取の実態を示すデータ集計結果をとりまとめた。この結果は、厚生労働省が2014年3月に公表した日本人の食事摂取基準(2015年版)の妥当性を裏付ける根拠として使われている。
栄養疫学研究部のスタッフは、独自に研究テーマを決め、各々モデルを作って分析するが、分析に使用するデータをすばやく準備できるのもSASの魅力だ。瀧本氏は、「今後は、地域別の栄養摂取状況を明らかにすることを含め、国や行政が新たな施策を計画・実行する際の有用な情報を得るための研究を進めていきます」と話している。
課題
国民健康・栄養調査の結果をとりまとめた報告書の作成に、複雑な大量データの処理を迅速かつ正確に実行できるツールが必要だった
ソリューション
高品質なデータだけを集計対象にするプロセスを構築し、大量データの集計・分析作業をすばやく正確に実施できる
利点
集計・分析に使用するデータをすばやく準備し、突発的なデータ集計依頼にも迅速に対応している。国や行政が新たな施策を計画・実行する際の有用な情報を得る研究にも取り組みやすい