昨年から始まった機能性表示食品制度。今回、たまたま新聞の全紙広告が目に付いた「グリナ」を題材に考えてみる。
機能性表示食品はその届出情報が「一般向け公開情報」、「有識者向け公開情報(基本情報、機能性情報、安全性情報から構成)」として公開されている。機能性表示食品は、特定保健用食品(トクホ)のように個別製品について消費者庁の許可を得て保健の効果を表示できるのではなく、企業の責任で科学的根拠を基に食品の機能を表示できる食品である。届出情報がウェブ公開されているのは、消費者が食品の機能性や安全性の科学的根拠を判断できるようにするためである。つまりは消費者の判断にゲタをあずけた規制緩和である。許認可のあるトクホでさえその効果の科学的根拠に疑問が呈されている例があるのに、届出で販売できる機能性表示食品の科学的根拠のレベルが同等以上とは想像し難い。
「一般向け公開情報」には“安全性に関する基本情報”と“機能性に関する基本情報”、の項目がある。「グリナ」は生体成分なので、今回は後者に的を絞って考える。“機能性に関する基本情報”には(1)機能性の評価方法、(2)当該製品の機能性に関する届出者の評価がある。(1)は以下の3つのいずれで評価したかを選ぶ形式になっている。
a. 最終製品を用いた臨床試験(人を対象とした試験)により、機能性を評価している。
b. 最終製品に関する研究レビュー(一定のルールに基づいた文献調査(システマティックレビュー))で、機能性を評価している。
c. 最終製品ではなく、機能性関与成分に関する研究)レビューで、機能性を評価している。
機能性関与成分の研究レビューでその成分がある機能を有すると結論されれば「c」に該当する。しかし、最終製品そのものについての試験の結果ではないので、科学的根拠のレベル(エビデンスレベル)はaより低い(a>c)。一方、ある臨床試験で機能性が証明されれば、「a」に該当するが、被験者などの試験条件が異なる別の臨床試験では機能性が疑われたりする結果が出ることもあり得る。その意味で、最終製品について、複数の臨床試験結果をレビューして評価する「b」はさらにエビデンスレベルが高い(b>a)。つまりエビデンスレベルはb>a>cなのだが、消費者庁の一般向けのパンフ(http://www.caa.go.jp/foods/pdf/150810_1.pdf)にはどこにもこのような評価の指針が示されていない。届出された100件の機能性表示食品をみると、「c機能性関与成分の研究レビュー」が多く、「a最終製品の臨床試験」を根拠とするものは17件と少なく、「b最終製品の研究レビュー」は無い。
「グリナ」は「最終製品の臨床試験」を根拠とする17件の1つだ。ただし臨床試験も試験の様式(研究デザイン)にいろいろあり、それによって結果の証明力にも差がある。「グリナ」の「有識者向け公開情報」の機能性情報にある以下論文を読んでみた。ただし論文2はタイトルからもわかるようにグリシンの効果というよりも、日中動作への影響(副作用)を調べたものなのでここでは述べない。
1. Yamadera W et al. Glycine ingestion improves subjective sleep quality in human volunteers, correlating with polysomnographic changes. Sleep and Biological Rhythms 2007;5:126-131
2. Bannai M et al. The effects of glycine on subjective daytime performance in partially sleep-restricted healthy volunteers. Front Neurol 2012 Apr 18;3:61
論文1の概要
臨床試験は、11名(女8,男3)健康成人による単盲検クロスオーバー試験。被験者は試験前にPittsburgh Sleep Index formへの記入により継続的に不満足な睡眠を体験していることを確認。被験者は試験日に病院に入り就寝1時間以内にグリシン3gあるいはプラセボを服用。就寝中は睡眠ポリグラフ計で測定。翌朝、St.Mary’s Hospital Sleep Questionnaire(SMH)により主観的な睡眠の質を評価。また、8時、10時、12時、21時、23時に眠気、認知機能の検査を受ける(21時以降は病院内)。その後、1晩目と同様の試験(2晩目)。1週間間を空けて次の試験を実施。
SMHによる評価の結果、グリシン服用群はプラセボに対して「Q11昨晩の睡眠はどの程度満足か」のスコアが有意に高く(m=3.5 vs 2.7)、「Q13昨晩寝付くのがどの程度難しかったか」のスコアが有意に低い(1.2 vs 2.1)、「Q14昨晩寝付くまでの時間は」が有意に短い(13 vs 38 min)、「ベッドに入って居る時間に対する睡眠時間の割合」が有意に高い(93 vs 85%)。
睡眠ポリグラフでの測定の結果、グリシン群はプラセボに対して睡眠開始までの潜在時間(24 vs 13min)、および、より深いノンレム睡眠の徐波睡眠出現までの潜在時間(59 vs 34min)が有意に減少した。ただしレム睡眠には差がなかった。ポリグラフにより測定したレム睡眠、ノンレム睡眠、睡眠の深さのステージの時間分布には両群で差は無く、従って睡眠構造は変わらない。
一方、Stanford Sleepiness Scale (SSS)により評価した日中の眠気はグリシン群で少ない傾向にあるが有意差は無い。visual analog scale(VAS)での評価でも同様の傾向だが、10時ではグリシン群が有意に眠気を減少させた。日中の記憶の認知機能に及ぼす影響は正答率で12時にグリシン群が有意に高いが、全体としては両群に差は無い。反応時間にも差は無かった。
<論文の批判的吟味>
1.有識者向け公開情報には「機能性の科学的根拠に関する点検表」があり、「グリナ」が採用した「最終製品の臨床試験」では以下の項目がチェックポイントとして挙げられている。
①研究計画の事前登録がUMINあるいはWHOの臨床試験登録システムに登録しているか。
②臨床試験の実施方法が「特定保健用食品の表示許可等について」の試験方法に準拠しているか、それとも科学的合理性が担保された別の試験方法を用いているのか。
③臨床試験の結果が査読付き論文として公表されている論文が添付されているか。
④研究計画は事前に倫理審査委員会の承認を受け、その委員会の名称が論文中に記載されているか。記載が無い場合、別紙様式で補足説明しているか。
⑤掲載雑誌は著者との間に利益相反による問題がないか。
少し解説すると、①の臨床試験の事前登録は、都合の良い結果が出た場合だけ公表されやすいことを防ぐためなどである。論文1の試験は事前登録していない。②トクホの試験方法では、試験デザインは二重盲検比較試験とし、試験は原則的に社外ボランティアを被験者として第三者機関で実施となっている。論文1では、試験デザインは単盲検試験であり、被験者は日中雇用されていると記されているが所属が不明(論文2では味の素従業員と記述されているので論文1の被験者もおそらく社員)。これらの事情から「グリナ」はトクホの試験方法に該当しない「別の試験方法」を選択したと考えられる。
③~⑤は臨床試験および論文の質を保証するもので、論文1はこれらをクリアしていると言ってよい。つまりチェックポイント①~⑤の内、3つをクリアしている。この他、論文を読むと以下の疑問点がある。
2.臨床試験は2晩連続して実施している。被験者11名と少ないため、おそらく1晩目と2晩目のデータを両方使用しているものと推察されるが、その取扱に関する記述が無い。2晩目はキャリーオーバー効果の可能性も考えられる。
3.SMHはQ14まであるが、論文にはQ11, Q13, Q14だけが有意差があったとしてデータが示されている。有意差の無かった質問項目は何かが記述されていない。引用文献を調べると、Q5睡眠の深さ、Q6途中覚醒回数、Q9どのくらいよく眠れたか、などがある。
以上、「グリナ」を題材に機能性表示食品の機能性の根拠情報の質を調べた。他の機能性表示食品と比較していないので何とも言えず、また科学的根拠のない採点法だが、上記①~⑤を各10点、論文の疑問点を5~10点として減点法で評価すると、今回の結果は60~70点になる。
コメントをお書きください