臨床研究への参加者の数と信頼性

By | 2016年9月1日

 最近の水素水の臨床研究の結果に対して、「参加者が数十人のごく小規模で信頼性が著しく低い試験結果でしかありません」と論評する人たちがいます。専門家が審査して学術論文として発表された結果に対して「著しく信頼性が低い」などというのもたいへん失礼な話だとは思いますが、本来は、信頼性は参加者の人数よりも、研究のデザインによるものですが、あまりに専門的になりすぎるので、ここでは参加者の数と信頼性の関係にしぼって話をしたいと思います。
 臨床試験では、対象者ひとりひとりの体質も生活も違いますので、全員が同じ結果になるとは限りません。遺伝的純系の動物でも一匹一匹に個性があります。同じ水素水を同じだけ飲んでも同じ結果がでるとは限らないのです。そこで、その違いを考慮したうえで、その結果はどのくらい確かなのか、つまり偶然ではないかを判断することになります。一般に95%の確率で確かだという場合には、統計的に意味のある結果だと判断することが多いのです。統計的にP値(probability value)が0.05以下になると一般的には統計的に有意と言います。95%の確かさ(P=0.05)という場合には、効果がなくても5%の確率で偶然に効果があるかのような結果が生じることがあるという意味です。
 あまり効果がない場合は少人数を調べてもP値は小さくならないので、多くの人を対象にして統計的な計算をしなくてはなりません。逆に、効果が顕著である場合には、臨床研究への参加者が少なくても、P値は小さくなります。人数が少なくても、統計的に有意な結果がでた場合は、その効果が顕著であることを意味します。
 では、どのくらいの人数を必要とするのでしょうか?特に最初の研究(パイロット研究)では、多くの方を対象としても無駄になることもあるので、実際に効果がある場合にP値が0.05より小さくなる最小限の人数を計算します。例えば、パーキンソン病に対する水素水の効果の研究では、UPDRS scores で効果ありとP値が0.05よりも小さくなるためには、最小限の人数は8人と計算され、途中でひとり脱落することを考えて9人を対象としています(We calculated that the enrollment of a minimum of 8 participants would be required to detect a 5% difference in the change of UPDRS scores between the 2 groups, with a standard deviation of the mean difference of 3.5% at a 2-sided α level of 0.05 and 80%. Assuming 1 dropout, a total of 9 patients was required.)。最小限での人数を対象とした水素水の研究でP<0.05となったということは、水素水には顕著な結果があることを意味します。ただし、数%の確率で、実は効果がなかったということもありうるので、今度はもっと多くの人数を対象として研究に移行することになります。