疑義が生じた心理学実験

2015年8月27日
過去数年は科学の信用性が傷ついた年であった。ある心理学の権威が、データーねつ造で逮捕され、彼が提出した研究論文の50本以上が削除されている。
胚性幹細胞の存在の可能性を示した研究論文が、その信用性に疑いが生じ、掲載した世界でも有名な雑誌が今、批判されている。ゲイの選挙運動員が投票者に与える影響を研究した論文も怪しくなり、掲載した雑誌”Science”も撤去せざるを得なかった。

その一方、ブライアン・ノセックが率いる、バージニア大学の心理学の専門家が”Reproducibility Project”を発足させ、再現実験を試みた。有力心理学雑誌三誌に掲載された100本の研究の再現を試みて、その結果が今日Scienceに報告された。予想通りと言うか、半分以上の研究に疑問が生じて、専門家が長年恐れていた事実が浮かび上がった。

これらの研究は中でも有力で、各分野の専門家が頼りにする基礎知識になるはずであったから、社会的にも損失が大きい。「我々は今まで、研究発表に問題があるのではないかと疑っていたが、これほどまでも大がかりとは驚きである」と、オランダ、ティルバーグ大学のジェルテ・ウィチャー助教授は言う。

問題の3つの心理実験
60本の不合格研究の中の3つに焦点を当てると、その一つに自由意志の実験と言うのがある。被験者に”人の行動は前もって準備されている”と言う文章を読んでもらうと、読まない人に比べて次の実験で嘘をつくことが多かったとしている。

二つ目は2008年の研究で、人は清潔を心の中で考えた後では、道徳的潔癖さが緩んでいたと報告している。あるいは、嫌悪感を感じた後に、手を洗う傾向があるとしているが、再現テストでは今一つはっきりしなかった。

三つ目は魅力的な相手を探す実験で、太っている既婚女性は、独身男性に魅力を感じると言う研究結果であるが、これも再現できなかった。

再現実験プロジェクトは2011年に始まり、ブライアン・ノセックは250人以上の無償のボランティア研究者を集めてこのプロジェクトに取り組んだ。対象は2008年に発表された100本の研究で、研究論文を書いた原著者と協力しながら進めた。その結果、虚偽、不正とまでは行かなかったが、論文が言うほどすっきりした結論は出なかった。

スタンフォード大学のメタ解析イノベーションセンターのジョーン・アイオアニディス氏は、従来から、医学で発表される研究論文の半分は間違っているか、水増ししていると主張していたが、今回の再実験結果を読んで予想した通りと言っている。細胞生物学、経済学、脳神経科学、臨床医学、動物研究等では更に悪いのではとも言う。

学会に広まっている望ましくない研究の原因として、研究世界の激しい競争を挙げる識者が多い。研究者は見栄えの良い結果を出す傾向があり、その結果を第三者も確かめない。再現実験をしようとしても、費用と時間がかかる。一方、雑誌社は読者の目を引こうとするから、虚飾を見ない。

「我々は今行動する時なのです。社会に、研究結果の再現が必要である事を訴えなければならないし、資金援助する側、出版社、雑誌社には、あやしい研究が沢山ある事を伝えなければならない」とノセックは言う。ノセックは”the Center for Open Science”と言う非営利のデーター・シャエアリング・サービス組織の長でもある。このセンターは、最近有名になった癌研究の再評価にも着手している。

雑誌記者との電話会議で、Science編集長のマルシア・マックナットは「この手の再現実験は今回だけではなく、これからずっとやると言うことです」と強調する。5月には2人の大学院生が、ゲイの選挙運動員が与える同性婚問題に対する影響の研究に、データーの疑いがある事を指摘した後、Science誌はこの論文を削除している。

しかし、他の研究者がやった仕事の信頼性を疑い、再実験するのは誰でも気持ちの良いものではない。経験の足りない若い科学者が、数年かけてやり遂げた先輩の研究を批判することに年配の科学者は憤慨している。

「再現性のテストをするのは重要なのは分かっているが、それは研究に対する攻撃であり、自警団的発想でもある。第一、再現性の実験手法自体に問題があるのではないか」と南カリフォルニア大学の心理学教授のノーバート・シュウォーツは言う。所で彼は問題にされた研究100本の著者の中には含まれていない。

ノセック等も、この不満を真摯に受けとめて、再実験は、元の研究者と十分相談しながら進めている。当然のことながら、被験者の数も多く使うようにしている。出来るだけ原本に忠実に再現実験を試みたが、多少の違いは避け難かったとノセックも述べているが、これは原本を作成した研究者も同意している。

発表では、100本の内、35本の研究の数字は統計上意味あるとされたが、62本は根拠が薄いとされた。残りの3本は統計上の意味がはっきりしなかったので除外した。
効果量(新発見の強さを表わす数値)は、全ての研究で半分に減少した。しかし、原本の論文と反対の結論が出るのは希であった。

「再現実験が出した数値が正しいか、間違っているかではなくて、2つの実測値とします。」とノセックは言う。研究ではさらに、論文を書いた人、所属機関の有名度で研究が特別扱いされたかどうかも調べたが、それはなかった。むしろ、影響があったのは研究内容のインパクトであった。

女性がどんな男性を選ぶかの元の研究を書いたパドゥア大学のパオラ・ブレッサンは、再実験の手法が原実験とは異なっていた事を認めている。例えば、彼女が調べた女性はイタリア人であったのに対して、再実験ではアメリカの心理学の学生であった。だからReproducibility Projectに申し出て、実験手法を訂正してもらった結果、私の論文に間違いがないことが確かめられたと、Eメールで言ってきた。

再現実験を他の分野に広めようとすると多くの問題が降りかかる。特に医学、脳科学では費用が膨大で、心理学のそれとは比較にならない。

American Society for Cell Biologyの責任者であるステファノ・ベルツッジによれば、「生物学でも心理学と同様に、データーの再現性確認が随分言われて来たが、そのままになっている。私はこれを漫画生物学と呼びたい。疑いのない、簡明な結果を誰でも欲しいが、そんなすっきりした研究は言うのはやさしいが、難しい」と言う。



脳科学ニュース・インデックスへ