«

»

統計

第8回多変量解析を用いたメタボロームデータ解析 – 主成分分析の因子負荷量の仮説検定を用いた代謝物質の選択(後編)


研究開発本部の山本です。

前回は、Excelを用いて主成分分析の因子負荷量の仮説検定を行う方法についてご説明しました。では、実際の研究ではどのような流れになるのか少し具体的に考えてみましょう。


スコアプロット通常のマウスと、12時間絶食後のマウスの肝臓サンプル(2群、N=5)のメタボローム解析を行ったとします。

そのデータを主成分分析した結果、第一主成分と第二主成分スコアのスコアプロットが左図のようになりました。

まず第一に、図から、第一主成分でコントロール群(〇)と絶食群(●)が、群間でよく分かれており、両者に差があることが確認できます。

この試験の場合、コントロール群と絶食群に差が見られることが期待されるので、もしここで群が分かれなかったときには実験手順に問題なかったかどうか、そのデータに信頼性があるかなどを確認する必要があります。その場合も第二主成分以降に差が出ていることは十分考えられます。(実験手順など操作上の問題でない限り)自分の予想とは違うものの思いがけない結果が得られたということになり、必ずしも実験が無駄になるわけではありませんので丁寧にデータを見ていってください。

この例では第一主成分で問題なく分かれているので、第一主成分の因子負荷量に着目し、第一主成分スコアと関連する代謝物質を選択していきます。

前回の記事でご説明したように、主成分スコアと各代謝物質レベルとの相関係数を計算するか、重み係数wにスコアの分散の平方を掛けるか、いずれかの方法で因子負荷量を計算し、p値を計算します。

8-Fig2このデータから、検出されたすべての代謝物質のうち、第一主成分スコアと有意な相関が認められた(有意水準5%)代謝物質を生物学的な考察の対象としていきます。

第一主成分のスコアは、「絶食で高値を示し、コントロールで低値を示す」という意味なので、それとの正の相関がある物質は「12時間の絶食でコントロールよりも高値を示す」物質群、一方で負の相関を示す物質は、「12時間の絶食で低値を示す物質群」ということになります。

ところで、今回は通常のマウスと絶食マウスの単純な2群比較の試験を例に取り上げましたが、「t検定ではダメなのか?」と質問をされることがあります。

もちろん2群間で差のある代謝物質をピックアップするのはt検定でも可能ですが、「主成分分析を行いスコアプロットで群間が分かれていたので、t検定をして代謝物質をピックアップしました」という話の流れでは、そもそも主成分分析をする必要が無いのでは?ということになってしまいます。

せっかく主成分分析を行ったのであれば、代謝物質の選択に主成分分析の因子負荷量を使った方が、主成分分析の結果も活かしつつ、目的に合った代謝物質の選択も行えるので、一石二鳥と言えるのではないでしょうか。

そして何よりこの方法の利点は、群数が2群よりも大きい多群の場合や、時系列データの場合など、どのようなケースでも、主成分スコアに興味あるパターンが見られさえすれば、複雑な多重検定の方法を用いることなく、簡単に代謝物質をピックアップできるところにあります。

さらに詳しく知りたい方は、論文[1]、またこの手順で解析された結果[2]も報告されていますので、合わせてご参考にしていただければと思います。また、MetaboAnalystを使った解析手順は、第2回メタボロームシンポジウム若手会で使用したスライド「フリーソフトウェアを通じた多変量解析講習」を公開していますので、こちらもご活用ください。

この後はいよいよこれらの代謝物質について生物学的な解釈を行うことになりますが、次回、仮説検定で選択した代謝物質がどのような代謝パスウェイと関連しているのかを調べる方法である、Metabolite Set Enrichment Analysis(MSEA)についてご紹介したいと思います。

[1] Yamamoto H, Fujimori T, Sato H, Ishikawa G, Kami K, Ohashi Y. , Statistical hypothesis testing of factor loading in principal component analysis and its application to metabolite set enrichment analysis. , BMC Bioinformatics. 15 51 , 2014 ≪PubMed
[2] Sakanaka A, Kuboniwa M, Takeuchi H, Hashino E, Amano A. , Arginine-Ornithine Antiporter ArcD Controls Arginine Metabolism and Interspecies Biofilm Development of Streptococcus gordonii. , J Biol Chem. 290(35) 21185-98 , 2015 ≪PubMed

«

»

メタボロ太郎なう

Photos on flickr