«

»

統計

第9回多変量解析を用いたメタボロームデータ解析 – MSEAを用いた有意な代謝経路の抽出


研究開発本部の山本です。

前回までは、主成分分析を用いてメタボロームデータを可視化し、因子負荷量を用いて主成分スコアと関連する代謝物質を選択する方法について説明してきました。今回は、選択した代謝物質と代謝パスウェイとの関連付けを行うための方法である、Metabolite Set Enrichment Analysis(MSEA)をご紹介します。


前回、通常マウスと12時間絶食後のマウス肝臓のメタボロームデータに対し、主成分分析を行った結果、第一主成分スコアで群間に差が見られました。そこで、第一主成分スコアと相関の高いパターンを示す代謝物質を、因子負荷量の仮説検定によって選択しました。

前回のデータでは、検出された代謝物質が282物質あり、その中で有意な代謝物質は136物質ありました。136物質がどのような代謝物質で、それぞれがどのように生物学的な意味があるのか考えるのは簡単ではありません。そこで、これらの代謝物質がどの代謝経路に属する代謝物質なのかを調べることにより、着目すべき有意な代謝パスウェイが特定され、その後の生物学的な解釈をスムーズに行えるようになります。

MSEAには様々な計算方法がありますが、その中で最も良く用いられる方法として、over-representation analysis(ORA)があります。ORAについて簡単にご紹介します。

ORAでは、初めに特定の代謝経路と代謝物質のクロス集計表を作成します。例として、先ほどの絶食マウスで有意に低下している代謝物質と、解糖系の代謝経路に所属する代謝物についてのクロス集計表を以下に示します。

table1

表より、10個の解糖系の代謝物質のうち、9個の代謝物質が絶食マウスで有意に低下していることがわかりました。解糖系の代謝物質のほとんどが有意に低下しているので、解糖系が低下していると言えそうです。

代謝経路と有意な代謝物質との関連を調べるためには、クロス集計表に対して、カイ二乗検定やフィッシャーの正確確率検定が用いられます。表の場合、オッズ比が22.14、p<0.05となりました。この結果より、絶食で解糖系が有意に低下していることが確認されました。 この表を解糖系以外の代謝経路についても作成し、想定される全ての代謝経路について同様の計算を行うことで、代謝経路ごとにp値を計算することができます。最終的には、p値を補正し、補正したp値やq値を用いて、有意な代謝経路を見つけ出します。 絶食マウスの場合は、解糖系、TCA回路、ペントースリン酸経路、ポリアミン代謝、システイン代謝で絶食で有意に低値を示し、プリン代謝で有意に高値を示すことがMSEAにより示されました。 これまで多変量解析を用いたメタボロームデータ解析というタイトルで、全9回に渡って、主成分分析を用いてメタボロームデータから生物学的な解釈にどう結び付ける方法を紹介してきました。基本的には、一昨年の多変量解析セミナーでご紹介した内容を記事にしたものですが、MetaboAnalystの使い方も追加でご紹介させていただきました。質問などありましたら、お気軽にご相談いただければと思います。 これまでご覧いただいて、ありがとうございました。

«

»

メタボロ太郎なう

Photos on flickr