統計解析とメタボロミクス

This tag is associated with 14 posts

第9回多変量解析を用いたメタボロームデータ解析 – MSEAを用いた有意な代謝経路の抽出

研究開発本部の山本です。

前回までは、主成分分析を用いてメタボロームデータを可視化し、因子負荷量を用いて主成分スコアと関連する代謝物質を選択する方法について説明してきました。今回は、選択した代謝物質と代謝パスウェイとの関連付けを行うための方法である、Metabolite Set Enrichment Analysis(MSEA)をご紹介します。…

第8回多変量解析を用いたメタボロームデータ解析 – 主成分分析の因子負荷量の仮説検定を用いた代謝物質の選択(後編)

研究開発本部の山本です。

前回は、Excelを用いて主成分分析の因子負荷量の仮説検定を行う方法についてご説明しました。では、実際の研究ではどのような流れになるのか少し具体的に考えてみましょう。…

第7回多変量解析を用いたメタボロームデータ解析 – 主成分分析の因子負荷量の仮説検定を用いた代謝物質の選択(前編)

研究開発本部の山本です。

前回までは、主成分分析の因子負荷量が、主成分スコアと各代謝物質レベルとの(ピアソンの)相関係数で定義されること、またソフトウェアによって因子負荷量の定義が異なるので、使用される際にはお使いのソフトウェアをご確認していただく必要があることをご説明しました。

今回は、因子負荷量の仮説検定を用いて、代謝物質を選択する方法についてご紹介します。…

第6回多変量解析を用いたメタボロームデータ解析 - 主成分分析の「ローディング」とは?(後篇)

研究開発本部の山本です。前篇では、実は「ローディング」と言われているものの定義が場合によって異なり、因子負荷量をデータの解釈に使用する場合は相関係数として取り扱うと解釈しやすいというお話をしました。

今回は実際に、MetaboAnalystの因子負荷量の結果と、相関係数で定義される因子負荷量の結果を比較してみましょう。…

第5回多変量解析を用いたメタボロームデータ解析 - 主成分分析の「ローディング」とは?(前篇)

研究開発本部の山本です。前回は主成分スコアプロットとローディングプロットをどのように利用するか、その見方についてご紹介しました。

今回は、前回説明したローディングについて、生物学的解釈につなげていくために「ローディングの中身」についてご説明したいと思います。

ローディングと一口に言っても、英語ではloading、PCA loading、factor loading、weight vector、eigenvector、日本語では因子負荷量、主成分負荷量、など実は様々あるのですが、混同されていることが多いです。今回は、「因子負荷量(factor loading)」と言われているものについて考えていきましょう。…

第4回多変量解析を用いたメタボロームデータ解析 - スコアプロットとローディングプロット

研究開発本部の山本です。前回はフリーの解析サービスであるMetaboAnalystを用いてオミクスデータに対して主成分分析を行う具体的な手順についてご説明しました。

今回は前回省略した欠損値補完とスケーリング、主成分分析の結果の解釈についてご説明したいと思います。…

第3回多変量解析を用いたメタボロームデータ解析 - MetaboAnalystを用いた主成分分析

研究開発本部の山本です。前回は、フリーで利用可能なメタボロームデータ、トランスクリプトームデータをご紹介しました。今回はこれらのオミックスデータに対し、フリーの解析サービスであるMetaboAnalystを用いて主成分分析を行う具体的な手順についてご紹介します。…

第2回多変量解析を用いたメタボロームデータ解析 - オミクスデータのダウンロードとマトリックスデータの準備

研究開発本部の山本です。今回は、多変量解析を行うためのオミクスデータの準備についてご説明したいと思います。

メタボロームデータの公開データベースとして有名なものには、MetaboLightsと、XCMS onlineのPublic Sharesがあります。しかしこれらのデータは、測定データそのものであり、多変量解析をすぐに行える状態の、サンプル × 代謝物質のマトリックスのデータになっていません。

そこで今回は、公開されたデータで、かつ比較的すぐに多変量解析が出来るオミクスデータとして、慶應義塾大学の大腸菌マルチオミクスのデータベースと、National Center for Biotechnology Information(NCBI)のGEO(Gene Expression Omnibus)の2つのデータベースをご紹介いたします。…

第1回多変量解析を用いたメタボロームデータ解析 - 多変量解析セミナー・学会報告

研究開発本部の山本です。

8月22日、29日、10月23日、24日に、東京・大阪で弊社主催『多変量解析を用いたメタボロームデータ解析』を開催し、セミナー講師を務めさせていただきました。たくさんの方に来ていただき、アンケートの結果でも概ね満足していただけたようで、安心しています。

今後もセミナーを行ってほしいというご意見も頂いておりますが、今回参加できなかった方々向けに、多変量解析セミナーの内容をメタブローグで数回に分けてご説明したいと思います。参加された方の復習としてもご活用いただければと思います。

またこれまでにも本ブログで、メタボロミクスと統計解析について書いていますので、そちらもぜひご一読ください。

今回は、10月4日に第3回生命医薬情報学連合大会で口頭発表をした時の様子をご報告します。…

[第5回メタボロミクスと統計解析] メタボロームデータと統計的仮説検定 その2

山本です. 前回, p-valueの補正の必要性について述べました. 簡単に振り返ります.

統計的仮説検定において, 有意差あり無しの判断を, 独立な複数の仮説検定を行うことを考慮せず, 別々に検定を行っただけのp-valueを用いて行うと, 1種の誤り(差がないという帰無仮説が正しいのに, 間違って差があるとしてしまう誤り)が, 3つの物質の時には, 5%から14%に大きくなります. また直感的にも, データセット全体で相対的に特に差の大きな物質を特定する, という観点が欠けているのは, バイオマーカー探索においては不十分な感じがします. …

メタボロ太郎なう

Photos on flickr