統計

This tag is associated with 17 posts

日本計量生物学会に参加してきました

バイオマーカー・分子診断事業部の山本です。5月21日,22日に、統計数理研究所で行われた、日本計量生物学会に参加してきました。

この学会に参加した理由は、共同研究の際にメタボロミクスのスタディの設計で医学統計の知識が必要だと感じていること、数ヶ月前に共同研究をしている某先生からお酒を飲みながら『お前は疫学を勉強しろ!』と言われたこと、また昨年度の学会がインフルエンザで無くなってしまってそのリベンジ、などが色々と重なった結果、参加することにしたのでした。…

[第5回メタボロミクスと統計解析] メタボロームデータと統計的仮説検定 その2

山本です. 前回, p-valueの補正の必要性について述べました. 簡単に振り返ります.

統計的仮説検定において, 有意差あり無しの判断を, 独立な複数の仮説検定を行うことを考慮せず, 別々に検定を行っただけのp-valueを用いて行うと, 1種の誤り(差がないという帰無仮説が正しいのに, 間違って差があるとしてしまう誤り)が, 3つの物質の時には, 5%から14%に大きくなります. また直感的にも, データセット全体で相対的に特に差の大きな物質を特定する, という観点が欠けているのは, バイオマーカー探索においては不十分な感じがします. …

[第4回メタボロミクスと統計解析] メタボロームデータと統計的仮説検定 その1

バイオメディカルグループ(統計解析)の山本です。前回までは, 主に多変量解析を用いたメタボロームデータ解析について説明してきました. 多変量解析は回帰・判別モデルの構築や, データの視覚化には有効ですが, ある現象に特に大きく関わっている単一もしくは2,3の物質を特定することが目的であるバイオマーカー探索では, 単変量毎に仮説検定等を行うのがより直接的なアプローチです. そこで今回は, 主にバイオマーカー探索における統計的仮説検定に関する話をいくつか紹介したいと思います.…

[第3回メタボロミクスと統計解析] 2009年度統計関連学会連合大会に参加してきました

バイオメディカルグループ(統計解析)の山本博之です。9月6日~9日まで、京都の同志社大学で行われた、2009年度統計関連学会連合大会に参加してきました。

統計関連学会連合大会は、日本の統計に関する学会(統計学会, 計量生物学会, 計算機統計学会等)が、 一堂に集まる大きな学会です。 またオミクスデータの統計に関する研究発表が比較的まとまってあるところは、この統計関連学会しか知りません。 他にも人工知能学会のデータマイニングと統計数理研究会(僕も2年前に、メタボロームデータの統計解析で発表しました)や、機械学習関連のIBISに行くと、 少しオミクスの統計に関する発表があることもあります。…

[第2回メタボロミクスと統計解析] メタボロームデータと多変量解析

バイオメディカルグループ(統計解析)の山本博之です。

細胞内での現象はほとんどの場合、1つの代謝物質によって説明されることはなく、複数の代謝物質とそのネットワークによって説明されます。よって、複数の変数(代謝物質)を使ってデータを表現する多変量解析がその道具として用いられるのは、比較的自然なことだと思います。メタボローム解析では特に主成分分析が用いられる事が多く、論文等でその計算結果を目にされたことのある方も多いと思います。

オミクスデータのような高次元データは視覚的に人が理解できないので、何らかの形で視覚化することが有効です。主成分分析は高次元データを1次元に射影し、その上での分散が最大になるような射影方向をいくつか求め、それらの軸を用いて視覚化します。1次元上での分散が大きな主成分軸は、一般的にデータを良く表現する軸であるとしばしば説明されます。しかしこれは少し説明不足です。…

たかが3回、されど

こんにちは、HMTの大賀拓史です。

先日、鶴岡では天神祭が催されました。「化けもの祭り」とも呼ばれるこのお祭りでは、長襦袢を身にまとった参加者が編みがさと手拭いで顔を隠して「化けもの」に扮し、街を無言で練り歩きながら見物客にお酒やジュースを振る舞います。かつて大宰府に流された菅原道真公を悼みつつ、一方で当時の権力者に身元が分からない様にと、顔を隠してお酒を酌みかわしたのがその由来だとか。聞くところによると、3年間、友人知人に変装を見破られることなく天満宮にお参りができた暁には、願いごとが叶うのだそうです。今年は、どれくらいの方が念願の3度目を達成されたのでしょうか。

ところで、お願いごとというと、何故かやたらと3回という条件がつきますよね。三度目の正直、お三度参り、それから、流れ星に願い事を唱える数も。その内容にもよりますが、願い事を託すのにたったの3回だけ、というのは些か心許なく感じませんか?

さて、科学の世界では実験結果の再現性を確認するため、複数回の実験や検体の採取を行いますが、こちらでも、3回というのが一般的に求められる最小数ではないでしょうか。…

[第1回メタボロミクスと統計解析] オミクスデータの判別

バイオメディカルグループ(統計解析)の山本博之です。

HMTに来て2年目ですが、学生の時からメタボロームデータのための多変量解析手法の開発など、統計解析に関する研究に取り組んできました。膨大なデータが得られるオミクスでは、得られたデータをどのように解析するか、が非常に重要となります。これから1年間、統計解析について、特にメタボロームデータなどのオミクスデータを扱う際に起こりうる、この分野特有の問題点や、統計関連の学会参加報告などを書いていく予定にしていますので、よろしくお願いします。

初回は5月20日~22日に日本計量生物学会の年会に参加し、その様子をご報告する予定だったのですが、残念なことに新型インフルエンザの影響で学会が中止になってしまいました。そこでその代わりと言ってはなんですが、今回はオミクスデータの判別問題について少しご紹介したいと思います。…

メタボロ太郎なう

Photos on flickr