ブログ

研究室の活動2022.06.29

(食品科学実験)~11回目~科学英語,多変量解析

こんにちは.


6月なのに梅雨明けによって,暑い日が続いています.

今日も,とても暑い1日となり,

群馬県伊勢崎市では,6月の全国統計史上初の

40.2℃を観測したみたいです...

東京都心では,39.2℃,名古屋では37.5℃を観測し,

それぞれ5日および3日連続の猛暑日になりました,



10年前は,こんなに暑いことなかったのになあと

つくづく思います...

小学生の頃は,温度計が30℃以上になれば

「すごく暑い」と感じていた思い出がありますね.

みなさんも,熱中症には十分お気をつけください



本日は,3年生の科学英語で使用する論文選びと,

メタボロームで使用する多変量解析の種類を学び,

実際にソフトを使用して解析を行いました,



メタボローム解析は、大きく分けて2つあります。

1つ目は、「パスウェイ解析」です。


パスウェイ解析は、

生物学的アプローチをする際に向いており、

様々な試料のデータベースとの一致率から

解析を行います。


しかし、本研究室は

食品の品質評価などのアプローチを行っているので、

パスウェイ解析は使用していないです。

バスウェイは、モデル食品など

代表的な試料のデータベースがありますが、

各食品のデータベースはないからです


無料ソフトである,"MetaboAnalyst "を使用すれば

パスウェイ解析をすることができます,




2つ目は,「メタボリックプロファイリング」です.

本研究室は,こちらの解析をしています

メタボリックプロファイリングは,

SIMCAというソフトを用いて行う解析であり,

メタボローム解析は大体こっちの解析をします.

解析の種類がいろいろあるのですが,

ここでは簡単に説明します.

その前に,解析の際にXとYという文字が出てくるので,どんなものなのか?説明しますと


X…説明変数

Y…応答変数


と言います.

Xは,本研究室の解析では主に食品の代謝物を指し,

100以上の成分があるのでXは複数あります.


Yは,Xを導くを示す変数とされ,教師と呼ばれます.

YはX(代謝物)と相関させたいものを設定することが

多いです.

例えば…

官能評価では鮮度評価を調べたい時は生菌数

Yにすることがあります.





では,メタボリックプロファイリングの種類を

簡単に説明します.


1.PCA(主成分分析)

 PCAは,試料の分布を客観的に見る時に

 適している解析です.


 説明変数Xが複数あるのが PCAーXというのですが,

 これを使用することで

 どの代謝物(X)がどこに分布しているのかが,

  図によって簡単にわかります.

 図というのは…

 スコアプロットと,ローディングプロットがあります

  


こんな感じの図です.見方は,

スコアプロット(左)にある点が試料を示していて,

ローディングプロット(右)は代謝物を示しています.


この二つの図は場所が対応しています.

例えば,スコアプロットの右上に分布する試料は,

ローディングプロットの右上に分布する代謝物が多いということです.

場所が対応しているので,2つのプロットを重ねる方法もあります.


また,PCAはX(代謝物)だけで解析することが多く,

Yがないので教師ナシと呼ばれます

(先生がいないから自由にいる感じ)






2.PLSーR,OPLSー R(回帰分析)

コチラの解析は,回帰分析と呼ばれ,

XとYを相関させたい時に使う方法です,

PLS−Rの改良版が,OPLS-Rです,


Xから,Yを予測したい時にします,

例えば,

味の成分官能評価の結果を相関させたいとき,

味の成分…X

官能評価…Y

と設定してPLSーR をすると

どの成分が,どれくらい

官能評価の結果に影響しているか?

を見ることができます,

SIMCAでは,回帰式とよばれる

比例式のようなものが作れます,

これによって,

XからYを予測する

ことが可能になります.




3.O2PLS

 コチラは,Yが2つ以上の解析です.

PLSは,Yが一つでしたので

X⇨Yを予測しかできませんでしたが,

O2PLSは,

X⇄Y

XからYを予測もできるし

 YからXも予測ができます,





4.PLS-DA,OPLSーDA(判別分析)


コチラは,判別分析と呼ばれ,

群間での違いを見たい時に使用します.

代謝物をXとおき

ダミー変数をYと置きます,

ダミー変数とは,1,2,3…

といった数字のことで

解析で群の違いを見る際に使用します,


ちなみに,ダミー変数の数字の優劣は

全く関係なく,ただ区別をするために

割り振っているだけです.


判別分析は,群間の違いが最も

大きくなるところで,強制的

分けるので,比較的わかりやすい解析

になっています,


また,有意差の指標である

p値が表示されるので,

目視だけでなく,数値として

試料に差があるのか?

見ることができます.



主成分分析(PCA)では、

p値が具体的に出ないので、

PCAを行った後に,より強力な

判別分析(OPLS-DA)をすることが

多いです。




5.HCA(クラスター分析)

クラスターというのは,「集団」

という意味ですが,

これは,異なる性質の試料から

互いに似た性質の持つもので

クラスター(集団)を作り

似たもの同士がなんの試料なのか?

をみることができます.





私が学んだ解析方法は,以上です.

たくさんあって,難しそうに感じますが

研究によって,使用する解析方法は

違うので,必要に応じて変えます.


少しずつ理解していくように努めます,

読んでいただきありがとうございました.




この記事を書いた人
増森 彩華 (M2)
Ayaka Masumori

最新ブログ

キーワード