玩朋友的丰满人妻,朋友的丰满人妻中文字幕,从后面挺进邻居丰满少妇

新聞資訊

NEWS

干貨連載 | SIMCA16 OPLS回歸分析一點通

分類:公司動態   發布時間 2021-01-15   閱讀: 2877


在統計學中,回歸分析(regression analysis)指的是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,它是一種預測性的建模技術。OPLS是一種多因變量對多自變量的回歸建模方法,其最大的特點是可以去除自變量X中與分類變量Y無關的數據變異,使分類信息主要集中在一個主成分中,從而模型變得簡單和易于解釋,其判別效果及主成分得分圖的可視化效果更加明顯。


OPLS回歸分析是功能代謝組學研究的重要工具,建立組學多元變量數據與功能、質量、等級等宏觀數據,或時間、濃度等實驗條件之間的關聯,從而實現篩選重要變量、建立評價標準和考察工藝過程等目的。通過模型質量,反映數據組與目標參數相關程度;通過建立實際值與預測值的散點圖,反映回歸模型的預測能力;通過VIP值,S-Plot等變量分析工具,從眾多變量中篩選出影響比較大的變量,作為后期優化、考察的對象;通過使用SIMCA中的預測功能,對預測集數據及新檢測樣品的目標值進行預測分析。功能如此強大,是不是迫不及待要練練手呢?。!

首先我們來學習下在SIMCA16中OPLS回歸分析如何操作吧。!

本案例是為了找到病人的眾多臨床參數中與關注的臨床指標的密切相關指標。該案例共收集了57名病人,在他們入院時對他們進行了測量,與健康有關的參數共計9項,測量的指標如下圖所示。

代謝組學

1
數據的導入和預處理

代謝組學
代謝組學

當樣本中的缺失值過多時,樣本本身就缺乏了統計學意義,并且極有可能成為異常樣本點,因此本案例對缺失值大于50%的樣本數據進行去除處理。

代謝組學
代謝組學
代謝組學

2
創建模型

通過OPLS得分圖和載荷圖相結合的方式,對其進行解讀可得到更多的信息。兩者相結合可以看出哪些樣本與Y變量相關性較強,哪些樣本相關性較弱。

代謝組學
代謝組學

進行OPLS模型的構建首先需要設置Y變量。

代謝組學

代謝組學


Scale方式選擇ctr或par有助于S-plot圖形成S形這有利于數據的篩選。


代謝組學
代謝組學

代謝組學

代謝組學


得分散點圖和DModx圖可考察樣本中是否有異常樣本點,當樣本點距離95%置信區間過遠和遠遠大于紅線時可以去除該樣本。

代謝組學


載荷圖結合其柱形圖可直觀考察其他X變量和Y變量的相關性程度。


3
模型診斷

代謝組學

代謝組學

關于Y值和預測Y值的回歸分析,可考察是否有異常樣本點,以及模型的擬合程度。

代謝組學

模型合格的最低標準R2>0.3,Q2>0.5。隨著主成分個數增加,會逐漸出現過度擬合的現象。

4
關鍵參數篩選

對關鍵X變量進行篩選,主要有三種方式VIP值排序、Loading圖 P值以及S-plot圖。

代謝組學

代謝組學

代謝組學
代謝組學

好菜還沒完。接下來讓我們看一看在文獻中的常規的具體應用。!

(1)常規數據分析

宏觀數據或實驗條件與代謝物數據之間的關聯。對于功能、質量、等級等宏觀數據或者時間、濃度等實驗條件對于代謝物影響這類實驗中,我們關注的是在不同自變量參數條件下有著顯著變化的代謝物。OPLS-DA適用于兩兩之間的分析?赡苓@個時候,研究者不得不尋求其他的解決方案,比如說做ANOVA分析等。然而這些分析方法都是對代謝物進行逐一考察,缺乏整體層面上對代謝物重要性程度的考量,因此不能進一步告訴研究人員這些隨自變量變化的代謝物中哪種代謝物更為關鍵。而OPLS回歸分析,不僅適用于多個自變量參數設置這類場景,同時給出了代謝物的權重信息,因此可以篩選出不同自變量參數條件下最為重要的代謝物。

(2)數據挖掘

a.藥效:從成分復雜的樣本中尋找最關鍵的生物活性物質、快速解析物質功能;Mandrone Manuela等人[1]將膠原酶抑制活性設為參數Y,各種芳香族化合物設為變量X,通過OPLS回歸分析中散點圖,VIP值柱狀圖,尋找到了單寧類化合物是與膠原酶抑制活性最相關的物質。

代謝組學代謝組學

b.質量評價:篩選出影響質量、感官等的關鍵代謝物,獲得評級和優化的線索;Yujing Zhang等人[2]在文章中將抗氧化能力設為參數Y。并將24個樣本作為訓練集建立了抗氧化能力和代謝物的OPLS回歸模型,又將7個樣本作為驗證集測試,發現回歸模型具有較好的對抗氧化能力的預測能力。

代謝組學

代謝組學代謝組學

c.生產:分析不同產量、質量生產過程,明確關鍵生產條件和優化策略。Katsuaki Nitta等人[3]將丁醇產量設置為變量Y和 大腸桿菌內代謝物設置為變量X,并進行OPLS回歸分析,其中乙酰輔酶A的回歸系數最大,蛋氨酸的回歸系數最小,然后基于這兩種代謝物對大腸桿菌丁醇產量進行優化。

代謝組學


d.臨床診斷:分析發病過程中趨勢性變化的代謝物,獲得潛在的診斷標志物或治療靶點;M. Kuboniwa等人[4]將臨床參數PISA設置為變量Y,代謝物數據設置為X變量,并建立OPLS回歸模型。通過VIP值和回歸系數篩選到8種顯著的差異代謝物。然后進一步通過ROC分析,確定5-氧代脯氨酸、組氨酸和尸胺為最優的診斷標志物。


代謝組學代謝組學

代謝組學代謝組學


今天SIMCA16關于OPLS回歸分析小技能就分享到這里啦,OPLS回歸分析對于功能相關的差異變量的篩選在食品、醫療、藥物研發等領域的應用相當廣泛,這里就不一一列舉了。下期我們將進入分類分析PCA-Class的精彩世界,敬請期待。我們下期再見。


參考文獻:
1. Mandrone, Manuela. Medicinal Plants from Ancient Tradition as a Source for Matrix Proteases Inhibitors. Study of Correlation between Biological Activity and Phytochemical Profile. Alma Mater Studiorum Università di Bologna.2016. DOI 10.6092/unibo/amsdottorato/7613.
2. Yujing Z , Chao W , Fangliang Y , et al. UHPLC-ESI-Q-TOF-MS/MS analysis, antioxidant activity combined fingerprints for quality consistency evaluation of compound liquorice tablets[J]. RSC Advances, 2018, 8(49):27661-27673.
3. Nitta K , Lavi A W A , Pontrelli S , et al. Orthogonal partial least squares /projections to latent structures regression-based metabolomics approach for identification of gene targets for improvement of 1-butanol production in Escherichia coli[J]. Journal of Bioscience & Bioengineering, 2017:S 13891 72317303079.
4. Kuboniwa M , Sakanaka A , Hashino E , et al. Prediction of Periodontal Inflammation via Metabolic Profiling of Saliva[J]. Journal of Dental Research, 2016:1381.

如需本文原始數據,請在阿趣代謝微信公眾號后臺回復:0115+姓名+單位+聯系電話+郵箱;

如需試用SIMCA軟件,請在阿趣代謝微信公眾號后臺回復:試用+姓名+單位+聯系電話+郵箱。

BIOTREE科技成為Sartorius Stedim Data Analytics AB大中華區SIMCA軟件銷售及培訓服務提供商。如需購買SIMCA軟件或培訓課程請撥打免費服務熱線:400-664-9912。

本文為阿趣代謝微信公眾號原創,歡迎個人轉發分享。其他任何媒體、網站如需轉載,須聯系阿趣代謝微信公眾號獲得授權,并在正文前注明來源阿趣代謝微信公眾號。


代謝組學

玩朋友的丰满人妻,朋友的丰满人妻中文字幕,从后面挺进邻居丰满少妇