玩朋友的丰满人妻,朋友的丰满人妻中文字幕,从后面挺进邻居丰满少妇

新聞資訊

NEWS

多組學關聯分析方法HAllA操作方法

分類:公司動態   發布時間 2020-10-09   閱讀: 1935


HAllA(Hierarchical All-against-All association)是一種在高維、異構數據集中尋找多分辨率關聯的計算方法。用于以高功率發現數據特征之間的顯著關系。對數據類型具有很強的魯棒性,可以對連續值和分類值進行操作,并且在同質數據集(所有測量值都屬于同一類型,例如基因表達微陣列)和異構數據(包含具有不同單位或類型的測量值,例如患者臨床數據)上都能很好地工作。


簡單來講,HAllA是探索代謝組學、轉錄組學、微生物組學、蛋白質組學等多個組學之間相關性的有力工具。

HAllA流程圖如下:


代謝組學


HAllA特點

通用性:可以處理混合數據類型的數據集:分類、二進制、連續、詞法(有或無固有順序的文本字符串);


效率:不需要遍歷所有可能的關聯,而是只對統計學上有意義的候選變量進行詳細測試;


可靠性:利用分層錯誤發現校正來限制由于多重假設檢驗導致的假陽性;


可擴展性:不同步驟可以使用不同的方法。

1. 相似性計算方法有:Pearson、Spearman、歸一化互信息(NMI)、調整后的互信息(AMI)、互信息(MI)、最大信息系數(MIC)、離散化互信息默認和距離相關(DCOR);
2. 降維分解的方法有:層次聚類、PCA、ICA、MCA、聚類質心、偏最小二乘法(PLS)、典型成分分析(CCA)和核主成分分析(KPCA);
3.FDR方法有:BHY、BH和Bonferroni。

下面以測試過的系統和軟件為例說明操作方法

系統

Linux debian 4.9.0-4-amd64 #1 SMP Debian 4.9.65-3 (2017-12-03) x86_64 GNU/Linux

軟件

3.6.9 |Anaconda, Inc.| (default, Jul 30 2019, 19:07:31) \n[GCC 7.3.0]

運行

1.安裝halla包:直接在安裝了python的環境的命令行輸入pip install halla,需要注意的是該包調用了R的相關函數,所以需要安裝R及相關包;

2.下載示例數據,列是樣本行是特征

(1)使用提供的案例數據,樣本需要一一對應;

(2)也可以使用包中example文件夾下的數據。

3.使用HALLA API分析,python代碼如下:



常用參數

X:第一個數據集;
Y:第二個數據集;
m:選擇相關性計算方法(spearman :Spearman's rank correlation斯皮爾曼等級相關系數);
header:使用兩個數據集的列名來查找列(樣本)并重新排序。
參數還有很多,在此不再一一介紹。

結果解釋

1. 數據集X和Y的聚類熱圖,左側展示了特征簇。

代謝組學

代謝組學

2. associations.txt文件:


代謝組學


表頭解釋
association_rank:相關性p值的排名;
cluster1:第一個數據集的聚類后的簇;
cluster2:第二個數據集的聚類后的簇;
Pvalue:簇1和簇2的檢驗后的p值;
Qvalue:校正后的p值。
similarity_score_between_clusters:兩個類別之間的相關性大小。

3. similarity_table.txt:


代謝組學


這個文件是第一個數據集與第二個數據集中成對特征的相關性矩陣。OUTPUT文件夾里面還有很多結果,不再一一介紹。

4. 還可以使用修改后的corr_heatmap.py畫出相關性熱圖,在OUTPUT文件夾里打開shell,輸入下面的命令:


代謝組學

代謝組學


上圖和常規的相關性熱圖類似,但是會突出展示聚類后的簇之間的相關性,圖中標出的數字是對應簇相關性大小的排名,數字越小相關性越高。

除了這個分析之外,阿趣代謝還提供各類個性化定制分析服務,文獻上的炫酷圖片+燒腦分析,不要客氣,敬請扔過來進行咨詢~歡迎有此類需求的老師垂詢服務熱線:400-664-9912。


代謝組學

玩朋友的丰满人妻,朋友的丰满人妻中文字幕,从后面挺进邻居丰满少妇