VIP標識 上網(wǎng)做生意,首選VIP會員| 設為首頁| 加入桌面| | 手機版| RSS訂閱
食品伙伴網(wǎng),關注食品安全,探討食品技術
 
當前位置: 首頁 » 食品專題 » 生物名詞庫 » 生物數(shù)學 » 正文

聚類分析

放大字體  縮小字體 發(fā)布日期:2006-09-19

聚類通過把目標數(shù)據(jù)放入少數(shù)相對同源的組或“類”(cluster)里。分析表達數(shù)據(jù),(1)通過一系列的檢測將待測的一組基因的變異標準化,然后成對比較線性協(xié)方差。(2)通過把用最緊密關聯(lián)的譜來放基因進行樣本聚類,例如用簡單的層級聚類(hierarchical clustering)方法。這種聚類亦可擴展到每個實驗樣本,利用一組基因總的線性相關進行聚類。(3)多維等級分析(multidimensional scaling analysis,MDS)是一種在二維Euclidean “距離”中顯示實驗樣本相關的大約程度。(4)K-means方法聚類,通過重復再分配類成員來使“類”內(nèi)分散度最小化的方法。

聚類方法有兩個顯著的局限:首先,要聚類結果要明確就需分離度很好(well-separated)的數(shù)據(jù)。幾乎所有現(xiàn)存的算法都是從互相區(qū)別的不重疊的類數(shù)據(jù)中產(chǎn)生同樣的聚類。但是,如果類是擴散且互相滲透,那么每種算法的的結果將有點不同。結果,每種算法界定的邊界不清,每種聚類算法得到各自的最適結果,每個數(shù)據(jù)部分將產(chǎn)生單一的信息。為解釋因不同算法使同樣數(shù)據(jù)產(chǎn)生不同結果,必須注意判斷不同的方式。對遺傳學家來說,正確解釋來自任一算法的聚類內(nèi)容的實際結果是困難的(特別是邊界)。最終,將需要經(jīng)驗可信度通過序列比較來指導聚類解釋。

第二個局限由線性相關產(chǎn)生。上述的所有聚類方法分析的僅是簡單的一對一的關系。因為只是成對的線性比較,大大減少發(fā)現(xiàn)表達類型關系的計算量,但忽視了生物系統(tǒng)多因素和非線性的特點。

 
[ 網(wǎng)刊訂閱 ]  [ 食品專題搜索 ]  [ ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ] [ 返回頂部 ]

 

 
推薦圖文
推薦食品專題
點擊排行
 
 
Processed in 0.021 second(s), 18 queries, Memory 0.87 M