分類
R 生物統計

資料有大於兩種互相獨立的分組方法_R語言

#資料有大於兩種互相獨立的分組方法

#多因子檢定 (Multifatorial testing): 需分析因子數越多,需要分析的交互作用項也會快速增加。

三因子變異數分析 (無重複試驗) [Three-way ANOVA (without replication)]

Exzample: 白羅曼鵝的性別、受日照長短、試驗區域對其採食量影響

intake<- c(78.1,76.3,
           69.5,73.2,
           82.4,83.0,
           72.3,70.0)
sex<- rep(c("F","F","M","M"),times= 2)
light<- c("L","L","L","L","S","S","S","S")
region<-c("A","B","A","B",
          "A","B","A","B")
data.frame(intake=intake, sex=sex, light=light,region=region)
summary(aov(intake~sexlightregion))
summary(aov(intake~sexlightregion-sex:light:region)) #為無重複試驗時須要扣除同時有三因子之交互作用 (-sex:light:region)

#三因子變異數分析 (有重複試驗) [Three-way ANOVA (with replication)]

使用條件: (1)資料有三種完全獨立三種方法 (2)每個因子組合都有超過一個觀測值 

檢定的假設: 資料是連續、趨近常態分佈、每個因子變異數相等,如果資料不滿足以上假設,此檢定並沒有對應的無母數版本

Example: 觀察牛群放牧對周遭牧草生長的影響。分別在兩個地點(I,II),兩個時間(白天(D)和黑夜(N))試驗,每個地點有6個取樣點,分成ABC三種,其中2個點作為控制組 (不做任何處置),2個點用柵欄圍起來不讓牛隻進入,最後兩個是程序控制組 (仍讓牛隻進入,但有實施柵欄工程),該試驗必須設置程序控制組,否則效果只能被歸因於牛隻進入或柵欄工程。觀測值為牧草的生長量,以下是觀察資料。

grass<- c(112,115,187,141,121,189,121,145,198,135,141,208,
          116,102,175,101,157,186,138,124,168,129,133,206)
place<-rep(c("I","I","I","I","I","I","II","II","II","II","II","II"), times=2) 
time<- rep(c("D","D","D","N","N","N","D","D","D","N","N","N"), times=2)
treatment<- rep(c("A","B","C","A","B","C","A","B","C","A","B","C"), times=2)
data.frame(place,time,treatment,grass)
model<- aov(grass~ placetimetreatment) #有一個主效果顯著,另外兩個接近顯著,所有的交互作用皆不顯著
summary(model)
TukeyHSD(model, "treatment") #事後檢定採樣點(ABC)中,哪幾個水準互相有差異

#多因子變異數分析 (Multiway ANOVA): 多於三組的分類因子,每種因子均互相獨立

困難點:(1)隨著因子數目增加,交互作用項也會急速增加,導致解讀困難 (2)因子數變多,其之間獨立的機會也會降低

考慮與解決: (1)真的每個因子都獨立嗎? (2)是否某些因子可以合併 (3)是否鑲嵌在其他因子 (4)使用共變數的方式分析

#分組方法並非都是獨立: 很多實驗會認為因子互相獨立,在研究後才發現不全然是,因此考量分析中各因子間的獨立性是重要的

非獨立因子: 有些資料分子是固定的,像是性別來做作主效果因子。但可能其他因子就會變得不固定,舉例來說,依照性別分組後再依照體重重或輕來分組的話會發生體重較重的組別男性會比女性多,因此這個因子(性別男和女、體重輕和重)並非獨立。這種相依性可以用卡方關聯性檢定來檢驗。

#因子不獨立的話就不適合作因子變異數分析,解決方式是把性別當作固定因子,體重作為共變數執行共變數分析。

#鑲嵌因子: 該種因子不是固定、具實際意義的因子,而是因為方便使用數字進行編號,數值沒有意義。

像上述的題目每個地點有6個取樣點,每個取樣點都做編號 (1-6)。

鑲嵌因子都是隨機因子,但反過來卻不一定,像是地點這個因子可能是固定或是隨機因子,但不是鑲嵌因子。

事後檢定不能用於鑲嵌因子。

#隨機或固定因子:同一種因子在不同檢定中可以分別被當成固定或是隨機。

舉例說,果蠅的突變種類可以當成固定或隨機因子。如果固定因子:殘翅編號1、白眼種編號2,意味任何水準間的顯著差異都源自於這兩種特定突變種的特質。反之,如果當成隨機因子,任何顯著差異都只能當成是任兩種突變種的差別。

#鑲嵌或階層設計 (Nested or hierarchical designs): (1)只有一個隨機因子在階層底端,其他因子都鑲嵌其中,稱為完全鑲嵌設計。 (2)頂端階層是固定,且以其他因子鑲嵌其中,稱為混合模型。鑲嵌因子個數沒有限制。

兩階層鑲嵌設計變異數分析 (Two-level nested-design ANOVA): 一個因子是固定的,另一個因子是鑲嵌在一般因子的隨機因子。

Example: 台灣土雞母雞年產蛋數試驗,設計兩種脂肪攝取量,並編號0和1號。各"攝取量"水準均有三群關在不同雞舍的雞群。從各雞舍分別隨機取出三隻雞的蛋。

這六群雞各自被分配到的"雞舍"因子為鑲嵌在"攝取量"的隨機因子,每一組分別被編號為1、2、3號。

egg<- c(55.6,62.5,58.9,85.6,68.5,65.6,
        62.5,68.3,54.2,98.2,69.3,71.0,
        68.2,58.2,63.5,75.1,88.2,78.3) 
intake<- rep(c(0,0,0,1,1,1),times=3)
house<- rep(c(1,2,3,1,2,3), times=3)
data.frame(egg,intake,house)                     
summary(aov(egg~as.factor(intake)/as.factor(house))) #以aov(data~ A/B),告訴B為A的鑲嵌因子。需使用as.factor將intake跟house是視為因子,而不是共變數。隨機因子的自由度為(3-1)*2。

 

 

提供R srcipt參考

參考來源: 生物統計學:如何選擇與應用

                                                                                                                                                                                                                                          

發表迴響