2016年6月10日 星期五

Swirl_01-RBasic-04-Factors

01-RBasic-04-Factors
-------------------------------

01.factor()是一個向量物件,用途是儲存「類別」的資料。Factor向量很像文字向量,但多出額外的分類名稱彙整資訊,levels這個屬性。實際上Factor向量本質上只是整數向量加上levels。這樣設計的原因是儲存整數比儲存文字更省空間。

02. Factor向量中的levels屬性代表向量中允許出現的類別。 可使用levels()函數來查詢或設定分類資料。

03. 在Factor向量中指派沒在levels裡面的類別,會出現NA。

04. R預設是以字母順序排序levels

05.「類別」的資料有兩種。分為「無順序」與「有順序」的。對於無順序的資料硬要去比大小,R會印出警告訊息。 想轉為有順序的factor向量。做法是在factor函數中,把ordered設為TRUE。 並且把levels順序以向量方式傳入,level要由小到大填入。
    > grades <- C("A","C","B","B","A")
    > grades_factor<-factor(grades,ordered=TRUE,levels=c("C","B","A"))
    > grades_factor
    [1] A C B B A
    Levels: C < B < A

06. 總的來說factor向量用來儲存類別的資料。level屬性限制能在向量中出現的類別種類。 Factor本質上是整數向量,只是帶有levels。 Factor可以是無順序或有順序的,可用在Factor函數中使用ordered=TRUE讓Factor變成有序。

1 則留言: