R語言導論 1-5章學習筆記
01-25
第一章 緒論
通過函數和特徵尋求幫助查找solve函數的意思:help(solve)或者 ?solve查看某個函數的使用實例: example(solve)啟動幫助文檔的網頁瀏覽器help.start()search() 查看哪些包已載入並可使用
安裝包: install.packages("gclus")查看已安裝的包: installed.packages()載入包: library(gclus) 在一個會話中,包只需載入一次輸出某個包的簡短描述以及包中的函數名稱和數據集名稱的列表:help(package="gclus")批處理文件和結果重定向 source("first.R") sink("record.lis") 輸出到文件 sink() 輸出到控制台第二章:簡單操作:數值與向量
2.1. 向量與賦值
數字向量: 由一組有序數字組成的單個實體
賦值:用函數c() 進行賦值,作用是將參數中的數值向量以及向量的值首尾相接成一個新的向量。使用assign()函數與c()等價2.2. 向量運算
同一個表達式中的向量並不需要具有相同的長度。如果它們的長度不同,表達式的結果是一個與表達式中最長向量有相同長度的向量。表達式中較短的向量會根據它的長度被重複使用若干次[從向量的第一個數開始](不一定是整數次),直到與長度最長的向量相匹配。(3) 產生遞減序列 g <- 30:1
邏輯操作符包括<,<=,>,>=,==,!=
如果c1,c2是邏輯表達式,那麼c1&c2是它們的交集,c1|c2是它們的並集,!c1是c1的反面2.5 缺失值 當某個元素或者數值從統計角度講是"不可用"(not available)或者是"缺失值"(missing value),它們在向量中的位置將被保留,同時被賦值為一個特殊值NA。 函數is.na(x)返回一個邏輯向量,這個向量與x有相同的長度,並且由相應位置的元素是否是NA來決定這個邏輯向量相應的元素是TRUE還是FALSE x==NA是一個與x具有相同長度而其所有元素都是NA的向量。字元向量可以通過函數c()連接。函數paste()可以接受任意個參數,並從它們中逐個取出字元並連成字元串,形成的字元串的個數與參數中最長字元串的長度相同。如果參數中包含數字的話,數字將被強制轉化為字元串。在默認情況下,參數中的各字元串是被一個空格分隔的,不過通過參數sep=string用戶可以把它更改為其他字元串,包括空字元串。
這種索引向量的作用是把某些值排除而不是包括進來
第三章 對象,模式和屬性
3.1 固有屬性:模式和長度
R操作的實體在技術上來說就是對象。實體或複數向量,邏輯向量和字元串向量之類的對象屬於"原子"型的對象,因為它們的元素都是一樣的類型或模式 最基本的結構: 數值型(numeric),復值型(complex),邏輯型(logical)以及字元型(character) 向量中的值必須是相同模式的。因此任何給定的向量必定是四種中的一種。一個空的字元串向量列印為character(0),一個空的數值向量列印為numeric(0) 一個對象的模式是該對象基本要素的類型。[即typeof函數]即來描述一個對象"特徵"的術語,另一個所有對象都有的特徵是長度。函數mode(object)和length(object)可用於任何數據對象以得到其模式和長度。第四章 有序因子和無序因子
因子是一個對等長的其他向量元素進行分組的向量對象。R同時提供有序和無序因子
4.1 一個特別的例子有一份來自澳大利亞所有州和行政區的30個稅務會計師的信息樣本以及他們各自所在地的州名。州名以字元串向量的形式保存在state中。
注意:在字元向量中,"有序"意味著以字母排序,因此,用levels()可以用來得到因子的水平
方差: 隨機變數期望的二次偏差的期望。
關於標準誤差和標準差的區分:標準偏差和標準誤差的區別 - SPSS專版 - 經管之家(原人大經濟論壇)標準差和標準誤差的區別_百度文庫進一步計算各個州的標準誤差.可以寫一個R函數來計算任意給定向量的標準誤差。第五章 數組和矩陣
5.1 數組
數組可以看作是帶有多個下標類型相同地元素集合,如數值型 維度向量是一個正整數向量。如果它的長度為k,那麼該數組就是k-維的,例如矩陣是2-維數組。 向量只有在定義了dim屬性後才能作為數組在R中使用。5.2 數組索引以及數組分割
數組元素可以通過給定數組名及其後方括弧中用逗號隔開的下標訪問。 數組分割可以通過在下標位置給定一系列索引向量實現;如果某個位置上給定的索引向量為空,則該下標處所有可能值都會被取到。 例如: a[2, , ]是一個4*2的數組。它的維度向量是c(4,2),數據向量依次包括下面的值1. B<- aperm(A,c(2,1))
2. B <-t(A)5.7 矩陣工具 函數nrow(A)和ncol(A)將會分別返回矩陣A的行數和列數,t(A)就是矩陣的轉置函數5.7.1 矩陣相乘矩陣相乘: %*% 如果A和B是大小一樣的方陣,那麼A*B是一個對應元素乘積的矩陣,而A%*%B是一個矩陣積。 如果x是一個向量,那麼 x %*% A %*% x是一個二次型推薦閱讀:
※彪悍開源的分析資料庫-ClickHouse
※寫報告的人,你是用數據支撐你的觀點,還是因為數據找到論點?
※哪些必備因素造就了一名優秀數據科學家?