Thứ Hai, 14 tháng 9, 2015

Tự học R

Ngôn ngữ R có nguồn gốc từ ngôn ngữ S

S thì được viết bởi John Chambers tại  Bell Labs năm 1976 chuyên về phân tích thống kê  .

R được viết vào năm 1991 , và public vào 1993 và là ngôn ngữ opensource (GPL)

R có thể chạy được trên hầu hết các nền tảng hệ điều hành và vi xử lý .

Nói một cách ngắn gọn, R là một phần mềm sử dụng cho phân tích thống kê và đồ thị. Thật ra về bản chất, R là ngôn ngữ máy tính đa năng, có thể sử dụng cho nhiều mục tiêu khác nhau, từ tính toán đơn giản, toán học giả trí, tính toán ma trận, đến các phân tích thống kê phức tạp. Vì là một ngôn ngữ cho nên người ta có thể sử dụng R để phát triển các thành phần mềm chuyên môn cho một vẫn đề tính toán cá biệt.

Để sử dụng R việc đầu tiên chúng ta cần làm là cài đặt R trong máy tính của mình. Để làm điều này chúng ta truy cập vào website. http://cran.R-project.org và tải R xuống. Khi đã tải R xuống máy tính, bước kế tiếp là cài đặt vào máy tính. Để làm việc này, chúng ta chỉ đơn giản nhấn chuột vào tài liều trên và làm theo hướng dẫn cách cài đặt trên màn hình. Đây là một bước rất đơn giản chỉ cần 1 phút là việc cài đặt sẽ hoàn tất. Sau khi hoàn tất việc cài đặt một icon sẽ xuất hiện trên desktop của máy tính. Đến đây thì chúng ta đã sắn sàng sử dụng R có thể nhấp chuột vào icon này

 Tàu nhanh một số điểm của R như sau .

 x <- 5

có nghĩa là phép gán 5 vào biến x

về các phép toán so sánh thì same họ nhà C

Riêng với bọn chuyên statistic này sẽ có vài kiểu dữ liệu dị như sau

1 Vector hiểu là 1 dạng array

The c() function can be used to create vectors of objects.
> x <- c(0.5, 0.6)       ## numeric
> x <- c(TRUE, FALSE)    ## logical
> x <- c(T, F)           ## logical
> x <- c("a", "b", "c")  ## character
> x <- 9:29              ## integer
> x <- c(1+0i, 2+4i)     ## complex
Using the vector() function
> x <- vector("numeric", length = 10) 
> x
 [1] 0 0 0 0 0 0 0 0 0 0


2.Ma trận 
> m <- matrix(nrow = 2, ncol = 3) 
> m
     [,1] [,2] [,3]
[1,]   NA   NA   NA
[2,]   NA   NA   NA
> dim(m)
[1] 2 3
> attributes(m)
$dim
[1] 2 3
3.List giống vector nhưng kiểu dữ liệu trong list có thể khác nhau
> x <- list(1, "a", TRUE, 1 + 4i) 
> x
[[1]]
[1] 1

[[2]] 
[1] "a"

[[3]]
[1] TRUE

[[4]]
[1] 1+4i
4.factor như kiểu list nhưng nó có nhãn (label)

> x <- factor(c("yes", "yes", "no", "yes", "no")) 
> x
[1] yes yes no yes no
Levels: no yes
> table(x) 
x
no yes 
 2   3
> unclass(x)
[1] 2 2 1 2 1
attr(,"levels")
[1] "no"  "yes"
5.data frame cái này thì giống ma trận nhưng kiểu dữ liệu có thể khác nhau
> x <- data.frame(foo = 1:4, bar = c(T, T, F, F)) 
> x
  foo   bar
1   1  TRUE
2   2  TRUE
3   3 FALSE
4   4 FALSE
> nrow(x)
[1] 4
> ncol(x)
[1] 2
6.Names
R object có thể có names 
> x <- 1:3
> names(x)
NULL
> names(x) <- c("foo", "bar", "norf") 
> x
foo bar norf 
  1   2    3
> names(x)
[1] "foo"  "bar"  "norf"
list cũng có thể có names
> x <- list(a = 1, b = 2, c = 3) 
> x
$a
[1] 1

$b 
[1] 2

$c 
[1] 3

ma trận cũng có thể có names
> m <- matrix(1:4, nrow = 2, ncol = 2)
> dimnames(m) <- list(c("a", "b"), c("c", "d")) 
> m
  c d 
a 1 3 
b 2 4






Không có nhận xét nào:

Đăng nhận xét