踏上R语言之旅:解锁数据世界的神秘密码(二)

发布于:2024-04-24 ⋅ 阅读:(18) ⋅ 点赞:(0)

R语言学习



1.数据的R语言表示

数据框(data frame)
R语言中用函数data.frame()生成数据框,其句法是:
data.frame(data1,data2,…),例如:

> X=data.frame(x1,x2)
> X
    x1 x2
1  171 57
2  175 64
3  159 41
4  155 38
5  152 35
6  158 44
7  154 41
8  164 51
9  168 57
10 166 49
11 159 47
12 164 46

数据框的列名默认为变量名,也可以对列名进行重新命名,例如:

> (X=data.frame('身高'=x1,'体重'=x2) )
   身高 体重
1   171   57
2   175   64
3   159   41
4   155   38
5   152   35
6   158   44
7   154   41
8   164   51
9   168   57
10  166   49
11  159   47
12  164   46

2.多元数据的R语言调用

1.从剪切板读取
2.从文本文件读取
3.从Excel文件读取

>X=read.table("data.csv")

注意:若要读取Excel工作簿数据,需安装和调用RODBC包:

>library(RODBC)
>Rcode<-odbcConnectExcel("Rcode.xls")

3.多元数据的简单R语言分析

1.定量变量的分析
(1)展现定量数据

直方图hist()函数
hist(x,freq=NULL,…)

> hist(x1) #身高的直方图

在这里插入图片描述
(2).定量变量间的关系

散点图plot()函数
plot(x,y,…)

> plot(x1,x2)

在这里插入图片描述
2.定性变量的分析

列联表函数table()
(1)单因素分析

> data=read.table("clipboard",header=T) #剪切板数据读入data
> head(data) #前6组数据
   年龄 性别 风险意识 专兼职情况 职业状况 教育程度 投资结果
1 20-29   男       有       兼职     金融     高中     赚钱
2 50-59   女       有       兼职     科教     中学     持平
3 40-49   女       无       专职     科教     中学     赔钱
4 30-39   男       有       兼职     工人     中专     赚钱
5 50-59   女       有       专职     农民     大专     赚钱
6 40-49   女       有       兼职     管理     小学     赚钱
> attach(data) #解析变量
> table(年龄) #一维列联表
年龄
    *  0-19 20-29 30-39 40-49 50-59   60- 
   20     3    92   167   157    51    24 
> barplot(table(年龄),col=1:7)

在这里插入图片描述

> pie(table(投资结果))

在这里插入图片描述

(2)两因素分析

> table(年龄,性别)
       性别
年龄   男  女
  *       9  11
  0-19    2   1
  20-29  69  23
  30-39 101  66
  40-49  89  68
  50-59  24  27
  60-    15   9
> barplot(table(年龄,性别),beside=T,col=1:7)

在这里插入图片描述

> barplot(table(性别,年龄),beside=T,col=1:2)

在这里插入图片描述

(3)三因素分析

> ftable(年龄,性别,投资结果) #三维列联表
           投资结果 持平 赔钱 赚钱
年龄  性别                        
*4    3    23    7    1
0-190    0    21    0    0
20-2921   17   3110    7    6
30-3931   30   4030   20   16
40-4931   30   2825   30   13
50-595   11    88   10    9
60-7    5    32    5    2
> (ft=ftable(性别,投资结果,年龄))
              年龄  * 0-19 20-29 30-39 40-49 50-59 60-
性别 投资结果                                         
男   持平           4    0    21    31    31     5   7
     赔钱           3    0    17    30    30    11   5
     赚钱           2    2    31    40    28     8   3
女   持平           3    1    10    30    25     8   2
     赔钱           7    0     7    20    30    10   5
     赚钱           1    0     6    16    13     9   2
> rowSums(ft)
[1]  99  96 114  79  79  47
> colSums(ft)
[1]  20   3  92 167 157  51  24
> sum(ft)
[1] 514

整理后的频数表:
在这里插入图片描述

4.多元数据的直观表示及R使用

1.均值条图及R使用

barplot(X,...)
X为数值向量或数据框


总结

本小节主要学的是一些关于R语言的数据及图像表达的操作,数据案例表已绑定,继续加油!