[转载]R语言基础教程2:散点图
2016-08-24 16:56阅读:
函数。简单地说,把一些R语句(赋值、计算或其他操作步骤)包 装起来并给它一个名称,这就是函数。我们前面接触过的
getClass( ), class( ), head( ),
rep( ), cbind( ), rbind(
)等都是函数。显示(打印)对象 也有函数print(
),但R有更简单的方法:输入对象名(数据对象或函数名)就可以显示其内容。函数一般都有参数。 R
作图也是通过函数完成的,不同函数可以做出不同的图形,比如plot()函数可以做散点图、线状图,barplot()函数可以做出柱状图或条形
图,pie()函数用于做饼形图。作图或者称数据可视化,是R的主要的功能之一。R语言虽然是一种计算机语言,但用R作图不一定要会编程,相当简单。
散点图是最基本的数据分析图形,我们就从它开始。
一、文件数据读取和保存
作图首先要有数据。为避免重复输入,我们一般将R使用的数据存成文本文件(txt文件)或逗号分隔符文件(csv文件),Excel里面有这样的保存选项。
好的R软件包一般都提供有一些供学习和举例用的样本数据,这些数据可以用data(
)函数来查询。为方便说明,我们使用R(base包)提供的样本数据。先看看有些什么:
>
data()
Data sets
in
package
'datasets':
AirPassengers
Monthly
Airline
Passenger
Numbers
1949-1960
BJsales
Sales
Data
with
Leading
Indicator
BJsales.lead
(BJsales)
Sales
Data
with
Leading
Indicator
BOD
Biochemical
Oxygen
Demand
CO2
Carbon
Dioxide
Uptake
in
Grass
Plants
ChickWeight
Weight versus
age of chicks on different
diets
DNase
Elisa assay of
DNase
#...........(还有很多,节省篇幅不列了)
我们用trees数据来做散点图。先看看它是什么样的数据:
>
str(trees)
#数据的结构
'data.frame':
31
obs. of
3
variables:
$ Girth
: num
8.3 8.6
8.8
10.5
10.7
10.8
11
11
11.1
11.2
...
$
Height: num
70
65
63
72
81
83
66
75
80
75
...
$
Volume: num
10.3
10.3
10.2
16.4
18.8
19.7
15.6
18.2
22.6
19.9
...
>
head(trees)
#数据的前几条记录
Girth
Height
Volume
1
8.3
70
10.3
2
8.6
65
10.3
3
8.8
63
10.2
4 10.5
72
16.4
5 10.7
81
18.8
6 10.8
83
19.7
可以看到trees数据集是我们比较熟悉的数据框类型,有3个列变量。我们把它保存到D盘根目录。首先用setwd(
)函数设置工作目录,它是R读取和保存文件的默认位置。注意:如果是反斜杠得用两个。下面两条语句效果都一样:
>
setwd('d:/')
>
setwd('d:\')
然后用write.csv( )函数保存成trees.csv文件:
>
write.csv(trees,
'trees.csv')
用read.csv( )函数读取数据到the.data中:
>
the.data
<-
read.csv('trees.csv',
header =
TRUE)
再看看读入的数据是什么样子:
>
str(the.data)
'data.frame':
31
obs. of
4
variables:
$ X
: int
1
2
3
4
5
6
7
8
9
10
...
$ Girth
: num
8.3 8.6
8.8
10.5
10.7
10.8
11
11
11.1
11.2
...
$
Height:
int
70 65
63
72
81
83
66
75
80
75
...
$
Volume: num
10.3
10.3
10.2
16.4
18.8
19.7
15.6
18.2
22.6
19.9
...
>
head(the.data)
X Girth
Height
Volume
1 1
8.3
70
10.3
2 2
8.6
65
10.3
3 3
8.8
63
10.2
4 4