R语言 如何在R中计算点估计值
点估计是一种技术,用于从人口的给定数据样本中找到人口参数的估计或近似值。点估计是针对以下两个测量参数计算的。
测量参数 | 群体参数 | 点估计值 |
---|---|---|
比例 | π | p |
平均值 | μ | x̄ |
本文主要讨论我们如何在R编程语言中计算点估计。
人口比例的点估计
人口比例的点估计可以通过以下数学公式计算。
语法: p′ = x / n
这里。
- x: 表示成功的数量
- n: 表示样本量。
- p′ 是人口比例的点估计值
例子 。
假设我们想估计一个班级在某一天出现的学生比例。样本数据由20个数据元素组成。
# define data
data <- c('Present', 'Absent', 'Absent', 'Absent',
'Absent', 'Absent', 'Present', 'Present',
'Absent', 'Present',
'Present', 'Present', 'Present', 'Present',
'Present', 'Present', 'Absent', 'Present',
'Present', 'Present')
# find total sample size
n <- length(data)
# find number who are present
k <- sum(data == 'Present')
# find sample proportion
p <- k/n
# print
print(paste("Sample proportion of students who are present", p))
输出 。
例子 。
请注意,我们可以通过使用下面的源代码计算出人口比例的95%置信区间。
# define data
data <- c('Present', 'Absent', 'Absent', 'Absent',
'Absent', 'Absent', 'Present', 'Present',
'Absent', 'Present',
'Present', 'Present', 'Present', 'Present',
'Present', 'Present', 'Absent', 'Present',
'Present', 'Present')
# find total sample size
total <- length(data)
# find number who responded 'Yes'
favourable <- sum(data == 'Present')
# find sample proportion
ans <- favourable/total
# calculate margin of error
margin <- qnorm(0.975)*sqrt(ans*(1-ans)/total)
# calculate lower and upper bounds of
# confidence interval
low <- ans - margin
print(low)
high <- ans + margin
print(high)
输出 。
因此,人口比例的95%置信区间是[0.440, 0.859]。
人口平均数的点估计
人口平均数的点估计可以通过使用R语言中的mean()函数来计算,其语法如下所示。
语法: mean(x, trim = 0, na.rm = FALSE, …)
这里。
- x:是输入向量
- trim。用来从排序向量的两端去掉一些观察值
- na.rm。用来去除输入向量中的缺失值。
例子 。
假设我们想估计一个班级中学生身高的群体平均值。样本数据由20个数据元素组成。
#define data
data <- c(170, 180, 165, 170, 165,
175, 160, 162, 156, 159,
160, 167, 168, 174, 180,
167, 169, 180, 190, 195)
#calculate sample mean
ans <- mean(data, na.rm = TRUE)
#print the mean height
print(paste("The sample mean is", ans))
输出 。
因此,该样本意味着高度为170.6厘米。
例子 。
请注意,我们可以通过使用下面的源代码来计算人口平均数的95%置信区间。
# define data
data <- c(170, 180, 165, 170, 165, 175,
160, 162, 156, 159, 160, 167,
168, 174, 180, 167, 169, 180,
190, 195)
# Total number of students
total <- length(data)
# Point estimate of mean
favourable <- mean(data, na.rm = TRUE)
s <- sd(data)
# calculate margin of error
margin <- qt(0.975,df=total-1)*s/sqrt(total)
# calculate lower and upper bounds of
# confidence interval
low <- favourable - margin
print(low)
high <- favourable + margin
print(high)
输出 。
因此,人口平均值的95%置信区间是[165.782, 175.417]。