R语言 如何在R中计算点估计值

R语言 如何在R中计算点估计值

点估计是一种技术,用于从人口的给定数据样本中找到人口参数的估计或近似值。点估计是针对以下两个测量参数计算的。

测量参数 群体参数 点估计值
比例 π p
平均值 μ

本文主要讨论我们如何在R编程语言中计算点估计。

人口比例的点估计

人口比例的点估计可以通过以下数学公式计算。

语法: p′ = x / n

这里。

  • x: 表示成功的数量
  • n: 表示样本量。
  • p′ 是人口比例的点估计值

例子

假设我们想估计一个班级在某一天出现的学生比例。样本数据由20个数据元素组成。

# define data
data <- c('Present', 'Absent', 'Absent', 'Absent',
          'Absent', 'Absent', 'Present', 'Present', 
          'Absent', 'Present',
          'Present', 'Present', 'Present', 'Present', 
          'Present', 'Present', 'Absent', 'Present', 
          'Present', 'Present')
  
# find total sample size
n <- length(data)
  
# find number who are present
k <- sum(data == 'Present') 
  
# find sample proportion
p <- k/n
  
# print
print(paste("Sample proportion of students who are present", p))

输出

如何在R中计算点估计值?

例子

请注意,我们可以通过使用下面的源代码计算出人口比例的95%置信区间。

# define data
data <- c('Present', 'Absent', 'Absent', 'Absent',
          'Absent', 'Absent', 'Present', 'Present', 
          'Absent', 'Present',
          'Present', 'Present', 'Present', 'Present',
          'Present', 'Present', 'Absent', 'Present',
          'Present', 'Present')
  
# find total sample size
total <- length(data)
  
# find number who responded 'Yes'
favourable <- sum(data == 'Present') 
  
# find sample proportion
ans <- favourable/total
  
# calculate margin of error
margin <- qnorm(0.975)*sqrt(ans*(1-ans)/total)
  
# calculate lower and upper bounds of 
# confidence interval
low <- ans - margin
print(low)
  
high <- ans + margin
print(high)

输出

如何在R中计算点估计值?

因此,人口比例的95%置信区间是[0.440, 0.859]。

人口平均数的点估计

人口平均数的点估计可以通过使用R语言中的mean()函数来计算,其语法如下所示。

语法: mean(x, trim = 0, na.rm = FALSE, …)

这里。

  • x:是输入向量
  • trim。用来从排序向量的两端去掉一些观察值
  • na.rm。用来去除输入向量中的缺失值。

例子

假设我们想估计一个班级中学生身高的群体平均值。样本数据由20个数据元素组成。

#define data
data <- c(170, 180, 165, 170, 165, 
          175, 160, 162, 156, 159, 
          160, 167, 168, 174, 180, 
          167, 169, 180, 190, 195)
  
#calculate sample mean
ans <- mean(data, na.rm = TRUE)
  
#print the mean height
print(paste("The sample mean is", ans))

输出

如何在R中计算点估计值?

因此,该样本意味着高度为170.6厘米。

例子

请注意,我们可以通过使用下面的源代码来计算人口平均数的95%置信区间。

# define data
data <- c(170, 180, 165, 170, 165, 175, 
          160, 162, 156, 159, 160, 167,
          168, 174, 180, 167, 169, 180,
          190, 195)
  
# Total number of students
total <- length(data)
  
# Point estimate of mean
favourable <- mean(data, na.rm = TRUE)
s <- sd(data)
  
# calculate margin of error
margin <- qt(0.975,df=total-1)*s/sqrt(total)
  
# calculate lower and upper bounds of 
# confidence interval
low <- favourable - margin
print(low)
  
high <- favourable + margin
print(high)

输出

如何在R中计算点估计值?

因此,人口平均值的95%置信区间是[165.782, 175.417]。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程