R编程语言 – 简介
R是一种开源的编程语言,被广泛用作统计软件和数据分析工具。R通常带有命令行界面。R可以在Windows、Linux和macOS等广泛使用的平台上使用。另外,R编程语言是最新的尖端工具。
它是由新西兰奥克兰大学的 Ross Ihaka和Robert Gentleman 设计的,目前由R开发核心团队开发。R编程语言是S编程语言的一个实现。它还结合了受Scheme启发的词法范围语义。此外,该项目构思于1992年,1995年发布了初始版本,2000年发布了稳定的测试版本。
为什么是R编程语言
- R编程被用作机器学习、统计和数据分析的主要工具。对象、函数和包可以很容易地由R创建。
- 它是一种与平台无关的语言。这意味着它可以应用于所有操作系统。
- 它是一种开源的免费语言。这意味着任何人都可以在任何组织中安装它而无需购买许可证。
- R编程语言不仅是一个统计包,而且还允许我们与其他语言(C,C++)集成。因此,你可以很容易地与许多数据源和统计包互动。
- R编程语言有一个庞大的用户社区,而且它正在日渐壮大。
- R目前是数据科学就业市场上最需要的编程语言之一,这使得它成为当今最热门的趋势。
R编程语言的特点
R的统计学特点
- 基本统计: 最常见的基本统计术语是平均值、模式和中位数。这些都被称为 “中心趋势的测量”。因此,使用R语言我们可以非常容易地测量中心趋势。
- 静态图形: R有丰富的设施用于创建和开发有趣的静态图形。R语言包含了许多图形类型的功能,包括图形地图、马赛克图、双平面图,等等,不一而足。
- 概率分布: 概率分布在统计学中起着至关重要的作用,通过使用R,我们可以很容易地处理各种类型的概率分布,如二项分布、正态分布、齐次分布等等。
- 数据分析: 它为数据分析提供了一个大型的、连贯的、综合的工具集合。
R的编程特点
- R包: R的主要特点之一是它有广泛的可用库。R有CRAN(Comprehensive R Archive Network),这是一个拥有超过10,000个包的存储库。
- 分布式计算: 分布式计算是一种模式,其中软件系统的组件在多台计算机之间共享以提高效率和性能。2015年11月,两个用于R语言分布式编程的新软件包 ddR和multidplyr 被发布。
R语言 编程
由于R与其他广泛使用的语言在语法上非常相似,所以用 R 编码和学习更容易。写完程序后,将文件保存为扩展名 .r。 要运行该程序,在命令行上使用以下命令。
R file_name.r
例子
# R program to print Welcome to GFG!
# Below line will print "Welcome to GFG!"
cat("Welcome to GFG!")
输出
Welcome to GFG!
R的优势
- R是最全面的统计分析软件包。由于新的技术和概念往往首先出现在R中。
- 由于R编程语言是一种开放源码。因此,你可以在任何地方、任何时间运行R。
- R编程语言适用于GNU/Linux和Windows操作系统。
- R编程是跨平台的,可以在任何操作系统上运行。
- 在R语言中,欢迎每个人提供新的软件包、错误修复和代码增强。
R的缺点
- 在R编程语言中,一些包的标准不那么完美。
- 虽然,R命令给内存管理的压力很小。所以R编程语言可能会消耗所有可用的内存。
- 在R中,基本上没有人去抱怨,如果有些东西不工作。
- R编程语言比其他编程语言如Python和MATLAB要慢得多。
R的应用
- 我们将R语言用于数据科学。它为我们提供了广泛的与统计有关的库。它还提供了统计计算和设计的环境。
- R被许多定量分析员作为其编程工具使用。因此,它有助于数据的导入和清理。
- R是最普遍的语言。因此,许多数据分析师和研究程序员使用它。因此,它被用作金融的基本工具。
- 像谷歌、Facebook、Bing、Twitter、埃森哲、Wipro等科技巨头如今都在使用R。
R和Python都在数据科学中发挥着重要作用。对于任何新手来说,在R和Python中选择一个更好的或最合适的,会变得很困惑。因此,看看数据科学的R和Python,选择哪种语言更适合于数据科学。