R语言 机器学习简介

R语言 机器学习简介

机器学习 这个词是由阿瑟-塞缪尔在1959年首次提出的。机器学习的定义可以定义为:机器学习 使计算机具有无需明确编程的学习能力。 同样在1997年,Tom Mitchell对机器学习的定义是: “如果一个计算机程序在某些任务T和某些性能指标P方面的性能随着经验E的增加而提高,那么它就被称为从经验E中学习”。 机器学习被认为是计算机科学中最有趣的领域。

机器学习如何工作?

  1. 清理从数据集中获得的数据
  2. 选择一个合适的算法来建立预测模型
  3. 训练你的模型以了解项目的模式
  4. 以更高的精度预测你的结果

机器学习的分类

根据学习的性质,机器学习的实现被分为3大类。

  1. 监督学习 监督学习顾名思义就是在有监督的情况下。简而言之,在监督学习中,我们试图用标签和已经有正确答案的数据来教导机器。在这之后,机器将创建一个数据实例集,以便监督算法分析训练数据并产生正确的标签数据输出。例如,如果我们创建了一个水果数据集,那么我们将标记为圆形的、有凹陷的、红色的水果,那么它被称为苹果。现在,当我们要求机器从一篮子的水果中识别出苹果时,它将使用之前的标签并识别出苹果。监督学习被分为以下两类。
  • 分类: 分类问题是指输出变量是一个类别,如 “红色 “或 “橙色 “或 “可计算 “或 “不可计算”。
  • 回归: 当输出变量是实值时,如 “Ruppes “或 “高度”,则使用回归。
    1. 无监督学习 无监督学习是使用没有标记的信息对机器进行训练,它在没有任何指导下工作。在这里,机器的主要任务是利用相似性、差异性和模式来分离数据,而不需要任何事先的监督。因此,机器被限制在自己寻找未标记的数据中的隐藏结构。例如,如果我们提供一组以前从未见过的猫和狗。那么机器将根据猫和狗的行为和性质来区分这组猫和狗。现在,当我们提供狗和猫的图片时,机器会根据分类提供结果。无监督学习被分为以下两类。
  • 聚类: 聚类问题是指机器识别数据中固有的分组,例如根据顾客在商店的访问情况进行分组。

  • 关联: 关联问题是指我们可以找到两个事件或项目之间的关系,例如,购买物品A的人也倾向于购买B。

    1. 强化 学习 强化学习方法是指在特定情况下采取适当的行动,使奖励最大化。它是在各种机器的监督下,在特定情况下采取最佳路径来解决问题。强化学习和监督学习之间的区别是,在监督学习中,数据有一个正确答案的关键,它用来寻找答案,但在强化学习中,代理决定做什么来执行给定任务。例如,在从一个地方到另一个地方的旅行中,我们总是考虑以最短和最好的方式到达目的地。强化学习的一些要点。
  • 输入: 输入应该来自模型实际开始的初始阶段。

  • 输出: 任何问题都有多个输出。
  • 训练: 由于训练依赖于输入,模型将返回状态,用户将根据模型的输出来决定奖励或放弃。

R语言基本上是由统计学家开发的,用于帮助其他统计学家和开发人员更快、更有效地处理数据。现在我们知道,机器学习基本上是在处理大量的数据和统计,作为数据科学的一部分,R语言的使用总是被推荐。因此,对于那些从事机器学习的人来说,R语言大多变得很方便,使任务更容易、更快、更创新。下面是R语言在R编程中实现机器学习算法的一些顶级优势。

使用R语言实现机器学习的优势

  • 它提供了良好的解释代码。例如,如果你处于机器学习项目的早期阶段,你需要解释你所做的工作,与python语言相比,用R语言工作变得很容易,因为它提供了适当的统计方法,用较少的代码行处理数据。
  • R语言是数据可视化的完美选择。R语言为机器学习模型的工作提供了最好的原型。
  • R语言有最好的工具和库包来处理机器学习项目。开发人员可以使用这些包来创建机器学习项目的最佳前模型、模型和后模型。此外,R语言的软件包比python语言更先进、更广泛,这使得它成为机器学习项目的首选。

用于实现机器学习的流行R语言包

  • 子: 格子包支持创建显示变量或有条件的多个变量之间关系的图形。
  • DataExplorer: 这个R语言包专注于自动化数据可视化和数据处理,以便用户可以关注项目的数据洞察力。
  • Dalex(Descriptive Machine Learning Explanations): 这个包有助于为输入变量和输出之间的关系提供各种解释。它有助于理解机器学习的复杂模型。
  • dplyr: 这个R包用于总结机器学习的行和列的表格数据。它采用了 “分割-应用-合并 “的方法。
  • Esquisse: 这个R包用于快速探索数据,以获得其中的信息。它还可以绘制条形图、柱状图、曲线图和散点图。
  • caret: 这个R包试图简化创建预测模型的过程。
  • janitor: 这个R包有检查和清理脏数据的功能。它基本上是为初学者和中级用户的用户友好性而建立的。
  • rpart: 这个R包有助于使用两阶段程序创建分类和回归模型。由此产生的模型被表示为二进制树。

R在机器学习中的应用

有许多顶级公司,如谷歌、Facebook、Uber等,都在使用R语言进行机器学习的应用。这些应用包括。

  • 社会网络分析
  • 分析趋势和模式
  • 获得对用户行为的洞察力
  • 找到用户之间的关系
  • 开发分析解决方案
  • 获取图表组件
  • 嵌入交互式视觉图形

机器学习问题的例子

  • 网络搜索,如Siri、Alexa、Google、Cortona: 识别用户的声音并满足其请求。
  • 社会媒体服务: 帮助人们联系世界各地,并显示我们可能认识的人的推荐。
  • 在线客户支持: 为客户提供高度的便利和支持人员的效率。
  • 智能游戏: 使用高水平的反应和适应性的非玩家角色,类似于人类的智能。
  • 产品推荐: 一种软件工具,用于推荐你可能想购买或参与的产品。
  • 虚拟个人援助: 是可以根据所提供的指示执行任务的软件
  • 交通警报: 根据提供的情况帮助切换交通警报
  • 在线欺诈检测: 检查用户执行的异常功能并检测欺诈行为
  • 医疗保健: 机器学习可以管理大量的数据,超出正常人的想象,帮助根据症状识别病人的疾病。
  • 现实世界的例子: 当你在YouTube上搜索某种烹饪食谱时,你会看到下面的推荐,标题是 “你可能也喜欢这个”。这就是机器学习的一个常见用途。

机器学习问题的类型

  • 回归: 回归技术有助于机器学习方法预测连续值。例如,房子的价格。
  • 分类: 输入被分为一个或多个类或类别,以便学习者产生一个模型来分配未见的模块。例如,在电子邮件欺诈的情况下,我们可以将电子邮件分为两个类别,即 “垃圾邮件 “和 “非垃圾邮件”。
  • 聚类: 这项技术是在总结之后,找到一组类似的实体。例如,我们可以在医院里收集和提取病人的读数。
  • 关联: 这种技术找到共同发生的事件或项目。例如,市场-篮子。
  • 异常检测: 这种技术通过发现异常的情况或行为来工作。例如,信用卡欺诈检测。
  • 序列挖掘: 这种技术预测下一个流事件。例如,点击流事件。
  • 推荐: 这种技术推荐项目。例如,根据其中的名人推荐歌曲或电影。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册