R语言 XML文件
XML是一种文件格式,它可以通过标准ASCII文本在万维网、内联网和其他地方共享文件格式和数据。它代表可扩展标记语言(XML)。类似于HTML,它包含标记标签。但与HTML不同的是,HTML的标记标签描述页面的结构,而XML的标记标签描述文件中包含的数据的含义。
您可以使用”XML”包在R中读取xml文件。可以使用以下命令安装这个包。
输入数据
通过将以下数据复制到文本编辑器(如记事本)中创建一个XML文件。使用 .xml 扩展名保存文件,并选择文件类型为 所有文件(.) 。
读取XML文件
xml文件通过R中的函数 xmlParse() 进行读取。它以列表形式存储在R中。
当我们执行以上代码时,会产生以下结果−
获取XML文件中节点的数量
当我们执行上述代码时,它将产生以下结果 –
第一个节点的详细信息
让我们来看一下解析文件的第一条记录。它将使我们对顶级节点中存在的各个元素有一个大致了解。
当我们执行上述代码时,会产生以下结果 −
获取节点的不同元素
执行上述代码时,会产生以下结果−
将XML转换为数据框架
为了有效处理大型文件中的数据,我们将xml文件中的数据读取为数据框架,然后对数据框架进行数据分析处理。
当我们执行上述代码时,会产生以下结果 –
现在数据已经以DataFrame的形式存在,我们可以使用与数据帧相关的函数来读取和操作文件。