R语言 数据库

R语言 数据库

数据以规范化的格式存储在关系型数据库系统中。因此,为了进行统计计算,我们需要非常高级和复杂的Sql查询。但是,R可以轻松地连接到许多关系型数据库,如MySql,Oracle,Sql Server等,并从中提取记录作为数据框。一旦数据在R环境中可用,它就成为一个普通的R数据集,可以使用所有强大的包和函数进行操作或分析。

在本教程中,我们将使用MySql作为连接到R的参考数据库。

RMySQL包

R有一个名为“RMySQL”的内置包,提供与MySql数据库的本地连接。您可以使用以下命令在R环境中安装此包。

install.packages("RMySQL")

连接R与MySql

安装完包后,在R中创建一个连接对象,用于连接到数据库。它需要输入用户名、密码、数据库名称和主机名。

# Create a connection Object to MySQL database.
# We will connect to the sampel database named "sakila" that comes with MySql installation.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
   host = 'localhost')

# List the tables available in this database.
 dbListTables(mysqlconnection)

当我们执行上面的代码时,它会生成以下结果 –

[1] "actor"                      "actor_info"                
 [3] "address"                    "category"                  
 [5] "city"                       "country"                   
 [7] "customer"                   "customer_list"             
 [9] "film"                       "film_actor"                
[11] "film_category"              "film_list"                 
[13] "film_text"                  "inventory"                 
[15] "language"                   "nicer_but_slower_film_list"
[17] "payment"                    "rental"                    
[19] "sales_by_film_category"     "sales_by_store"            
[21] "staff"                      "staff_list"                
[23] "store"

查询表格

我们可以使用函数 dbSendQuery() 在MySql中查询数据库表格。查询在MySql中执行,并使用R中的 fetch() 函数返回结果集。最后,将其存储为R中的数据框。

# Query the "actor" tables to get all the rows.
result = dbSendQuery(mysqlconnection, "select * from actor")

# Store the result in a R data frame object. n = 5 is used to fetch first 5 rows.
data.frame = fetch(result, n = 5)
print(data.fame)

当我们执行上述代码时,会得到以下结果 –

actor_id   first_name    last_name         last_update
1        1         PENELOPE      GUINESS           2006-02-15 04:34:33
2        2         NICK          WAHLBERG          2006-02-15 04:34:33
3        3         ED            CHASE             2006-02-15 04:34:33
4        4         JENNIFER      DAVIS             2006-02-15 04:34:33
5        5         JOHNNY        LOLLOBRIGIDA      2006-02-15 04:34:33

查询带过滤子句

我们可以传递任何有效的选择查询以获取结果。

result = dbSendQuery(mysqlconnection, "select * from actor where last_name = 'TORN'")

# Fetch all the records(with n = -1) and store it as a data frame.
data.frame = fetch(result, n = -1)
print(data)

执行以上代码时,会产生以下结果:

actor_id    first_name     last_name         last_update
1        18         DAN            TORN              2006-02-15 04:34:33
2        94         KENNETH        TORN              2006-02-15 04:34:33
3       102         WALTER         TORN              2006-02-15 04:34:33

更新表中的行

我们可以通过将更新查询传递给dbSendQuery()函数来更新Mysql表中的行。

dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")

执行以上代码后,我们可以在MySql环境中看到表已更新。

向表中插入数据

dbSendQuery(mysqlconnection,
   "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
   values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
)

执行上述代码后,我们可以在MySql环境中看到插入的行。

在MySql中创建表

我们可以使用函数 dbWriteTable() 在MySql中创建表。如果表已经存在,它会覆盖原有表,并接收一个数据框作为输入。

# Create the connection object to the database where we want to create the table.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', 
   host = 'localhost')

# Use the R data frame "mtcars" to create the table in MySql.
# All the rows of mtcars are taken inot MySql.
dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)

执行上述代码后,我们可以在MySql环境中看到创建的表。

在MySql中删除表

我们可以通过将删除表语句传递到dbSendQuery()中来删除MySql数据库中的表,就像我们用于查询数据的方式一样。

dbSendQuery(mysqlconnection, 'drop table if exists mtcars')

执行上述代码后,我们可以看到表在MySql环境中被删除。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程