R 语言基础 - 读取数据

本贴最后更新于 936 天前,其中的信息可能已经斗转星移

R 语言基础-读取数据

键盘录入

user <- data.frame(name=character(0), age=numeric(0), gender=character(0)) user <- edit(user) user$name

image.png

输出结果:

# user$name [1] Tom Jerry <NA> Levels: Tom Jerry

自带数据集

head(iris)

输出: 数据前 6 行

Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa
class(iris)

输出: 当前类

[1] "data.frame"
[1] table(iris$Sepal.Length)

image.png

CSV 文件

student <- read.table('./dataset/student.csv', head=TRUE, sep=',') student[, c('语文', '数学')] student$语文 student[1]

image.png

Excel 文件

安装并引入 RODBC 包

install.packages('RODBC') library('RODBC')

读取操作:

odbcCon <- odbcConnectExcel('./dataset/student.xls') sqlFetch(odbcCon, 'Sheet1')

连接数据库

这里以 MySQL5 为例

安装 RMySQL 和 DPI 包

install.packages('RMySQL') install.packages('DPI')

连接 MySQL

library('DBI') library("RMySQL") # 本地数据库 sqlLocalConn <- dbConnect(MySQL(), user = 'root', password = '123456', dbname = 'test', host = 'localhost', port = 3306) # 远程服务器 sqlRemoteCon <- dbConnect(MySQL(), user = 'root', password = '123456', dbname = 'test', host = 'IP', port = 3306)

杂项

因子

因子: 对字符串向量的因子化可以提高 table 函数的计算效率

status <- c('poor', 'improved', 'excellent') status <- factor(status, ordered = TRUE, levels=c('poor', 'improved', 'excellent')) X <- 1:10000 my_inter <- 4500 X <- factor(X > my_inter, labels = LETTERS[1:2]) table(X) barplot(table(X))

image.png

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...