R 语言基础-读取数据
键盘录入
user <- data.frame(name=character(0), age=numeric(0), gender=character(0))
user <- edit(user)
user$name
输出结果:
# user$name
[1] Tom Jerry <NA>
Levels: Tom Jerry
自带数据集
head(iris)
输出: 数据前 6 行
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
class(iris)
输出: 当前类
[1] "data.frame"
[1] table(iris$Sepal.Length)
CSV 文件
student <- read.table('./dataset/student.csv', head=TRUE, sep=',')
student[, c('语文', '数学')]
student$语文
student[1]
Excel 文件
安装并引入 RODBC 包
install.packages('RODBC')
library('RODBC')
读取操作:
odbcCon <- odbcConnectExcel('./dataset/student.xls')
sqlFetch(odbcCon, 'Sheet1')
连接数据库
这里以 MySQL5 为例
安装 RMySQL 和 DPI 包
install.packages('RMySQL')
install.packages('DPI')
连接 MySQL
library('DBI')
library("RMySQL")
# 本地数据库
sqlLocalConn <- dbConnect(MySQL(), user = 'root', password = '123456',
dbname = 'test', host = 'localhost', port = 3306)
# 远程服务器
sqlRemoteCon <- dbConnect(MySQL(), user = 'root', password = '123456',
dbname = 'test', host = 'IP', port = 3306)
杂项
因子
因子: 对字符串向量的因子化可以提高 table 函数的计算效率
status <- c('poor', 'improved', 'excellent')
status <- factor(status, ordered = TRUE, levels=c('poor', 'improved', 'excellent'))
X <- 1:10000
my_inter <- 4500
X <- factor(X > my_inter, labels = LETTERS[1:2])
table(X)
barplot(table(X))
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于