R 语言基础 - 读取数据

R 语言基础-读取数据

键盘录入

user <- data.frame(name=character(0), age=numeric(0), gender=character(0))
user <- edit(user)
user$name

image.png

输出结果:

# user$name
[1] Tom   Jerry <NA> 
Levels: Tom Jerry

自带数据集

head(iris)

输出: 数据前 6 行

 Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
class(iris)

输出: 当前类

[1] "data.frame"
[1] table(iris$Sepal.Length)

image.png

CSV 文件

student <- read.table('./dataset/student.csv', head=TRUE, sep=',')
student[, c('语文', '数学')]
student$语文
student[1]

image.png

Excel 文件

安装并引入 RODBC 包

install.packages('RODBC')
library('RODBC')

读取操作:

odbcCon <- odbcConnectExcel('./dataset/student.xls')
sqlFetch(odbcCon, 'Sheet1')

连接数据库

这里以 MySQL5 为例

安装 RMySQL 和 DPI 包

install.packages('RMySQL')
install.packages('DPI')

连接 MySQL

library('DBI')
library("RMySQL")

# 本地数据库
sqlLocalConn <- dbConnect(MySQL(), user = 'root', password = '123456',
                          dbname = 'test', host = 'localhost', port = 3306)

# 远程服务器
sqlRemoteCon <- dbConnect(MySQL(), user = 'root', password = '123456',
                          dbname = 'test', host = 'IP', port = 3306)

杂项

因子

因子: 对字符串向量的因子化可以提高 table 函数的计算效率

status <- c('poor', 'improved', 'excellent')
status <- factor(status, ordered = TRUE, levels=c('poor', 'improved', 'excellent'))

X <- 1:10000
my_inter <- 4500
X <- factor(X > my_inter, labels = LETTERS[1:2])
table(X)
barplot(table(X))

image.png

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
融合块、大纲和双向链接
构建你永恒的数字花园
思源笔记是一款本地优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步