作者简介
Randal E. Bryant,1981 年于麻省理工学院获得计算机博士学位,1984 年至今一直任教于卡内基-梅隆大学。现任卡内基-梅隆大学计算机科学学院院长、教授,同时还受邀任教于电子和计算机工程系。他从事本科生和研究生计算机系统方面课程的教学近 40 年。他和 O’Hallaron 教授一起在卡内基梅隆大学开设了 15-213 课程“计算机系统导论”,那便是本书的基础。他还是 ACM 院士、IEEE 院士、美国国家工程院院士和美国人文与科学研究院院士。其研究成果被 Intel、IBM、Fujitsu 和 Microsoft 等主要计算机制造商使用,他还因研究获得过 Semiconductor Research Corporation、ACM、IEEE 颁发的多项大奖。
David R. O’Hallaron 卡内基梅隆大学电子和计算机工程系教授。在弗吉尼亚大学(University of Virginia)获得计算机科学的博士学位,2007 年-2010 年为 Intel 匹兹堡实验室主任。他教授本科生和研究生的计算机系统方面的课程已有 20 余年,并和 Bryant 教授一起开设了“计算机系统导论”课程。曾获得 CMU 计算机学院颁发的 Herbert Simon 杰出教学奖。他主要从事计算机系统领域的研究,与 Quake 项目成员一起获得过高性能计算领域中的*高国际奖项——Gordon Bell 奖。他目前的工作重点是研究自动分级(autograding)概念,即评价其他程序质量的程序
目录
出版者的话
中文版序一
中文版序二
译者序
前言
关于作者
第 1 章 计算机系统漫游 1
1.1 信息就是位 + 上下文 1
1.2 程序被其他程序翻译成不同的格式 3
1.3 了解编译系统如何工作是大有益处的 4
1.4 处理器读并解释储存在内存中的指令 5
1.4.1 系统的硬件组成 5
1.4.2 运行 hello 程序 7
1.5 高速缓存至关重要 9
1.6 存储设备形成层次结构 9
1.7 操作系统管理硬件 10
1.7.1 进程 11
1.7.2 线程 12
1.7.3 虚拟内存 12
1.7.4 文件 14
1.8 系统之间利用网络通信 14
1.9 重要主题 16
1.9.1 Amdahl 定律 16
1.9.2 并发和并行 17
1.9.3 计算机系统中抽象的重要性 19
1.10 小结 20
参考文献说明 20
练习题答案 20
第一部分
程序结构和执行
第 2 章 信息的表示和处理 22
2.1 信息存储 24
2.1.1 十六进制表示法 25
2.1.2 字数据大小 27
2.1.3 寻址和字节顺序 29
2.1.4 表示字符串 34
2.1.5 表示代码 34
2.1.6 布尔代数简介 35
2.1.7 C 语言中的位级运算 37
2.1.8 C 语言中的逻辑运算 39
2.1.9 C 语言中的移位运算 40
2.2 整数表示 41
2.2.1 整型数据类型 42
2.2.2 无符号数的编码 43
2.2.3 补码编码 44
2.2.4 有符号数和无符号数之间的转换 49
2.2.5 C 语言中的有符号数与无符号数 52
2.2.6 扩展一个数字的位表示 54
2.2.7 截断数字 56
2.2.8 关于有符号数与无符号数的建议 58
2.3 整数运算 60
2.3.1 无符号加法 60
2.3.2 补码加法 62
2.3.3 补码的非 66
2.3.4 无符号乘法 67
2.3.5 补码乘法 67
2.3.6 乘以常数 70
2.3.7 除以 2 的幂 71
2.3.8 关于整数运算的最后思考 74
2.4 浮点数 75
2.4.1 二进制小数 76
2.4.2 IEEE 浮点表示 78
2.4.3 数字示例 79
2.4.4 舍入 83
2.4.5 浮点运算 85
2.4.6 C 语言中的浮点数 86
2.5 小结 87
参考文献说明 88
家庭作业 88
练习题答案 97
第 3 章 程序的机器级表示 109
3.1 历史观点 110
3.2 程序编码 113
3.2.1 机器级代码 113
3.2.2 代码示例 114
3.2.3 关于格式的注解 117
3.3 数据格式 119
3.4 访问信息 119
3.4.1 操作数指示符 121
3.4.2 数据传送指令 122
3.4.3 数据传送示例 125
3.4.4 压入和弹出栈数据 127
3.5 算术和逻辑操作 128
3.5.1 加载有效地址 129
3.5.2 一元和二元操作 130
3.5.3 移位操作 131
3.5.4 讨论 131
3.5.5 特殊的算术操作 133
3.6 控制 135
3.6.1 条件码 135
3.6.2 访问条件码 136
3.6.3 跳转指令 138
3.6.4 跳转指令的编码 139
3.6.5 用条件控制来实现条件分支…141
3.6.6 用条件传送来实现条件分支…145
3.6.7 循环 149
3.6.8 switch 语句 159
3.7 过程 164
3.7.1 运行时栈 164
3.7.2 转移控制 165
3.7.3 数据传送 168
3.7.4 栈上的局部存储 170
3.7.5 寄存器中的局部存储空间 172
3.7.6 递归过程 174
3.8 数组分配和访问 176
3.8.1 基本原则 176
3.8.2 指针运算 177
3.8.3 嵌套的数组 178
3.8.4 定长数组 179
3.8.5 变长数组 181
3.9 异质的数据结构 183
3.9.1 结构 183
3.9.2 联合 186
3.9.3 数据对齐 189
3.10 在机器级程序中将控制与数据结合起来 192
3.10.1 理解指针 192
3.10.2 应用:使用 GDB 调试器 193
3.10.3 内存越界引用和缓冲区溢出 194
3.10.4 对抗缓冲区溢出攻击 198
3.10.5 支持变长栈帧 201
3.11 浮点代码 204
3.11.1 浮点传送和转换操作 205
3.11.2 过程中的浮点代码 209
3.11.3 浮点运算操作 210
3.11.4 定义和使用浮点常数 212
3.11.5 在浮点代码中使用位级操作 212
3.11.6 浮点比较操作 213
3.11.7 对浮点代码的观察结论 215
3.12 小结 216
参考文献说明 216
家庭作业 216
练习题答案 226
第 4 章 处理器体系结构 243
4.1 Y86-64 指令集体系结构 245
4.1.1 程序员可见的状态 245
4.1.2 Y86-64 指令 245
4.1.3 指令编码 246
4.1.4 Y86-64 异常 250
4.1.5 Y86-64 程序 251
4.1.6 一些 Y86-64 指令的详情 255
4.2 逻辑设计和硬件控制语言 HCL256
4.2.1 逻辑门 257
4.2.2 组合电路和 HCL 布尔表达式 257
4.2.3 字级的组合电路和 HCL 整数表达式 258
4.2.4 集合关系 261
4.2.5 存储器和时钟 262
4.3 Y86-64 的顺序实现 264
4.3.1 将处理组织成阶段 264
4.3.2 SEQ 硬件结构 272
4.3.3 SEQ 的时序 274
4.3.4 SEQ 阶段的实现 277
4.4 流水线的通用原理 282
4.4.1 计算流水线 282
4.4.2 流水线操作的详细说明 284
4.4.3 流水线的局限性 284
4.4.4 带反馈的流水线系统 287
4.5 Y86-64 的流水线实现 288
4.5.1 SEQ+:重新安排计算阶段 288
4.5.2 插入流水线寄存器 289
4.5.3 对信号进行重新排列和标号 292
4.5.4 预测下一个 PC293
4.5.5 流水线冒险 295
4.5.6 异常处理 306
4.5.7 PIPE 各阶段的实现 308
4.5.8 流水线控制逻辑 314
4.5.9 性能分析 322
4.5.10 未完成的工作 323
4.6 小结 325
参考文献说明 326
家庭作业 327
练习题答案 331
第 5 章 优化程序性能 341
5.1 优化编译器的能力和局限性 342
5.2 表示程序性能 345
5.3 程序示例 347
5.4 消除循环的低效率 350
5.5 减少过程调用 353
5.6 消除不必要的内存引用 354
5.7 理解现代处理器 357
5.7.1 整体操作 357
5.7.2 功能单元的性能 361
5.7.3 处理器操作的抽象模型 362
5.8 循环展开 366
5.9 提高并行性 369
5.9.1 多个累积变量 370
5.9.2 重新结合变换 373
5.10 优化合并代码的结果小结 377
5.11 一些限制因素 378
5.11.1 寄存器溢出 378
5.11.2 分支预测和预测错误处罚 379
5.12 理解内存性能 382
5.12.1 加载的性能 382
5.12.2 存储的性能 383
5.13 应用:性能提高技术 387
5.14 确认和消除性能瓶颈 388
5.14.1 程序剖析 388
5.14.2 使用剖析程序来指导优化 390
5.15 小结 392
参考文献说明 393
家庭作业 393
练习题答案 395
第 6 章 存储器层次结构 399
6.1 存储技术 399
6.1.1 随机访问存储器 400
6.1.2 磁盘存储 406
6.1.3 固态硬盘 414
6.1.4 存储技术趋势 415
6.2 局部性 418
6.2.1 对程序数据引用的局部性 418
6.2.2 取指令的局部性 419
6.2.3 局部性小结 420
6.3 存储器层次结构 421
6.3.1 存储器层次结构中的缓存 422
6.3.2 存储器层次结构概念小结 424
6.4 高速缓存存储器 425
6.4.1 通用的高速缓存存储器组织结构 425
6.4.2 直接映射高速缓存 427
6.4.3 组相联高速缓存 433
6.4.4 全相联高速缓存 434
6.4.5 有关写的问题 437
6.4.6 一个真实的高速缓存层次结构的解剖 438
6.4.7 高速缓存参数的性能影响 439
6.5 编写高速缓存友好的代码 440
6.6 综合:高速缓存对程序性能的影响 444
6.6.1 存储器山 444
6.6.2 重新排列循环以提高空间局部性 447
6.6.3 在程序中利用局部性 450
6.7 小结 450
参考文献说明 451
家庭作业 451
练习题答案 459
第二部分
在系统上运行程序
第 7 章 链接 464
7.1 编译器驱动程序 465
7.2 静态链接 466
7.3 目标文件 466
7.4 可重定位目标文件 467
7.5 符号和符号表 468
7.6 符号解析 470
7.6.1 链接器如何解析多重定义的全局符号 471
7.6.2 与静态库链接 475
7.6.3 链接器如何使用静态库来解析引用 477
7.7 重定位 478
7.7.1 重定位条目 479
7.7.2 重定位符号引用 479
7.8 可执行目标文件 483
7.9 加载可执行目标文件 484
7.10 动态链接共享库 485
7.11 从应用程序中加载和链接共享库 487
7.12 位置无关代码 489
7.13 库打桩机制 492
7.13.1 编译时打桩 492
7.13.2 链接时打桩 492
7.13.3 运行时打桩 494
7.14 处理目标文件的工具 496
7.15 小结 496
参考文献说明 497
家庭作业 497
练习题答案 499
第 8 章 异常控制流 501
8.1 异常 502
8.1.1 异常处理 503
8.1.2 异常的类别 504
8.1.3 Linux/x86-64 系统中的异常 505
8.2 进程 508
8.2.1 逻辑控制流 508
8.2.2 并发流 509
8.2.3 私有地址空间 509
8.2.4 用户模式和内核模式 510
8.2.5 上下文切换 511
8.3 系统调用错误处理 512
8.4 进程控制 513
8.4.1 获取进程 ID513
8.4.2 创建和终止进程 513
8.4.3 回收子进程 516
8.4.4 让进程休眠 521
8.4.5 加载并运行程序 521
8.4.6 利用 fork 和 execve 运行程序 524
8.5 信号 526
8.5.1 信号术语 527
8.5.2 发送信号 528
8.5.3 接收信号 531
8.5.4 阻塞和解除阻塞信号 532
8.5.5 编写信号处理程序 533
8.5.6 同步流以避免讨厌的并发错误 540
8.5.7 显式地等待信号 543
8.6 非本地跳转 546
8.7 操作进程的工具 550
8.8 小结 550
参考文献说明 550
家庭作业 550
练习题答案 556
第 9 章 虚拟内存 559
9.1 物理和虚拟寻址 560
9.2 地址空间 560
9.3 虚拟内存作为缓存的工具 561
9.3.1 DRAM 缓存的组织结构 562
9.3.2 页表 562
9.3.3 页命中 563
9.3.4 缺页 564
9.3.5 分配页面 565
9.3.6 又是局部性救了我们 565
9.4 虚拟内存作为内存管理的工具 565
9.5 虚拟内存作为内存保护的工具 567
9.6 地址翻译 567
9.6.1 结合高速缓存和虚拟内存 570
9.6.2 利用 TLB 加速地址翻译 570
9.6.3 多级页表 571
9.6.4 综合:端到端的地址翻译 573
9.7 案例研究:Intel Core i7/Linux 内存系统 576
9.7.1 Core i7 地址翻译 576
9.7.2 Linux 虚拟内存系统 580
9.8 内存映射 582
9.8.1 再看共享对象 583
9.8.2 再看 fork 函数 584
9.8.3 再看 execve 函数 584
9.8.4 使用 mmap 函数的用户级内存映射 585
9.9 动态内存分配 587
9.9.1 malloc 和 free 函数 587
9.9.2 为什么要使用动态内存分配 589
9.9.3 分配器的要求和目标 590
9.9.4 碎片 591
9.9.5 实现问题 592
9.9.6 隐式空闲链表 592
9.9.7 放置已分配的块 593
9.9.8 分割空闲块 594
9.9.9 获取额外的堆内存 594
9.9.10 合并空闲块 594
9.9.11 带边界标记的合并 595
9.9.12 综合:实现一个简单的分配器 597
9.9.13 显式空闲链表 603
9.9.14 分离的空闲链表 604
9.10 垃圾收集 605
9.10.1 垃圾收集器的基本知识 606
9.10.2 Mark&Sweep 垃圾收集器 607
9.10.3 C 程序的保守 Mark&Sweep608
9.11 C 程序中常见的与内存有关的错误 609
9.11.1 间接引用坏指针 609
9.11.2 读未初始化的内存 609
9.11.3 允许栈缓冲区溢出 610
9.11.4 假设指针和它们指向的对象是相同大小的 610
9.11.5 造成错位错误 611
9.11.6 引用指针,而不是它所指向的对象 611
9.11.7 误解指针运算 611
9.11.8 引用不存在的变量 612
9.11.9 引用空闲堆块中的数据 612
9.11.10 引起内存泄漏 613
9.12 小结 613
参考文献说明 613
家庭作业 614
练习题答案 617
第三部分
程序间的交互和通信
第 10 章 系统级 I/O622 10.1 Unix I/O622
10.2 文件 623
10.3 打开和关闭文件 624
10.4 读和写文件 625
10.5 用 RIO 包健壮地读写 626
10.5.1 RIO 的无缓冲的输入输出函数 627
10.5.2 RIO 的带缓冲的输入函数 627
10.6 读取文件元数据 632
10.7 读取目录内容 633
10.8 共享文件 634
10.9 I/O 重定向 637
10.10 标准 I/O638
10.11 综合:我该使用哪些 I/O 函数?638
10.12 小结 640
参考文献说明 640
家庭作业 640
练习题答案 641
第 11 章 网络编程 642
11.1 客户端服务器编程模型 642
11.2 网络 643
11.3 全球 IP 因特网 646
11.3.1 IP 地址 647
11.3.2 因特网域名 649
11.3.3 因特网连接 651
11.4 套接字接口 652
11.4.1 套接字地址结构 653
11.4.2 socket 函数 654
11.4.3 connect 函数 654
11.4.4 bind 函数 654
11.4.5 listen 函数 655
11.4.6 accept 函数 655
11.4.7 主机和服务的转换 656
11.4.8 套接字接口的辅助函数 660
11.4.9 echo 客户端和服务器的示例 662
11.5 Web 服务器 665
11.5.1 Web 基础 665
11.5.2 Web 内容 666
11.5.3 HTTP 事务 667
11.5.4 服务动态内容 669
11.6 综合:TINY Web 服务器 671
11.7 小结 678
参考文献说明 678
家庭作业 678
练习题答案 679
第 12 章 并发编程 681
12.1 基于进程的并发编程 682
12.2 基于 I/O 多路复用的并发编程 684
12.3 基于线程的并发编程 691
12.4 多线程程序中的共享变量 696
12.5 用信号量同步线程 698
12.6 使用线程提高并行性 710
12.7 其他并发问题 716
12.8 小结 722
参考文献说明 723
家庭作业 723
练习题答案 726
附录 A 错误处理 729
参考文献 733
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于