打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
计算机系统知识(三)
计算机系统知识(三)
2007-10-08 21:29
五、指令流水线
1、指令流水线基本概念
      指令流水线的概念就是将一条指令分解成一连串执行的子过程,在CPU中变一条指令的串行执行子过程为若干条指令的子过程在CPU中重叠执行,这就是指令流水线的思路。如果能做到每条指令均分解为m个子过程,且每个子过程的执行时间都一样,则利用指令流水线可将一条指令的执行时间由原来的T缩短为T/m。
      流水线技术是将一个重复的时序分解成若干个子过程,而每一个子过程都可有效地在其专用功能段上与其他子过程同时执行。
2、流水技术的特点
        流水线可分成若干个相互联系的子过程;
        实现子过程的功能所需时间尽可能相等;
        形成流水处理需要一段准备时间(流水建立时间);
        指令流发生不能顺序执行时,会使流水过程中断,再形成流水过程则需要时间。
3、流水结构的分类
      按完成的功能分
         单功能流水线:只完成一种固定功能的流水线。如只能实现浮点加;
         多功能流水线:同一流水线上可有多种连接方式来实现多种功能。
        按同一时间内各段之间的连接方式分类
         静态流水线:任一时间流水线上的所有功能块只能按同一种运算的连接方式工作;
         动态流水线:同一时间流水线上的所有功能块可按不同的运算连接方式工作。
     按数据表示分类。
         标量流水处理机:只能对标量数据进行流水处理;
         向量流水处理机:它具有向量指令,可对向量的各元素进行流水处理。
4、流水线处理机的主要指标
   吞吐率
     是指单位时间里流水线处理机流出的结果数。如果各个子过程所需要的时间分别为△t1、△t2、…△tn,时钟周期应当为max{△t1、△t2、…△tn} 则流水线的最大吞吐率
     TPmax=1/ max{△t1、△t2、…△tn};
5、效率
      是指流水线中设备的实际使用时间占整个运行时间之比,也称流水线设备的时间利用率。
例题(源自2004年网络工程师下半年上午试题)
     若指令流水线把一条指令分为取指、分析和执行三部分,且三部分的时间分别是t取指=2ns,t分析=2ns,t执行=1ns。则100条指令全部执行完毕需___1___ns。
      A. 163         B. 183        C. 193          D. 203
         解答:D
         试题分析:
     本题的考点是,流水线的时间分析。根据流水线的特点和效率,流水线的建立时间(即得到第一条指令结果)T0=5ns,由于MAX{取指,分析,执行}=2ns,则流水建立后每2ns就会得到一个指令结果,共有T1=99×2=198ns。则100条指令全部执行完毕需要的时间T=T0+T1=5+198=203ns。
例题(源自2001年高级程序员上午试题)
     设某流水线计算机主存的读/写时间为100ns,有一个指令和数据合一的Cache,已知该 Cache的读/写时间为lOns,取指令的命中率为 98%,取数的命中率为95%。在执行某类程序时,约有1/5指令需要存/取一个操作数。假设指令流水线在任何时候都不阻塞,则设置Cache后,每条指令的平均访存时间约为___1___。
A. 12ns    B. 15ns      C. 18 ns     D. 120ns
         解答:   B
         试题分析:
          本题的考点是,流水线型计算机流水结构和Cache的访问命中率的计算。具体的计算过程如下:1*(10*98%+100*2%)+(1/5)*(10*95%+100*5%)=14.7ns;
六、并行处理技术
1并行性概念
     在解题中具有可以同时进行运算或操作的特性,称为并行性。就是说,只要在同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作,在时间上重叠,都体现了并行性。
     所以并行性包括两个方面:同时性和并发性。
     同时性(Simultaneity)-是指两个或两个以上的事件在同一时刻发生。
     并发性(Concurrency)-指两个或两个以上的事件在同一时间间隔内连续发生。
      充分利用并行性实现计算机的并行处理,可以提高计算机的处理速度。
2、发并行性的途径
     开发并行性的途径有三种,时间重叠、资源重复、资源共享。
        时间重叠:
是在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,加快硬件周转来赢得速度。
        资源重复:
是在并行性概念中引入空间因素,通过重复设置硬件资源来提高可靠性或性能。
        资源共享:
是用软件的方法让多个用户按一定时间顺序轮流使用同一套资源来提高其利用率,相应地也就提高了系统的性能。
3、计算机系统分类
     1966年,弗林(Flynn)提出按指令流和数据流的多倍性对计算机系统分类。分为四类:
         SISD(Single Instruction Single Data Stream)
单指令流单数据流,是传统的单处理器计算机。
        SIMD(Single Instruction Multiple Data Stream)
单指令流多数据流,具有代表性的是阵列处理机和相联处理机
        MISD(Multiple Instruction Single Data Stream)
多指令流单数据流,这类系统很少见
        MIMD(Multiple Instruction Multiple Data Stream)
     多指令流多数据流,能实现作业、任务、指令、数组各级全面并行的多机系统。
      此处,指令流是指机器执行的指令系列;数据流是指由指令流调用的数据序列,包括输入数据和中间结果;多倍性是指在系统性能瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。
4、多处理机
      共享一个主存储器和所有的外部设备。属于多指令流多数据流计算机。多处理机之间的互联,要满足高频带、低成本、连接方式的多样性以及在不规则通信情况下连接的无冲突性。这种互联决定了多处理机的执行效率。多处理机系统,结构灵活,程序并行,并行任务派生,进程同步。
多处理机按耦合程度分类:
      紧耦合多处理机:
     是通过共享主存实现处理机间通讯的,其通讯速率受限于主频宽度。
      松耦合多处理机:
     松耦合多处理机中,每台处理机都有一个容量较大的局部存储器,用于存储经常用的指令和数据,以减少紧耦合多处理机中存在的访主存冲突。不同处理机间通过通道互连实现通讯,以共享某些外设;或者通过消息系统MTS(Message Transfer System)来交换信息。
     按照机间的互联方式,有如下四种多处理机结构:
       总线结构:
     总线结构是一种最简单的结构形式,它把处理机与I/O之间的通信方式引入到处理机中。总线结构中有单总线结构、多总线结构、分级式总线、环式总线等多种。
     交叉开关结构:
交叉开关结构是设置一组纵横开关阵列,把横向的处理机P及I/0通道与纵向的存储器M连接起来。
      多端口存储器结构:
      在多端口存储器结构中,将多个多端口存储器的对应端口连在一起,每一个端口负责一个处理机P及I/0通道的访问存储器的要求。
       开关枢纽式结构:
      在开关枢纽式结构中,有多个输入端和多个输出端,在它们之间切换,使输入端有选择地与输出端相连。因为有多个输入端,所以存在互联要求上的冲突。为此加入一个具有分解冲突的部件,称为仲裁单元。仲裁单元与在一个输入端和多个输出端间进行转换的开关单元一起构成一个基本的开关枢纽。任何互联网络都是由一个或多个开关枢纽组成的。
5、并行处理机
     并行处理机与采用流水结构的单机系统都是单指令流多数据流计算机,但它们也有区别,并行处理机采用资源重复技术,而采用流水结构的单机系统则采用时间重叠技术。
      并行处理机有两种典型结构:具有分布存储器的并行处理机结构和具有共享存储器的并行处理机结构。这两种结构的共同特点是在整个系统中设置多个处理单元,各个处理单元按照一定的连接方式交换信息,在统一的控制部件作用下,各自对分配来的数据并行地完成同一条指令所规定的操作。
      并行处理机的基本原理:并行处理机又称为阵列处理机,它是在单一控制部件控制下的由多个处理单元构成的阵列。并行处理机使用按地址访问的随机存储器(RAM),以SIMD方式工作,主要用于大量高速向量或矩阵运算等领域。
      多个任务并行执行的并行处理机有两种基本结构类型:采用分布式存储器的多处理机并行处理结构和采用集中式共享存储器的多处理机并行处理结构。
      在分布式存储器的多处理机并行处理结构中,每一个处理器都有自己局部的存储器,只要控制部件将并行处理的程序分配给各处理机,它们便能并行处理,各自从自己的局部存储器中取得信息。而共享存储多处理机结构中的存储器是集中共享的,由于多个处理机共享,在各处理机访问共享存储器时会发生竞争,因此,尽可能避免竞争的发生需要采取措施。
流水线向量处理机是用于指令并行执行而不是任务并行,而且流水线向量处理机并不被理解为多处理机。堆栈处理机用于特别的计算或用作外设的数据读写。这两种结构均不适于多个任务的并行执行。
      综上所述,最适合于多个任务并行执行的体系结构是分布存储多处理机结构。
例题
     利用并行处理技术可以缩短计算机的处理时间,所谓并行性是指___1___。可以采用多种措施来提高计算机系统的并行性,它们可分成三类,即___2___。提供专门用途的一类并行处理机(亦称阵列处理机)以___3___方式工作,它适用于___4___。多处理机是目前较高性能计算机的基本结,它的并行任务的派生是___5___。
1:A. 多道程序工作                    B. 多用户工作
     C. 非单指令流单数据流方式工作      D. 在同一时间完成两种或两种以上工作
2:A. 多处理机,多级存储器和互连网络
    B. 流水结构,高速缓存和精简指令集
    C. 微指令,虚拟存储和I/O通道
    D. 资源重复,资源共享和时间重叠。
3:A. SISD            B. SIMD           C. MISD           D. MB4D
4:A. 事务处理        B. 工业控制       C. 矩阵运算       D. 大量浮点计算
5:A. 需要专门的指令来表示程序中并发关系和控制并发执行
    B. 靠指令本身就可以启动多个处理单元并行工作
    C. 只执行没有并发约束关系的程序
    D. 并行执行,事后再用专门程序去解决并法约束
       解答:1.D     2.D     3.B     4.C     5.A
七、寻址方式
     计算机系统采用不同的寻址方式的目的就是要缩短指令的长度、扩大寻址空间,从而提高编程的灵活性。这也是CISC计算机的一个主要特征。而在RISC计算机中采用的是定长的指令格式。在本题中的寻址方式中,取得操作数最慢的是存储器间接寻址。
     当采用地址指定方式时,形成操作数或指令地址的方式,称为寻址方式。常用的寻址方式有立即数寻址、直接寻址、间接寻址、寄存器寻址、基址寻址、变址寻址、相对寻址。        
     寻址方式分为两类,既指令寻址方式和数据寻址方式,前者比较简单,后者比较复杂。
       指令的寻址方式
     一种是顺序寻址方式,另一种是跳跃寻址方式。
       操作数寻址方式
形成操作数的有效地址的方法,称为操作数的寻址方式。
       立即寻址特点是:指令的地址字段指出的不是操作数的地址,而直接是操作数本身。
       直接寻址特点是:在指令格式的地址字段中直接指出操作数在内存的地址D。
       间接寻址特点是:指令地址字段中的形式地址D不是操作数的真正地址,而是操作数地址的指示器,D单元的内容才是操作数的有效地址。
       寄存器寻址方式和寄存器间接寻址方式:寄存器间接寻址方式与寄存器寻址方式的区别在于:指令格式中的寄存器内容不是操作数,而是操作数的地址,该地址指明的操作数在内存中。
       相对寻址方式:相对寻址是把程序计数器PC的内容加上指令格式中的形式地址D而形成操作数的有效地址。程序计数器的内容就是当前指令的地址。
       基址寻址方式:将CPU中基址寄存器的内容加上指令格式中的形式地址而形成操作数的有效地址。它的优点是可以扩大寻址能力。
      变址寻址方式:变址寻址方式与基址寻址方式计算有效地址的方法很相似,它把CPU中某个变址寄存器的内容与偏移量D相加来形成操作数有效地址。但使用变址寻址方式的目的不在于扩大寻址空间,而在于实现程序块的规律变化。
       块寻址方式:块寻址方式经常用在输入输出指令中,以实现外存储器或外围设备同内存之间的数据块传送。
       段寻址方式:这种寻址方式的实质还是基址寻址,方法上采用段寄存器数据自动左移若干位,然后与偏移量相加,进而形成所需的内存地址。
       寻址方式比较:
       间接慢,直接快
       内存慢,寄存器快,立即数更快
       要运算的慢,不需运算的快
       间接的复杂,直接的简单
       直接的死板,间接的灵活
       内存地址长,寄存器地址短
例题
      计算机指令系统中采用不同寻址方式的主要目的是  1  。在下列寻址方式中取得操作数速度最慢的是  2  
     1:   A.可直接访问内存或外存
     B.提供扩展操作码并降低指令译码难度
     C.简化汇编指令的设计
     D.缩短指令长度,扩大寻址空间,提高编程灵活性
     2: A.相对寻址               B.基址寻址
     C.寄存器间接寻址         D.存储器间接寻址
       答案:1.D     2.D
八、CPU与外设之间交换数据的方式
      CPU与外设之间交换数据的方式,主要有程序查询方式、中断方式、直接存储器方式和通道方式。
1、程序查询方式
     这种方式下,CPU通过执行程序查询外设的状态,判断外设是否准备好接受数据或向CPU输入数据,缺点是:CPU大量的时间消耗在查询外设的状态上,降低了CPU的利用率;对外部的突发事件无法做出实时响应。
2、中断方式
     当I/O接口准备好接受数据或准备好向CPU传送数据时,就发出中断信号通知CPU。对终端信号进行确认后,CPU保存正在执行的程序的现场,转而执行提前设置好的I/O中断服务程序,完成一次数据传送的处理。这样,CPU就不需要主动查询外设的状态,在CPU等待数据期间可以执行其他程序,从而提高了CPU的利用率。采用这种方式管理I/O设备,CPU和外设可以并行工作。但这种方式无法满足高速的批量数据传送要求,因而引入了DMA方式。
3、直接存储器存取(Direct Memory Access)
     通过硬件控制实现主存和I/O设备间的直接数据传送,数据的传送过程由DMA控制器(DMAC)进行控制,不需要CPU的干预;在传送过程结束时,DMAC通过中断方式通知CPU进行一些后续处理工作。在数据传送过程中,CPU可以执行其他任务。
4、通道控制方式
     通道是一种专用控制器,它通过执行通道程序进行I/O的操作的管理,为主机与I/O设备提供一种数据传输通道。用通道指令编制的程序存放在存储器中,当需要进行I/O操作是,CPU只要约定格式准备好命令和数据,然后启动通道即可;通道执行相应的通道程序,完成所需要的操作。用通道程序可以完成比较负责的I/O管理和预处理,从而在很大程度上将主机从繁重的I/O管理工作中解脱出来,提高了系统的效率。
例题
     从供选择的答案中,选出应填入下面叙述中____内的最确切的解答。
 I/O 系统主要有三种方式来与主机交换数据,它们是__1__、__2__和__3__。其中__1__主要用软件方法来实现,CPU 的效率低;__2__要有硬件和软件两部分来实现,它利用专门的电路向 CPU 中的控制器发出 I/O 服务请求,控制器则__4__转入执行相应的服务程序;__3__主要由硬件来实现,此时高速外设和内存之间进行数据交换__5__。
供选择的答案
   1: A.程序查询方式       B.读/写文件方式     C.数据库方式      D.客户/服务器方式
   2: A.DMA方式            B.批处理方式        C.中断方式        D.数据通信方式
   3: A.中断方式            B.DMA方式          C.并行方式        D.流水线方式
   4: A.立即                                B.在执行完当前一条指令后   
C.在执行完当前的一段子程序后          D.在询问用户后
   5: A.不通过CPU的控制,不利用系统总线    B.不通过CPU的控制,利用系统总线  
C.通过CPU的控制,不利用系统总线      D.通过CPU的控制,利用系统总线
      解答:1.A     2.C     3.B      4.B      5.B
例题
     从供选择的答案中,选出应填入下面叙述中____内的最确切的解答。
直接存储器访问(DMA)是一种快速传递大量数据常用的技术。工作过程大致如下:
(1)向CPU申请DMA传送;
(2)获CPU允许后,DMA控制器接管_1_的控制权;
(3)在DMA控制器的控制下,在存储器和_2_之间直接进行数据传送,在传送过程中不需要_3_的参与。开始时需提供要传送的数据的_4_和_5_。
(4)传送结束后,向CPU返回DMA操作完成信号。
     1: A.系统控制台   B.系统总线         C.I/O控制器         D..中央处理器
     2: A.外部设备         B.运算器       C.缓存              D.中央处理器
     3: A.外部设备         B.系统时钟          C.系统总线          D.中央处理器
     4: A.结束地址         B.起始地址          C.设备类型          D.数据速率
     5: A.结束地址         B.设备类型          C.数据长度          D.数据速率
        解答:1.B    2.A    3.D     4.B      5.B
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【信息技术篇】并行计算及其发展
DSP复习题www.armdsp.net
大数据的核心技术
F2812寻址方式 F2812指令流水线
通俗易懂告诉你CPU/GPU是什么?
深入浅出之CPU原理
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服