不可磨灭的记忆 CPU 发展史经典回顾
今天,我们可以舒适在坐在电脑前看电影、听音乐,通过互联网寻找资料,
与远方的朋友进行视频聊天,又或者通过电子商务网站购买一本杂志、一款自己
心仪的 MP3 播放器,一切都显得那么随意和悠然自得 。但是大部分人却都没想
过,能够有如此幸福生活,是多少人前赴后继,作出了可歌可泣贡献才得到的。
昨天晚上,一 IT 界著名的朋友跟笔者说“你每天都喝水,那你有没考虑过水
厂和水龙头的关系怎么样的?”。确实,也许并非每个朋友都对 IT 和其中发生的
事情感兴趣,但是曾经发生的事情和有过的经历,却可以让我们 更加珍惜这来
之不易的幸福。了解成功人的历史,更可让我们受益菲浅。
现在就让笔者带大家去回顾一下,这有趣而又激励人心的辉煌历史。
关于 CPU 的基础知识:CPU 的常识
第一篇跟大家介绍的是 PC 里面的心脏:CPU(Central Processing Unit),被称
呼为中心处理器或者 Microprocessor 微处理器。CPU 是计算机的核心,其重要性
好比心脏对于人一样。实际上,处理器的作用和大脑更相似,因为它负责处理、
运算计算机内部的所有数据,而主板芯片组则更像是心脏,它控制着数据的交换。
CPU 的种类决定了你使用的操作系统和相应的软件,CPU 的速度决定了你的计
算机有多强大,当然越快、越新的 CPU 会花掉你更多的钱。
CPU 从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息
的字长,CPU 可以分为:四位微处理器、八位微处理器、十六位微处理器、三
十二位微处理器以及六十四位微处理器等等。
如今,Intel 的 CPU 和其兼容产品统治着微型计算机——PC 的大半江山,但
是除了 Intel 或 AMD 的 CPU,还是你可能听说过的其他一些 CPU,如 HP 的
PA-RISC,IBM 的 Power4 和 Sun 的 UltraSparc 等,只是它们都是精简指令集运算
(RISC)处理器,使用 Unix 的专利操作系统,例如 IBM 的 AIX 和 Sun 的 Solaris
等。
虽然设计方式和工作原理的过程有区别,但不同处理器依然有很多相似之处。
从外表看来,CPU 常常是矩形或正方形的块状物,通过密密麻麻的众多管脚与
主板相连。不过,你看到的不过是 CPU 的外衣——CPU 的封装。而内部,CPU
的核心是一片大小通常不到 1/4 英寸的薄薄的硅晶片(其英文名称为 die,核心)。
在这块小小的硅片上,密布着数以百万计的晶体管,它们好像大脑的神经元,相
互配合协调,完成着各种复杂的运算和操作。
左边是揭了盖可以看到核心的处理器
硅能成为生产 CPU 核心的半导体材料主要是因为其分布的广泛性和价格便
宜。此外,硅可以形成品质极佳的大块晶体,通过切割,得到直径 8 英寸甚至更
大而厚度不足 1 毫米的圆形薄片——晶片(也叫晶圆)。一片晶片可以划分切割成
许多小片,每一小片就是一块单独 CPU 的核心。当然,在切割之前有许多处理
过程要做。
Intel 发布的第一颗处理器 4004 仅仅包含 2000 个晶体管,而目前最新的 Intel
Pentium 8400EE 处理器包含超过 亿个晶体管,集成度提高了十万倍,这可以
说是当今最复杂的集成电路了。与此同时,你会发现单个 CPU 的核心硅片的大
小丝毫没有增大,甚至变得更小了,这就要求不断地改进制造工艺以便能生产出
更精细的电路结构。如今,最新的处理器采用的是 微米技术制造,也就是
常说的 微米线宽。
840EE+HT(左边)65nm(右)
Pentium 840EE 处理器采用 90nm 制程的 Smithfield 核心,每核心 1MB 二级缓存,
800MHZ 的 FSB,支持 EDB 防毒和 EMT64T,可以搭配 64 位 WinXP,90 纳米
制程,206 平方毫米芯片面积, 亿晶体管。Pentium 4 643 ()采用 65nm
工艺的 CedarMill,集成 2MB 二级缓存,单核心,支持 HT、EM64T,VT。
需要说明的是,线宽是指芯片上的最基本功能单元——门电路的宽度,因为
实际上门电路之间连线的宽度同门电路的宽度相同,所以线宽可以描述制造工艺。
缩小线宽意味着晶体管可以做得更小、更密集,可以降低芯片功耗,系统更稳定,
CPU 得以运行在更高的频率下,而且在相同的芯片复杂程度下可使用更小的晶
圆,于是成本降低了。
随着线宽的不断降低,以往芯片内部使用的铝连线的导电性能将不敷使用,
AMD 在其 K7 系列开始采用铜连线技术。而现在这一技术已经得到了广泛应用。
关于 CPU 的基础知识:CPU 的制造过程
切割晶圆
所谓的“切割晶圆”也就是用机器从单晶硅棒上切割下一片事先确定规格的硅
晶片,并将其划分成多个细小的区域,每个区域都将成为一个 CPU 的内核(Die)。
2.影印(Photolithography)
在经过热处理得到的硅氧化物层上面涂敷一种光阻(Photoresist)物质,紫外线通
过印制着 CPU 复杂电路结构图样的模板照射硅基片,被紫外线照射的地方光阻
物质溶解。
3.蚀刻(Etching)
用溶剂将被紫外线照射过的光阻物清除,然后再采用化学处理方式,把没有
覆盖光阻物质部分的硅氧化物层蚀刻掉。然后把所有光阻物质清除,就得到了有
沟槽的硅基片。
4.分层
为加工新的一层电路,再次生长硅氧化物,然后沉积一层多晶硅,涂敷光阻
物质,重复影印、 蚀刻过程,得到含多晶硅和硅氧化物的沟槽结构。
5.离子注入(IonImplantation)
通过离子轰击,使得暴露的硅基片局部掺杂,从而改变这些区域的导电状态,
形成门电路。接下来的步骤就是不断重复以上的过程。一个完整的 CPU 内核包
含大约 20 层,层间留出窗口,填充金属以保持各层间电路的连接。完成最后的
测试工作后,切割硅片成单个 CPU 核心并进行封装,一个 CPU 便制造出来了。
关于 CPU 的基础知识:CPU 的主要性能指标
主频
即 CPU 的时钟频率(CPU Clock Speed),这是我们最关心的,我们所说的
、 等就是指它,一般说来,主频越高,CPU 的速度就越快,整机
的就越高。不过现在 AMD 都采用了更加模糊的命名方式,企图让消费者淡化以
主频率计算性能的观念。比如 Athlon 3000+,它的频率有可能是 ,也有
可能是 。Intel 则采用了 Pentium 643 这种更易让人眼花缭乱的命名方式,
一般人不查参数,很难记得它的意义。
FSB 前端总线
即 CPU 的外部时钟频率,由电脑主板提供,以前一般是 133MHz,目前 Intel
公司最新的芯片组 i925XE 芯片组使用 1066MHz 的 FSB。
内部缓存(L1 Cache)
封闭在 CPU 芯片内部的高速缓存,用于暂时存储 CPU 运算时的部分指令和
数据,存取速度与 CPU 主频一致,L1 缓存的容量单位一般为 KB。L1 缓存越大,
CPU 工作时与存取速度较慢的 L2 缓存和内存间交换数据的次数越少,相对电脑
的运算速度可以提高。
外部缓存(L2 Cache)
CPU 外部的高速缓存,现在处理器的 L2 Cache 是和 CPU 运行在相同频率下
的(以前 P2 P3 的二级缓存运行在相当于 CPU 频率一半下)。
其它的还有封装技术、接口技术、、制造工艺、指令集等就不再详细解释,
不然就是写书而不是写文章了。不如如果这系列文章可以持续写下去的话,以后
便好好跟大家再交流一下。
远去的历史:微处理器发展的第一阶段
讲完了一些技术的简单内容,现在就带大家去看看 CPU 是怎样从无到有,
并且一步步发展起来的。 根据大家的记忆,笔者把它分为了几个发展阶段。注
意,这并非按照教科书去分,而是我们的记忆。
Intel 公司成立于 1968 年,格鲁夫(左)、诺依斯(中)和摩尔(右)是微电子
业界的梦幻组合
Intel 4004
1971 年 1 月,Intel 公司的霍夫(Marcian )研制成功世界上第一枚 4 位
微处理器芯片 Intel 4004,标志着第一代微处理器问世,微处理器和微机时代从
此开始。因发明微处理器,霍夫被英国《经济学家》杂志列为“二战以来最有影
响力的 7 位科学家”之一。
4004 当时只有 2300 个晶体管,是个四位系统,时钟频率在 108KHz,每秒
执行 6 万条指令( MIPs)。功能比较弱,且计算速度较慢,只能用在 Busicom 计
算器上。
格鲁夫 “只有偏执狂才能生存”
1971 年 11 月,Intel 推出 MCS-4 微型计算机系统(包括 4001 ROM 芯片、4002
RAM 芯片、4003 移位寄存器芯片和 4004 微处理器),其中 4004(上图)包含
2300 个晶体管,尺寸规格为 3mm×4mm,计算性能远远超过当年的 ENIAC,最
初售价为 200 美元。
Intel 8008
1972 年 4 月,霍夫等人开发出第一个 8 位微处理器 Intel 8008。由于 8008 采
用的是 P 沟道 MOS 微处理器,因此仍属第一代微处理器。
Intel 8080 ,第二代微处理器
1973 年 8 月,霍夫等人研制出 8 位微处理器 Intel 8080,以 N 沟道 MOS 电
路取代了 P 沟道,第二代微处理器就此诞生。主频 2MHz 的 8080 芯片运算速度
比 8008 快 10 倍,可存取 64KB 存储器,使用了基于 6 微米技术的 6000 个晶体
管,处理速度为 。
摩尔定律
摩尔预言,晶体管的密度每过 18 个月就会翻一番,这就是著名的摩尔定律。
第一台微型计算机:Altair 8800
1975 年 4 月,MITS 发布第一个通用型 Altair 8800,售价 375 美元,带有 1KB
存储器。这是世界上第一台微型计算机。
1976 年,Intel 发布 8085 处理器
当时,Zilog、Motorola 和 Intel 在微处理器领域三足鼎立。Zilog 公司于 1976
年对 8080 进行扩展,开发 出 Z80 微处理器,广泛用于微型计算机和工业自动控
制设备。直到今天,Z80 仍然是 8 位处理器的巅峰之作,还在各种场合大卖特卖。
CP/M 就是面向其开发的操作系统。许多著名的软件如:WORDSTAR 和 DBASE II
都基于此款处理器。
WordStar
处理程序 WordStar 是当时很受欢迎的应用软件,后来也广泛用于 DOS 平台。
原文地址:
曾经的辉煌代表产品:
Apple Ⅰ
1976 年 3 月,Steve Wozniak 和 Steve Jobs 开发出微型计算机 Apple I,4 月 1
日愚人节这天,两个 Steve 成立了 Apple 计算机公司。
Apple II
1976 年:一些离开了 Motorola 公司的部分工程人员自组成立 MOS
Technology 公司,并且开发出了 6502 处理器。它的位宽为 8bit,频率只有
1MHz,并且无协处理器。但它是 IBM PC 机问世之前世界上最流行的微型计算
机 Apple II(苹果机)的 CPU。Apple II 是第一个带有彩色图形的个人计算机,售价
为 1300 美元。Apple II 及其系列改进机型风靡一时,这使 Apple 成为微型机时代
最成功的计算机公司。
Intel 8086
1978 年 6 月,Intel 推出 的 8086 微处理器,标志着第三代微处理
器问世。它采用 16 位寄存器、16 位数据总线和 29000 个 3 微米技术的晶体管,
售价 360 美元。 不过当时由于 360 美元过于昂贵,大部分人都没有足够的钱购
买使用此芯片的电脑,于是 Intel 在1年之后,推出的8位微处理器8088。
IBM 公司 1981 年生产的第一台电脑就是使用的这种芯片。这也标志着 x86 架构
和 IBM PC 兼容电脑的产生。
发布的时候,8086 的时钟频率有 ,8 和 10MHz 三个版本,包括了具有
300 个操作的指令集。其中 8MHz 版本包含了大约 28,000 个 晶体管,具备
MIPs 的能力。
当 Bill Gates 崭露头角时,昔日校友正在哈佛上二年级
“让每个家庭每张桌子上都放一台电脑。”
1979 年 6 月 1 日,Intel 推出 的准 16 位微处理器 8088,它是 8086
的廉价版本,价格为大众所接受。在性能方面,它在内部以 16 位运行,但支持 8
位数据总线,采用现有的 8 位设备控制芯片,包含 29000 个 3 微米技术的晶体管,
可访问 1MB 内存地址,速度为 。
Intel 8088 电路
同年 9 月,Motorola 推出 M68000 16 位微处理器,它因采用了 68000 个晶
体管而得名。该处理器主要供应 Apple 公司的 Macintosh 和 Atari 的 ST 系列电
脑上。后继版本的处理器,包括 68020 则被使用在 Macintosh II 机型。
Microsoft 的秘密交易
1980 年 10 月,Microsoft 把握了一次绝佳的发展机遇。IBM 在秘密进行代号
为“跳棋计划”的开发项目(第一台 IBM PC)过程中,向 Microsoft 提出采购一套
操作系统。Paul Allen 抓住机会与 Seattle Computer Products 的 Tim Patterson 签约,
向其支付了不到 10 万美元,获得了其 DOS 操作系统的版权并进行了一些修改,
从而做成了与这个神秘客户(IBM)的大买卖。
今天的 Windows 系列操作系统仍然兼容 DOS,这个系统对于老一代电脑用户来
说再熟悉不过了。
IBM PC 创造历史
早在 1980 年 7 月,一个负责“跳棋计划”的 13 人小组秘密来到佛罗里达州波
克罗顿镇的 IBM 研究发展中心,开始开发后来被称为 IBM PC 的产品。一年后
的 8 月 12 日,IBM 公司在纽约宣布第一台 IBM PC 诞生,这个开创计算机历史
新篇章的时刻,迄今正好 25 年。
第一台 IBM PC 采用了主频为 的 Intel 8088,操作系统是 Microsoft
提供的 MS-DOS。IBM 将其命名为“个人电脑(Personal Computer)”,不久“个
人电脑”的缩写“PC”成为所有个人电脑的代名词。IBM 原来预计在一年中售出
241683 台 PC,然而用户的需求被大大低估了,实际上一个月的订货量就超出了
预计。
1981 年:80186 和 80188 发布。这两款微处理器内部均以 16 位工作,在外部输入
输出上 80186 采用 16 位,而 80188 和 8088 一样均是采用 8 位工作。这是一颗性
能介于 8088,80286 之间的的 CPU。但事实上 80186 从来都没有在 PC 中应用,它
仅仅存在于一个小范围的圈子中,作为一个小型的控制器出现,哪怕是今天。从这
个时候起,AMD 公司已经开始生产 80186 CPU 了。
1982 年 2 月 1 日:在 80186 发布后的几周,80286 就发布了。80286 处理器集成
了大约万个晶体管,最大主频为20MHz,采用16位资料总线和24位位址总线。
与 8086 相比,80186/80188 增强了部分软硬件功能 80286 增加了实存(24 位地址)
和虚拟存储器管理,可以在两种不同的模式下工作,一种叫实模式,另一种叫保护
方式。80286 开始正式采用一种被称为 PGA 的正方形包装。
Intel 80386
1985 年 10 月,Intel 推出 16MHz 80386DX 微处理器(最高 33MHz 主频),可
以直接访问 4G 字节的内存,并具有异常处理机制;虚拟 86 模式可以同时模拟多个
8086 处理器来加强多任务处理能力。 80386 的广泛应用,将 PC 机从 16 位时代带
入了 32 位时代。此外它还具有比 80286 更多的指令集。发布时,80386 的最快
速版本的主频为 20MHz,具备 MIPs ,包含 275,000 个晶体管。
当时,IBM 已经收到大量 286 机器的订单,不愿立即转向 386,同时 IBM
担心长期受制于 Intel 芯片,开始暗中开发自己的处理器,所以对是否采用 386
芯片不置可否。Compaq 乘机而上,推出 386 芯片的电脑,迅速占领了市场。
1988 年 6 月 16 日:80386SX 发布,它是 80386DX 的廉价版本,只有 16-bit
总线宽度。
希的记忆:我们曾有过第一次亲密接触
前面的处理器我们都积少接触,接下来的,也许大家就比较清楚了,因为我
们第一次接触的,就是此类处理器。
Intel 486
CPU 更新速度加快,造就了越来越多的兼容机厂商。
1989 年 4 月,Intel 推出 25MHz 486 微处理器。1989 年 5 月 10 日:我们大
家耳熟能详的 80486 芯片由英特尔推出。这款经过四年开发和 3 亿美 元资金投
入的芯片的伟大之处在于它首次实破了 100 万个晶体管的界限,集成了 120 万个
晶体管,使用 1 微米的制造工艺。其实 486 就是 80386+80387 协处理器+8KB 一级
缓存,是超级版本的 386。
Compaq 由于持有大量 386 订单而对采用 Intel 486 犹豫不决,Dell 趁机推出
了自己的 486 整机,并通过直销模式在兼容机市场后来居上。1991 年,25 岁的
Michael Dell 成为《财富》全美 500 家大企业中最年轻的总裁。1995 年,Dell 进
入全球个人电脑 5 强行列。
1991 年 5 月 22 日:80486 DX 的廉价版本 80486 SX 发布,它和 DX 的区
别是没有整合 FPU。
Pentium 浮出水面
1993 年 3 月 22 日:全面超越 486 的新一代 586 CPU 问世,为了摆脱 486 时
代微处理器名称混乱的困扰,英特尔公司把自己的新一代产品命名为 Pentium(奔
腾)以区别 AMD 和 Cyrix 的产品。AMD 和 Cyrix 也分别推出了 K5 和 6x86 微处
理器来对付芯片巨人,但是由于奔腾微处理器的性能最佳,英特尔逐渐占据了大
部分市场。Pentum 处理器的性能接近主要的 RISC CPU 并兼容 80x86,同时继
承了长期积累下来的价值约 500 亿美元的庞大软件资源。
Pentium 最初级的 CPU 是 Pentium 60 和 Pentium 66,分别工作在与系统总线
频率相同的 60MHz 和 66MHz 两种频率下,没有我们现在所说的倍频设置。
1994 年 3 月 7 日:Intel 发布 90 和 100MHz 的 Pentium 处理器
1994 年 10 月 10 日:Intel 发布 75MHz 版本的 Pentium 处理器
1995 年 3 月 27 日:Intel 发布 120MHz 的 Pentium 处理器
1995 年 6 月 1 日:Intel 发布 133MHz 版本 Pentium 处理器
Pentium Pro
Intel 推出 Pentium Pro 微处理器,采用了一种新的总线接口 Socket 8。新的
处理器对多媒体功能提供了很好的支持。
1995 年 11 月 1 日,Intel 推出了 Pentium Pro 处理器。Pentium Pro 的工作频
率有 150/166/180 和 200MHz 四种,都具有 16KB 的一级缓存和 256KB 的二级缓
存。它是基于 Pentium 完全相同的指令集和兼容性,达到了 440 MIPs 的处理能
力和 M 个晶体管。这几乎相当于比 4004 处理器的晶体管提升了 2400 倍。值
得一提的是 Pentium Pro 采用了“PPGA” 封装技术。即一个 256KB 的二级缓存芯
片与 Pentium Pro 芯片封装在一起 ,两个芯片之间用高频宽的内部总线互连,处
理器与高速缓存的连接线路也被安置在该封装中,这样就使高速缓存能更容易地
运行在更高的频率上。
例如 Pentium Pro 200MHz CPU 的 L2 Cache 就是运行在 200MHz,也就是工
作在与处理器相同的频率上,这在当时可以算得上是 CPU 技术的一个创新。
Pentium Pro 的推出,为以后 Intel 推出 PⅡ奠定了基础。
1996 年 1 月 4 日:Intel 发布 150&166 MHz Pentium 处理器,包括了越
个晶体管
1996 年 10 月 6 日: Intel 发布 200MHz Pentium 处理器
Intel Pentium MMX
1997 年 1 月 8 日:Intel 在 1996 年推出的 Pentium 系列的改进版本,内部代
号 P55C,也就是我们平常所说的 Pentium MMX 。Pentium MMX 在原 Pentium
的基础上进行了重大的改进,增加了片内 16KB 数据缓存和 16KB 指令缓存,4
路写缓存以及从 Pentium Pro、Cyrix 而来的分支预测单元和返回堆栈技术,特别
是新增加的 57 条 MMX 多媒体指令。
MMX 技术是 Intel 最新发明的一项多媒体增强指令集技术,它的英文全称可
以翻译成“多媒体扩展指令集”。使得 Pentium MMX 即使在运行非 MMX 优化的
程序时也比同主频的 Pentium CPU 要快的多。57 条 MMX 指令专门用来处理音
频、视频等数据,这些指令可以大大缩短 CPU 在处理多媒体数据时的等待时间,
使 CPU 拥有更强大的数据处理能力。MMX CPU 比普通 CPU 在运行含有 MMX
指令的程序时,处理多媒体的能力提高了 60%左右。MMX 技术开创了 CPU 开
发的新纪元。
Pentium MMX 系列的频率只有三种:166MHz、200MHz、233MHz,一级缓
存从 Pentium 的 16KB 增加到了 32KB,核心电压 ,倍频分别为 、3、
。插槽都是 Socket 7。
与此同时,作为 Intel 的主要竞争对手,AMD 也发布了 AMD-K6-MMX 处
理器,包含相近的指令集,从而导致了一连串的法律纠纷。
1997 年 4 月 7 日 。英特尔发布了 Pentium II 处理器。内部集成了 750 万个
晶体管,并整合了 MMX 指令集技术。此时,英特尔 Pentium II 架构已经从 Socket
7 转成 Slot 1,并首次引入了 封装(Single Edge Contact)技术,将高速缓存与
处理器整合在一块 PCB 板上。Slot 1 的 Pentium II 晶体管数为 900 万,并且具有
两种版本的核心:Klamath 与 Deschutes。
同时代竞争的是 AMD 的 K6II,这时候的口碑也相当不错
1997 年 6 月 2 日: Intel 发布 233MHz Pentium MMX
1998年2月:Intel 发布333MHz Pentium II 处理器,开发代号为Deschutes,
并且首次采用了 微米制造工艺,在低发热量的情况下提供比以前产
品更快的速度。
1999 年 2 月 22 日:AMD 发布 K6-III 400MHz 版本,在一些测试中,它
的性能超越了后来发布的 Intel Pentium III 。它包括了 23M 晶体管,并且
基于 100MHz Spuer socket7 主板,与那些使用 66MHz 总线的芯片相比,
性能的提升是卓越的。
原文地址:
一起走过的日子:淘汰的记忆
以下部分处理器是我们曾经用过的,最后却远远地抛进了淘汰的行列,对于
有两台甚至多台电脑的朋友来说,印象尤其深刻。因为电脑和电视不同,它的特
点是需要我们不断地更新、升级。
当然,目前仍有部分用户还在使用这些产品。
Intel 向网络看齐 ,发布 Pentium III
1999 年 1 月,Intel 推出奔腾 III 处理器,它采用 微米制造工艺,拥有 32K
一级缓存和 512K 二级缓存(运行在芯片核心速度的一半下),包含 MMX 指令
和 Intel 自己的“ 3D”指令 SSE,最初发行的 PIII 有 450 和 500MHz 两种规格,其
系统总线频率为 100MHz。此外其身份代码还可通过 Internet 读取。
Intel 的主要对手之一 AMD 加紧跟进的步伐,于同年 8 月发布 Athlon 处理
器。10 月,在微处理器论坛会议上,Intel 宣布了代号为麦赛德(Merced)的处
理器的正式名称 Itanium(安腾)。
1999 年 10 月,Intel 推出了基于 微米工艺制造的 Pentium III 处理器,
这款 Pentium III 处理器有 256K 在二级高速缓存,代码名为 Coppermine。
Coppermine 以 733MHz 登台。随着工艺尺寸从 微米减少到 微米,不仅
提高了 Pentium III 处理器的时钟速度,也使的 Intel 在技术上能够推出了集成的
二级高速缓存。虽然集成的二级高速缓存只有老式 Pentium III 处理器的一半,但
在处理器全速下运行,性能仍有显著提高。
其后 Intel 推出了 Pentium III Xeon 处理器。作为 Pentium II Xeon 的后继者,
除了在内核架构上采纳全新设计以外,也继承了 Pentium III 处理器新增的 70 条
指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,
Pentium III Xeon 加强了电子商务应用与高阶商务计算的能力。Intel 还将 Xeon 分
为两个部分,低端 Xeon 和高端 Xeon。其中,低端 Xeon 和普通的 Coppermine
一样,仅装备 256KB 二级缓存,并且不支持多处理器。这样低端 Xeon 和普通
的 Pentium III 的性能差距很小,价格也相差不多;而高端 Xeon 还是具有以前的
特征,支持更大的缓存和多处理器。
1999 年 11 月 29 日:AMD 发布了 Athlon 750MHz ,在主频和性能上超
过 Intel 。
2000 年 3 月 6 日 : AMD 发布 Athlon 1GHz
2000 年 3 月 8 日: Intel 限量供应 1GHz Pentium III 处理器
原文地址:
Intel 和 AMD 炽手可热的花旦
接下来为大家介绍的就是目前炽手可热的处理器,Intel 的 Pentium IV 和
AMD Athlon64 。虽然按照发布时间来说,Athlon64 要比 Pentium IV 迟一个时
代(Pentium IV 发布时间是 2000 年 11 月,而 Athlon64 则是 2003 年 9 月),
但 Pentium IV 经过了几年的的换芯,性能也获得了显著提升。
此外在 Intel 和 AMD 的发展版图上来说,它们是竞争对手,而且现在都加
入了 64-bit 和双核等等技术特性,以下对它们进行比较详细的解释。
1、Pentimu 4 技术解释
2000 年 11 月 21 日,Intel 在全球同步发布了其最新一代的微处理器
—Pentium4(奔腾 4)。Pentium4 处理器原始代号为 Willamette,采用 微米
铝导线工艺,配合低温半导体介质(Low-Kdiclcctric)技术制成,是一颗具有超
级深层次管线化架构的处理器。
Pentium 4 处理器最主要的特点就是抛弃了 Intel 沿用了多年的 P6 结构,采
用了新的 NetBurst CPU 结构 。NetBurst 结构具有不少明显的优点:20 段的超
级流水线、高效的乱序执行功能、2 倍速的 ALU、新型的片上缓存、SSE2 指令
扩展集和 400MHz 的前端总线等等
新的处理器系统总线( FSB)
英特尔近来在前端系统总线(FSB)方面一直不敌 AMD:Pentium Ⅱ最高
为 133MHz 的 FSB 和内存频率(外频);而 AMD 雷鸟用的 是 100MHz 的内存
频率(外频)和 266MHz 的 FSB(类似于 CPU 倍频的方式来连接这两个频率)。
Pentium 4 终于有了突破:虽然 Pentium 4 系统总线仅为 100Mhz,并且也
是 64 位数据宽度,但由于利用与 APG4X 相同的原理“四倍泵速”,因此可传输
高达 8 位 * 100 百万次/秒 * 4 = 3,200 MB/秒 的数据传输速度。明显地远超过
AMD 最近公布的 Athlon 总线数据传输速度。 Athlon 总线速度为 133Mhz,64
位、2 倍速,提供 8 位 * 133 百万次/秒 * 2 = 2,133 MB/秒的数据传输率。
这项特色使得 Pentium 4 传输数据到系统的其它部分比目前所有的 x86 处
理器还快,也一并去除了 Pentium III 系统所遭受的瓶颈限制。 不过,如果主存
储器无法提供相对数据传输的话,这么快的处理器总线速度也是英雄无用武之地。
因此,早期此处理器的芯片组 850 就搭配了两条 Rambus 信道并使用昂贵的
RDRAM 内存。这两个 RDRAM 信道能提供与 Pentium 4 系统总线(3,200MB/s)
相同的数据频宽,这样的搭配将是理论上最完美的结合─提供处理器、系统与主
存储器间最高的数据传输率,这也是最明显的优势之一。不过系统的整体系统的
成本将会因为使用较昂贵的 RDRAM 而提高。
高速执行缓存
为了增加 8KB 的数据缓存,P4 包含了一个执行跟踪缓存,可存储 12K 的微
指令以帮助程序执行。这些指令不在主程序循环中执行,不被存储,从而大大提
高了系统性能。
快速执行引 擎
算术逻辑单元(ALU)以双倍的时钟速度运行,这让类似于加、减、逻辑与、
逻辑或等基本运算的执行只用了 1/2 时钟。例如, 的快速执行引擎其实
是以 3GHz 在运算。
高级动态执行
高级动态执行是控制 CPU 执行顺序的动态单元。P4 可以发出 126 条动态指
令,使流水线完成 48 次载入和 24 次存储。与前一代的 PⅡ处理器相比,它能够
增加 33%的预处理速度,还可以在缓存中存储更多的历史信息从而快速取出。
改进的浮点数运算和多媒体单元
P4 的 128 位运算动态增加了运算单元,使得浮点数运算和多媒体表现都得
到了较大的改进。
网络数据流单指令多数据扩展 2(SSE2)
通过增加的 144 条新指令,SSE2 具有更强多媒体增强指令和数据流单指令。
这些特性包括一个 128 位单指令多数据整数运算和 128 位单指令多数据双精度浮
点指令,这些指令减少了原有的指令执行数量,大大增加了执行速度。使得用户
的视频、音频、图象处理、加密、财政、工程和科学应用都极大增强。SSE2 可
以提高多媒体的执行效率,特别是 DVD/MP3/MPEG4 的回放,可以最大效果地
体现 P4 新指令集的威力。
总结:在理论上,Pentium IV 是完美无缺,可是实际状况却远非 Intel 想象
的那么简单。第一代 Pentium IV 可以说是 Intel 近几年内的最大失败。
首先是 P4 耗电惊人,所以 P4 系统使用的主板被设计为电源的 12V 电压
(ATX12),通过一个 4 脚的插座和 、5V 一起供给主板,另外还在 20 针
电源接口的旁边另加了一个 6 针的辅助电源接口。
最致命的硬伤还是 Willamette 核心属于 Pentium 4 最早期的产品,因此它的
发热量很大、频率提升困难,只有 和 两个版本。而且它的二级
缓存只有 256KB,超深的处理流水线使得总体性能并不理想,特别是对于超频
用户来说,这类产品难以让人感到满意 。
因此 Intel 很快就开发出了 Northwood 核心的产品,以满足消费者的需求。
Northwood 核心的 Pentium 4 采用 微米工艺制造,相比 Willamette 内核的处
理器,其主频有了很大飞跃,二级缓存也从 256K 翻番到 512KB。而 Prescott 核
心的 Pentium 4 采用了另人咋舌的 31 级流水线设计,配备 16KB 的一级数据缓存
和多达 1MB 的二级缓存。
接着是双核心的 Intel Pentium 840EE 发布,此时 Intel Pentium IV 核心已经
发展到了颠峰。
2、Athlon64 技术解释
2003 年美国时间 9 月 23 日,全球第一款桌面系统 64bit 处理器在美国正式发
布。几经波折, Athlon 64 终于在人们期待的目光中揭开了神秘面纱。Athlon 64
的诞生对于桌面处理器领域具有划时代的意义。对于 AMD 来说,这更是具有
战略意义的关键一步。AMD——终于打破了最近时期的不利局面——按照原定
布局领先对手步入了 64bit 时代。跳开对手在架构和制造工艺等方面的追击,另
辟战场利用 Athlon 64 再度出击。
Athlon64 的发布,使得桌面电脑可以迅速迈入 64-bit 时代,目前操作系统、
软件都已经逐渐成熟。AMD 正在迎来丰收时期。
发布之初,Athlon64 的产品线划分非常明确,一为采用 Socket940 接口,面
向顶级桌面用户的 Athlon64 FX 系列;另一个就是面向主流用户,采用 Socket754
接口的 Athlon64 系列。但是,随着时间的推移和竞争对手的不断变化,Athlon64
处理器家族也渐渐庞大了起来。到如今,Athlon64 家族已经演变成为了一个拥
有 4 种核心、3 种接口、2 种制程、近 20 款产品的复杂体系。
它的主要技术特点如下:
64 位计算能力
这是 Athlon64 与传统 32 位处理器的最大区别所在。在 Athlon64 和 Athlon64
FX 处理器中,AMD 加入了一个被称为 x86-64 的指令集,正是这个指令集赋予
了 Athlon64 系列处理器 64 位的计算能力。同时,AMD 清醒地认识到,64 位应
用目前还远未成为主流,所以,它并没有将 Athlon64/FX 设计成一款仅支持 64
位计算的处理器,而是在支持 64 位代码的基础上提供了对 32 位和 16 位代码的
良好兼容。正是这样的设计使得 Athlon64/FX 在执行 32 位代码时不必重新进行
编译,从而避免了效率低下所导致的性能损失。总体来说,Athlon64/FX 既为我
们提供了 64 位计算能力,又完全兼容目前的 32 位甚至 16 位应用,是一款全能
型处理器。
2.超过 4GB 的内存寻址能力
除了 64 位计算能力,x86-64 指令集还使 Athlon64 系列处理器拥有了 64 位
的地址空间和 64 位的数据空间,换句话说就是 x86-64 指令集使 Athlon64/FX 可
以支持 4GB 以上的内存(64 位处理器理论上支持 2 的 64 次方寻址空间,可支
持上亿 GB 的内存),而传统的 32 位处理器最高仅支持 4GB 内存。更大容量的
内存支持能力使 Athlon64/FX 在诸如大型数据库、CAD/CAM 建模以及对系统要
求越来越 BT 的 3D 游戏等高端应用中有着不可比拟的优势。
3.处理器内部集成内存控制器
这也是 Athlon64 系列的独门绝技之一。与传统的处理器把内存控制器放在
芯片组相比,处理器把内存控制器内置可以极大地降低数据收发延迟、缩短读写
请求的反应时间,处理器的性能将因此获得可观的提升。除此之外,处理器内部
集成内存控制器还可以简化北桥芯片的结构,目前,一些芯片组厂商已经成功设
计出了单芯片的 Athlon64 主板产品。
4.HyperTransport 总线
在 Athlon64 处理器架构中,HyperTransport 总线负责的是处理器与北桥芯片
间的数据传输,它的带宽直接影响了系统的整体性能。目前,Athlon64 的
HyperTransport 总线共有两种频率:800MHz 和 1GHz,它们均采用了与 DDR 内
存相同的 Dual Pump 技术,在一个时钟周期内可以传输两次数据,其上下行位宽
为相同的 16bit,所以,800MHz HyperTransport 总线的数据带宽为
1GHz HyperTransport 总线的数据带宽则达到了惊人的 8GB/s。
5.Execution Protection 防病毒技术
Execution Protection 技术是 AMD 公司应用在 Athlon64 中的又一项新技术,
这项技术可以防止病毒的缓冲区溢出攻击(指病毒使 CPU 因缓冲区溢出而执行
恶意代码的攻击技术)。应用这项技术后,CPU 缓冲区的数据将会只读而不能
执行,可以有效地防止恶意代码的执行。目前,这项技术已经被封装在了 Athlon64
系列 CPU 中,不过还需要 Windows XP Service Pack 2 的支持方能发挥作用。
原文地址:
总结:64-bit、双核和其它
算一下微处理器的发展史也不过 30 余年,但在这 30 余年里微处理器的发展
历程却是天翻地覆的变化。从 Intel 的 4004 开始,到了 Intel,AMD,Cyrix 三足
鼎立,到 Intel 一家独大,再到现在 Intel,AMD 分庭抗衡。时代的进步,科技的
发展。30 余年,给人带来的回忆是太多太多。
CPU 将向速度更快、64 位结构、多核心方向前进。CPU 的制作工艺将更加
精细,将会由现在 微米向 微米过渡。到 2007 年时,大部分 CPU 厂商
都将采用 微米工艺制造处理器。制造工艺的提高,味着体积更小,集成度
更高,耗电更少。
在另一方面,由于 CPU 的性能已经足够满足个人大多数应用的需要,所以
人们在买 PC 的时候,CPU 已经不再是唯一的标准。高速 3D 处理能力、HDTV
视频、高保真音频、大容量硬盘已经成为重要标准。
在未来,APU、GPU 都具备相似能力的时候,CPU 的作用还有如此重要吗?