[PConline 杂谈]要说在DIY行业什么产品国产化最能牵动国人的心,那CPU要说第二恐怕没人敢说第一。众所周知CPU是一台电脑的大脑,指挥着电脑各个部件运行,因此CPU的制造也是一个非常高科技的活,里面涉及到各行各业,甚至连CPU的原材料硅晶圆制造门槛也极高。因此当网上报道国产CPU有什么进展,有什么喜讯时,许多网友第一反应总是不相信,并且质疑,而他们最经常说的话就是,“敢不敢拿出来卖啊!”
还好,最近淘宝上终于是有国产处理器售卖了,趁着这个热点,晓边就和大家聊聊国产CPU的发展现状,看完大家就知道为什么“敢不敢拿出来卖啊!”这句话用来批判国产CPU取得进展是一个常识性的错误了。
CPU也分很多种,这些你都了解吗?
CPU中文名为中央处理器,它在计算机中负责读取指令,对指令进行诠释和执行。为了让CPU读取诠释指令的效率更高,CPU内部会有叫做“指令集”的东西,指令集就是人们预先设置好的一套工作(读取、诠释、执行指令)方法和指南,当CPU外部接受到某种指令时,CPU就开始找预设的工作方法中对应的指南去执行。
因此CPU指令集先进与否,也往往决定了CPU性能有多强。
按照指令集的复杂程度划分,我们可以把CPU简单划分为两种架构,一类是RISC(精简指令集处理器),另一种是CISC(复杂指令集处理器),它们的区别在于设计理念的区别。
早期处理器Intel C8008
早期CPU全都是CISC,这类CPU设计目的就是让外部生成的非常简单指令就能被机器读懂,方便编译器开发(编译器就是将“更接近人语的高级语言”翻译为“电脑能读懂的低级语言”的程序),但为了达成这一目的CPU内部会集成非常复杂的指令读取,翻译和诠释的逻辑,也对CPU的架构和电路设计提出更高的要求,这类处理器的代表就是我们个人电脑常用的X86处理器。
RISC则是指令集比较简单,因此外部指令要被RISC处理器读懂,配套的编译器需要非常强大,能将复杂的指令简单化,相应的,RISC的制造会简单许多,在同等工艺下能制造出特定功能性更强的CPU,这类处理器的代表就是手机上的ARM处理器和IBM的Power处理器。
更加简单通俗的区分就是CISC强调用硬件去更有效率地执行工作,而RISC则更依赖软件(编译器);CISC处理器上的指令集丰富而全面,是个全能选手,RISC处理器通常只保留特定常用指令集,让处理器某项性能非常强(比如为挖矿优化的特定RISC矿机),更适合打造专才。
按照基础指令集的不同,目前世界上的CPU可以分为五大体系,分别RISC类别的ARM体系、MIPS体系、Power体系、Alpha体系、ARM体系和CISC类别的X86体系,下面就介绍一下这五大体系处理器在国内的发展现状。
国内MIPS体系处理器的现状-充满生机与活力
MIPS的意思是“无内部互锁流水级的微处理器”(Microprocessor without interlockedpipedstages),其机制是尽量利用软件办法避免流水线中的数据相关问题,MIPS处理器最早由80年代初斯坦福大学研究出来,也是最早商用的RISC处理器,其特点是高效率低功耗,目前已经发展到MIPS64架构。
MIPS指令集关系,图源MIPSTech
国内MIPS处理器的代表有两家,一家是大家都经常能听到的龙芯,另一家为君正。
龙芯:
龙芯是2002年由中国科学院计算所(下文简称中科所)开始研发,那时中科所是想做一款独立自主的处理器,当时可选择的方向有四个,其一做X86处理器,但是X86处理器太难制造,要经过AMD或者Intel授权,进行技术指导才能搞清楚;其二是做ARM处理器,但那时ARM主要面向移动端,和中科院想做PC处理器的初衷不相符;第三就是自主研发架构,这个就更不现实了;而MIPS处理器那时在科研单位、大学中也有广泛的使用基础,因此当时中科所就选择了第四条路,MIPS体系处理器,再搭配Linux系统,打造国产PC。
不过有意思的是龙芯第一代产品发布时是没有经过MIPS正式授权的,有侵权的嫌疑,但最后两家公司在2009年达成和解,龙芯支付了一笔费用永久性获得了MIPS32和MIPS64架构的授权,现在龙芯完全是自主可控的,将来不会再出现被别人卡脖子受限于人的局面。
官方揭露龙芯3A4000跑分成绩
龙芯经过这么多年的发展也早已不是简单的其他MIPS处理器仿制版,在MIPS固有指令集上龙芯还添加了不少自主研发的指令集,指令集数量是原有两倍。目前龙芯最新的产品是2019年年底发布的龙芯3A4000/3B4000,其中龙芯3A4000是面向桌面台式机和笔记本,采用28nm打造,4核4线程,主频为1.8~2.0GHz(也就是支持睿频),面向科学计算、高密度数值信息处理的峰值计算性能是上代产品龙芯3A3000的4倍以上,通用处理性能基本打平AMD的末代28nm产品“挖掘机”。
而龙芯3B4000属于龙芯服务器CPU产品线,在核心线程、频率上与芯3A4000一致,但支持双路、四路服务器,即在一台服务器主板上安装2个或者4个龙芯3B4000芯片,一台服务器最多包含16个处理器核。所有CPU之间通过高速总线接口直接互联,共享使用物理内存。龙芯3B4000专门优化了CPU之间的高速互连总线,跨片访存实际带宽提升400%以上。
目前龙芯的发展势头还是十分不错的,已经不需要国家经费支持,完全实现自给自足,公司收入主要来源为太空芯片销售、高温芯片销售、对外IP授权销售、嵌入式方案销售和党政军采购,在19年年底的发布会上龙芯中科董事长胡伟武表示龙芯在2019年出货量达到50万颗,净利润达上亿元,合作伙伴已经增至近千家,下游基于龙芯的开发人员达到数万人,使用龙芯的笔记本、一体机、服务器、云终端、网络安全设备、工业控制计算机等产品已经运用于我国的各行各业。
君正:
北京的君正知道的人就比较少了,因为君正主打的是嵌入式设备,是专注于可穿戴,物联网领域的本土芯片设计公司。由于嵌入式设备有一定的定制需求,软件生态链短,不需要CPU性能有多强,着重点在于廉价、低功耗和尺寸,因此这个领域现在是百花齐放的局面,君正也因此能分一杯羹。
作为一家纯商业化的公司,目前君正的合作伙伴和出货量还是很可观的,甚至还做过小米手环的项目,而且已经上市,财报都能查到,2019年全年财报显示北京君正净利润为5780.75万元,也是良性发展了。
国内MIPS处理器虽然发展地不错,但是由于最新的微软Windows系统只支持X86处理器和部分ARM处理器,我们普通人一般是接触不到MIPS处理器,认知不足也可以理解,就算买来龙芯的笔记本,由于生态和软件的问题,对普通人来说也是浪费钱。
国内ARM体系处理器的现状-星星之火已成燎原
ARM体系处理器大家就并不陌生了,大家手中的手机就是用ARM处理器的,在这里晓边就简单介绍一下。ARM全称为Advanced RISC Machines(高级RISC核心),使用32位精简指令集,ARM处理器具有低功耗高性能、大量使用寄存器读取指令快、体积小、指令长度固定、节省存储空间等特点。
ARM处理器也是一个商业化十分成功的处理器,只要你向ARM公司支付一笔费用,就能获得ARM处理器的授权,授权的模式有三,第一是架构/指令集层级授权,授权后你可以对ARM架构进行大幅度改造,甚至可以对ARM指令集进行扩展或缩减,比如苹果、华为就是这种;其二是内核层级授权,你可以以一个内核为基础添加其他模块;其三是使用层级授权,意思是你只能使用,不能魔改。
国内发展ARM处理器体系主要有四家,分别是华为海思、飞腾、展讯。
华为海思:
华为海思应该是国内ARM处理器商业化最成功,乃至所有国产CPU中商业化最成功的公司了。华为海思的处理器主要应用于移动端产品,应用场景包括但不仅限于手机、监控设备、机顶盒、电视和路由器等,最新的代表产品就是麒麟990 5G版了,7nm euv工艺打造,集成5G基带,其CPU性能可与目前世界一流水平的手机处理器骁龙865、A13同台竞技。
除此以外华为海思在服务器领域也有涉足,最新产品为鲲鹏920,7nm工艺打造,最高可扩展为64核,主频为2.6GHz,支持8通道DDR4内存和PCIe 4.0。不过鲲鹏920目前还处于华为自用阶段,作为于华为云服务的服务器内核,而且目前高性能服务器基本都是X86处理器的天下,鲲鹏920暂时不会对服务器市场造成多大的影响。
飞腾:
飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业,如果用一个词去形容飞腾处理器的发展历程,那肯定是一波三折了。
一开始飞腾是做逆向工程的(也就是仿制别人的CPU),以Intel的 IA-64指令集为基础做,不过后来Intel放弃了这个指令集,飞腾也转向做Sparc处理器,使用开源的Sparc V9 架构,花了三年时间做出了8核32线程(1核4线程)的处理器FT-1000,又花了三年扩展成了16核64线程的FT1500。2010年国防科大的银河一号超算进行扩容时加入了2048颗FT-1000处理器,虽然相比于超算其他的AMD、Intel处理器数量来说微不足道,但也足以振奋国内研发人员,激发了当时国人的民族自豪感,在天河二号的建造中国防科大又使用了4096颗FT-1500芯片用于超算的网络数据处理。
但是,SPARC架构母公司败走服务器市场,被Oracle收购之后,就再也没有开源新的SPARC指令集了,飞腾手中的SPARC架构指令集很快就落后了,于是飞腾果断就转向做更火的ARM架构处理器。
飞腾也是购买了ARMv8指令集的永久授权,最新产品2019年9月发布的FT-2000/4处理器,4核4线程,16nm工艺打造,最高主频为3.0GHz,最大功耗仅为10W,主要面向台式机或者笔记本。目前FT-2000/4已和国产银河麒麟操作系统(PC版)完成了全部适配工作,因为不使用Windows系统,主要客户也是军队、政府等单位了。
展讯:
展讯是一个不得不提的国内ARM处理器设计公司,根据统计展讯每年出货6亿片芯片,占据全球手机芯片25%的市场,仅次于高通和联发科,在去年展讯旗下的SC6531芯片击败了高通华为联发科三星成为单芯片出货量世界第一。
或许很多网友疑惑,我们手中的手机芯片不是高通、华为海思就是苹果或者联发科的,这个展讯这么没听过?其实展讯的手机芯片主要用于老人机、三防手机上,主打耐用性与超长续航,仅支持GSM、GPRS两种网络制式,主要市场也集中于非洲、东南亚等低收入海外市场,是真正走出去的国产芯片。
国内Power体系处理器的现状-胎死腹中?
Power架构是蓝色巨人IBM开发的指令系统架构,大到超算,小到车载音响都有它的身影。不过如今Power架构处理器是越来越不景气,在高性能计算的竞争上Power对比X86因为采用SMP技术,具有内存访问任何一个CPU核心时速度都一样的优势,更利于制造多核处理器,但Power价格昂贵,而且IBM本身就是系统制造商,Intel联合Windows的联盟实在太强大,Power不得不败下阵来;在其他终端设备上Power处理器则不如ARM处理器尺寸小,功耗低。
IBM也意识到生态的重要性,开始把Power授权给更多公司,2016年国内企业中昊宏芯获得了POWER 8芯片架构和指令系统的永久授权,但中昊宏芯研发过程并不顺利,期间还遇到股权变更和欠薪事件,国产Power也就一直难产,至今都没有影子。
2019年8月POWER指令集架构正式开源,或许这能促进国产Power处理器出现。
国内Alpha体系处理器的发展-已成独苗
Alpha是DEC公司制造的处理器架构,最早用于自己的工作站和服务器当中,支持UNIX、Linux等系统,后来DEC公司被美国惠普收购,而惠普的精力主要在“X86架构”的个人电脑,所以对Alpha架构的指令集早已很久没有更新,恰逢我们国家全力发展自主科技,所以我们无锡的江南计算所(军方研究机构)买了Alpha架构的所有设计资料,制造了完全自主可控的国产Alpha处理器,也就是大名鼎鼎的申威,申威处理器也是目前Alpha架构处理器的独苗了。
江南计算所在原有Alpha指令集的基础上增添了SIMD等特色的扩展指令集,还拓展了多核架构,把Alpha架构处理器发展到新的高度,现在的申威处理器和以前的Alpha处理器已经不可同日而语,最新的申威SW26010处理器使用了申威为高性能计算自主研发的指令集,频率1.45GHz,260个核心,这也是它的特殊之处——整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。
此前多次夺得超算排名第一的神威·太湖之光超算就用了多达40960颗申威26010众核处理器,全都是超算的运算主力,并不像飞腾那样打打辅助,由此可知申威26010众核处理器确实实力过硬,能与其他国家的超算一比高下。
目前申威处理器主要用于超级计算机打造和服务器,我们普通消费者更加难接触到了。
国内X86体系处理器的发展-势头良好,仍存阻碍
与RICS诸侯混战不同,CISC系处理器一直是X86架构的天下,X86处理器大家都很熟就不再介绍了。国内要想发展X86处理器,最大的难题是授权问题,在X86处理器发展过程中Intel和AMD的指令集经过复杂的融合,形成了如今两家交叉授权才是完整X86指令集的局面,换句话而言想堂堂正正地发展X86处理器,理论上要同时得到Intel和AMD的授权才行。
作为PC处理器的霸主,Intel一般是不允许有新玩家来分走属于它的蛋糕,当年正是Intel逐渐收回X86授权才形成如今X86处理器只有两家争斗的局面。
但近几年国内涌现了几家做X86处理器的公司,他们是怎么做到的呢?
兆芯:
目前世界上除了Intel和AMD以外第三家拥有X86授权的公司,是威盛VIA,上海兆芯集成电路有限公司经过一番操作也是取得了威盛VIA X86处理器的授权。早期兆芯处理器也只是威盛处理器简单的仿制产品,不过经过这么多年的迭代研发,兆芯已经研发出KX-6000系列处理器,基于16nm制程,主频可达3GHz,有4核/8核可选,集成核显、支持双通道DDR4内存,性能与Intel酷睿七代i5处理器看齐。
目前KX-6000系列的KX-U6780A已经推出到零售市场,而且某宝上已经能买到。产品搭配国产主板品牌深圳芯杰英(Cjoyin)开发“C1888”主板一起销售,板U价格为4300元,考虑到处理器的性能,产品性价比还是比较低的。
不过这也可以理解,产品并没有大规模销售,每一颗处理器分摊的研发费用自然很高。
因为可以使用Window系统,兆芯的处理器是与普通消费者的距离最近的国产CPU,感兴趣又有财力的网友可以买回去玩玩,装上Win10系统日常用肯定是没有问题的了。
目前兆芯需要担心的依然是授权的问题,按照此前美国裁定威盛的X86授权早已在2018年4月份过期,之后新的X86指令集无权使用,也就是说以后研发新指令集只能靠兆芯自己了。
海光:
2016年AMD宣布与中国天津海光投资公司达成协议,将X86技术授权给海光公司,自此国内能设计X86处理器的公司又多了一家。
AMD为了规避和Intel的交叉授权协议,和海光的合作非常复杂,AMD和天津海光先成立合资公司A,合资公司AMD是大股东,因此AMD向合资公司A授权X86架构就像左手授权给右手,是合法的,合资公司也可以修改AMD的CPU核。随后AMD和海光成立合资公司B,这家公司海光是大股东,购买合资公司A设计的IP授权再进行CPU设计,这样就规避了AMD和Intel的交叉协议。
不过这样的做法海光处理器是十分受制于AMD的,海光处理器被规定只能在中国销售,不能出口,而且也不知道AMD会不会翻脸,因此海光处理器算不上完全自主可控。
好处是AMD授权给海光生产的CPU是基于这几年大出风头的ZEN架构,因此海光处理器在性能上一开始就站在了其他国产CPU无法企及的高度。
目前海光生产的Dhyana(禅定)处理器已经开始流片,由14nm打造,基于ZEN架构,应该就是一代EPYC的仿制版,目标是应用于服务器市场。
结语-拨开云雾,终见曙光
光阴似箭,21世纪已经进入了第三个十年,在头20年里,在无数国内科研人员呕心沥血地奋斗下国产CPU得到了长足的进步,上至超级计算机、下至手机、智能音响,都能找到中国芯的身影。
由于架构的不同,许多还算不错(虽然追不上世界一流水平,但比较好用)的中国芯离我们消费者很遥远,这也是为什么很多中国芯没有推出到零售市场,我们也买不到(推出了一般人也不会买,厂商只会亏本)的原因。
好在国产X86处理器也得到了一定的发展,电商平台上有最新的国产处理器板U套装出售就是有力的证据,国产桌面端PC处理器从未如此接近我们普通消费者。
不过目前这款国产CPU性价比还是相对低下,但现在也只是第三方渠道流出,而这些问题会随着产品量产,销量提高得到解决。
这也是个积极的讯号,随着产品不断的迭代发展,晓边相信不久的将来国产X86处理器能像国产ARM处理器那样足够优秀,也能与世界一流厂商正面对决,最终让消费者愿意用手中的小钱钱支持它。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”