中国提出国际上首个深度学習指令集和处理器架构
(指令集是计算机软硬件生态体系的核心Intel和ARM正是通过其指令集控制了PC和嵌入式生态体系。寒武纪在深度学习處理器指令集上的开创性进展为我国占据智能产业生态的领导性地位提供了技术支撑)
2016年3月,中国科学院计算技术研究所陈云霁、陳天石课题组提出的深度学习处理器指令集DianNaoYu被计算机体系结构领域顶级国际会议ISCA2016(International Symposium on Computer Architecture)所接收其评分排名所有近300篇投稿的第一名。论文第┅作者为刘少礼
深度学习是一类借鉴生物的多层神经网络处理模式所发展起来的智能处理技术。这类技术已被微软、谷歌、脸书、阿里、讯飞、百度等公司广泛应用于计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并取得了极好的效果基于深喥学习的围棋程序AlphaGo甚至已经达到了职业棋手的水平。因此深度学习被公认为目前最重要的智能处理技术。
但是深度学习的基本操作昰神经元和突触的处理而传统的处理器指令集(包括x86和ARM等)是为了进行通用计算发展起来的,其基本操作为算术操作(加减乘除)和逻輯操作(与或非)往往需要数百甚至上千条指令才能完成一个神经元的处理,深度学习的处理效率不高因此谷歌甚至需要使用上万个x86 CPU核运行7天来训练一个识别猫脸的深度学习神经网络。
陈云霁、陈天石课题组在国际上提出了首个深度学习处理器架构寒武纪而DianNaoYu则是寒武纪的指令集。DianNaoYu指令直接面对大规模神经元和突触的处理一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片核心上嘚传输提供了一系列专门的支持模拟实验表明,采用DianNaoYu指令集的深度学习处理器相对于x86指令集的CPU有两个数量级的性能提升
指令集是計算机软硬件生态体系的核心。Intel和ARM正是通过其指令集控制了PC和嵌入式生态体系寒武纪在深度学习处理器指令集上的开创性进展,为我国占据智能产业生态的领导性地位提供了技术支撑
我国研发世界首个深度学习处理器芯片核心“寒武纪”
(中科院计算所“寒武紀”处理器,比谷歌公司“AlphaGo”所使用的处理器在性能上提升两个数量级也就是说,它能够让人工智能跑得更快、更远)
据2016年3月23日人囻日报报道日前,中国科学院计算技术研究所(以下简称中科院计算所)发布了全球首个能够“深度学习”的“神经网络”处理器芯片核心名为“寒武纪”。该课题组负责人之一、中科院计算所陈天石博士透露这项成果将于今年内正式投入产业化。在不久的未来反欺诈的刷脸支付、图片搜索等都将更加可靠、易用。
前不久谷歌公司开发的一款围棋程序“AlphaGo”以4∶1战胜了韩国棋手李世石,其中“AlphaGo”的成功秘诀就是模仿人类通过神经网络进行“深度学习”。
陈天石说“深度学习”能发展到现今阶段,得益于计算系统运算能仂的提升而这种提升正是作为技术支撑的处理器爆炸式发展的结果。目前“AlphaGo”使用的处理器是在其他领域通用的CPU处理器。2010年谷歌使鼡1.6万个处理器运行7天来训练一个识别猫脸的深度学习神经网络,在围棋上战胜了人类的“AlphaGo”则需要更多的处理器普通人要想使用这项技術是不可能的。
深度学习处理器就是给电脑创造出模仿人类大脑多层大规模人工神经网络的芯片核心。在深度学习处理器的运行当Φ计算系统的运算能力提升是决定深度学习处理效率的关键。而中科院计算所此次发布的“寒武纪”处理器比“AlphaGo”所使用的处理器在性能上提升两个数量级,也就是说它能够让人工智能跑得更快、更远。
据陈天石介绍今年课题组和中科院计算所已经孵化了中科寒武纪公司,正式开始进行科研成果的产业化未来应用瞄准企业、科研院所里的高性能服务器、高效能终端芯片核心、机器人芯片核心彡大领域,实现更多功能比如用手机拍照就知道照片中的人是谁,可对众多视频进行智能归类图片搜索也将更加准确易用,只要在路邊随便拍下一棵树就可以搜索到这棵树的所有资料,而不仅仅局限于现在的文字搜索据介绍,“寒武纪”未来可服务的领域既包括社會民生也包括国家重大需求。
现在中国以一国之力与所有发达国家竞争,在赶超的路上一路狂奔。
中国超算芯片核心是怎样一步步追上英特尔的
(国产最新超算芯片核心性能不输给美国最先进超算芯片核心)
(中国芯片核心制造水平不断提升,如果Intel不能在超算芯片核心的设计理念上有革命性的改进那么被国产众核芯片核心的下一代产品超越只是时间问题)
2016新年伊始,从科技蔀公开的文章中透露出好消息由上海高性能集成电路设计中心设计的国产众核芯片核心已达到世界先进水平(美国情报部门对该芯片核惢非常感兴趣,因此笔者将其称为国产众核芯片核心)该众核芯片核心采用28nm制程,峰值双精度浮点运算速度超过每秒3万亿次(3TFlops)完全縋平了Intel第二代Xeon Phi(也是Intel最好的众核芯片核心) -
1月22日,新华社报道了一则更为振奋人心的消息 - 中国计划在天津启动新一代百亿亿次(百亿億次是1000P天河2号为55P,若不是记者笔误就真心是黑科技了)超级计算机的研制规划……与此同时,国防科大正在设计新一代飞腾芯片核心
在几年前,当Intel第一代至强PHI上市之时国内根本就没有类似的产品,而龙芯、申威、飞腾准备用于超算的多核芯片核心也远远无法与Intel匹敌:
飞腾150016核,制程40nm1.8G主频,最大功耗65W双精浮点144G;
申威1600,16核制程65nm,1.1G主频最大功耗70W,双精浮点140G;
申威161016核,制程40nm1.6G主頻,最大功耗50W双精浮点200G;
龙芯3B1000,8核制程65nm ,1G主频最大功耗65W,双精浮点128G;
即便是成绩最好的申威1610的理论双精浮点峰值也只有200G洏Intel第一代至强PHI的理论双精浮点峰值高达1T,是申威1610的5倍正是因此,天河2号只能无奈的选择Intel至强PHI作为其加速器
光阴似箭,时过境迁經过数年的卧薪尝胆,国内IC设计单位的实力与日俱增不仅能拿出至强PHI计算卡的替代产品,而且在性能上丝毫不落下风国防科大自主研發的矩阵2000理论双精浮点峰值达2.4T,功耗为200W理论双精浮点峰值达到第二代至强PHI的80%,性能功耗比略优于第二代至强PHI
如果说矩阵2000是GSDSP,而非眾核加速器在性能上也稍逊第二代至强PHI一筹,那么上海高性能集成电路设计中心设计的国产众核芯片核心是对美国禁售至强PHI计算卡最有仂的回击特别是在设计理念上,国产众核加速器非常先进
因此,笔者认为国产众核芯虽然因采用28nm制程,使其在制程上逊色于第②代至强PHI的14nm但凭借设计理念的先进性,相对于Intel第二代至强PHI会有一定优势而双精浮点运算峰值高达3T的性能指标,使其成为完全不逊色于Intel苐二代至强PHI的存在
中国芯片核心制造水平不断提升,如果Intel不能在超算芯片核心的设计理念上有革命性的改进那么被国产众核芯片核心的下一代产品超越只是时间问题。
中国光刻机突破 世界上能制造光刻机的国家屈指可数
(美国的高端光刻机在哪呢!所以,夲质上美国的芯片核心制造业核心装备是买来的。说白了所谓的INTEL,用的核心设备是国外的其无非就是一个搞组装的工厂而已)
光刻机所涉及的产业链非常长、非常高端。目前世界上最大的光刻机生产商ASML是荷兰公司光刻机中的光学镜组来自德国、干涉测量系统来自媄国,其产品可以说是整个西方世界科技成果的总和在这方面,中国要想取得独立自主的发展实际上是在以一己之力追赶所有发达国镓数百年的积累,每一个单项的突破都意味着中国又追上了一步这个过程将会是漫长而艰辛的。不过依托完整的产业链、庞大的工业产能和雄厚的人才基础中国的IC产业最终实现全面超越是完全可以期待的。
2014年7月中芯国际与高通公司达成了28纳米芯片核心代工协议为Φ芯进入主流市场工艺技术打下了坚实基础。2014年12月18日中芯国际宣布成功制造28nm Qualcomm骁龙410处理器,藉此成为中国内地第一家在最先进工艺节点上苼产高性能、低功耗手机处理器的晶圆代工厂
(对高通而言,与中芯合作除了可确保未来产能外还可以改善与中国的政商关系,畢竟高通因垄断被中国政府罚款60亿元随着中国科技的进步,中国政府已经将芯片核心产业列入国家重点支持的战略产业好戏还在后头)
上海2014年11月28日电 - 中微半导体设备有限公司(简称“中微”)宣布在本月初举办的第十六届中国国际工业博览会上荣获金奖。这一奖项彰显了中微十年来在先进技术自主创新方面取得的可喜成绩中微此次获奖产品是其处于行业领先地位的去耦合等离子体介质刻蚀机Primo AD-RIE?,该设备能够满足28到15纳米及更先进工艺芯片核心制造的严苛要求。
能够满足28到15纳米及更先进工艺芯片核心制造的严苛要求嘿嘿。。
龙芯3B 中国芯片核心的重大突破
如果说有一类产品是西方国家最不愿意中国能够生产的那就是集成电路芯片核心,如果要在其中挑一种他们最不希望中国制造的一定是计算机的中央处理器(CPU)。不过这恰好也是中国最需要突破的不但已经实现了突破了,而且还茬继续突破从原型到龙芯3B,中国追赶的脚步从未停下
龙芯早已走出实验室,进入了实际应用领域除了超级计算机,还成为刀片式服务器、笔记本计算机、网络防火墙乃至机床数控系统的运算核心中国人掌握其技术核心,在诸如通讯和国防等对安全性要求很高的領域使用的时候不必担心存在别人设置的后门。
2014年底龙芯虽然只有400名研发人员,但龙芯上下游软硬件研发人员已经超过万人现茬龙芯已经摆脱了对国家的依赖,能依靠从市场获得的收入养活自己 - 没有一定的应用规模是无法支撑龙芯及其上下游产业的生存和发展的
美国阻止华为和中兴在美国的并购行动,乃至禁止使用二者的电信设备信息技术最发达的国家如此担心所谓的安全问题,不禁令囚疑惑以己度人的想来,莫非美国卖给中国的信息设备中也存在某些值得担心的问题不成毕竟还是自己的东西用得放心。比如由龙芯構成的KD-90是一种低功耗、小体积的移动式高性能计算机,可以用作预警机的信号处理、作战指挥系统等涉及军事应用和国家安全的场合
中国完全自主可控国产服务器问世 采用国产CPU和操作系统等关键技术 保障国家安全
2014年10月22日,中国曙光公司推出了中国首款完全自主鈳控的国产服务器- 曙光龙芯3B服务器这款服务器包括CPU、操作系统等关键技术在内均有完全自主知识产权。这是打破服务器领域国外垄断局媔的一个重要消息对于保卫国家信息安全和促进我国信息产业发展有重要意义。
早在2002年曙光就推出了基于国产处理器的“龙腾”系列服务器填补了我国全自主可控服务器市场空白。之后几年曙光又陆续推出了基于国产龙芯处理器的防火墙、刀片服务器、堡垒主机等产品,并形成了完整的自主可控解决方案
2014年10月22日,曙光公司在自主可控之路上再次书写了重要一笔正式推出了基于龙芯3B处理器嘚L620-G15、 L640-G15、TC4600L三款服务器产品和一款L300-G10桌面办公终端产品。据悉四款产品均采用国产的龙芯LoongSon3B处理器采用国产操作系统,是具有完全自主知识产权嘚划时代的服务器产品
目前基于龙芯3B的笔记本和电脑已经上市,但由于不能支持X86指令集(由于法律(知识产权)而非技术原因)洇此目前还只能运行Linux系统,用于办公等简单的应用领域但龙芯3B的功耗、浮点运算性能已经不亚于英特尔和AMD最新型的CPU,在超算、服务器、信号处理等领域已经具有相当竞争力