Clock Gating Methodology for Power and CTS QoR
ClockGatingMethodology

7
Agenda
• Objective • Introduction to clock gating • Clock gating methodology
– – – – – Overview RTL synthesis Physical synthesis Clock tree synthesis Summary of Recommendations
• Area savings
– Eliminating multiplexers saves area
• Easy to implement
– No RTL code change is required – Clock gating is automatically inserted by the tool – Technology independent
• Clock Gate Styles • Enable signal timing
– Ensure that you meet setup time on the enable pin of clock gate
• Impact of clock gate fanout on
– Power and enable pin timing – Clock tree structure
RTL Synthesis
Insert Clock Gating during RTL Synthesis
• Use the insert_clock_gating command
12
– The global option looks across hierarchical boundaries for the common enable Extra ports
每日一题——精选推荐

每⽇⼀题每⽇⼀题1.上图是⼀个block (不是chip),问1)有多少timing path2)place之后,假设setup和hold都正好为0ns,然后插⼊时钟树,树的完全平衡的,WC的时钟树insertiondelay是0.2ns,BC 的insertion delay是0.1ns,这时做STA,会看到timingviolation吗?有多少条violation,各违反了多少ns?他们是真的吗?如何解决?ANS: 1) 4条2)会 setup slack(reg2out): -0.2ns ; hold slack(in2reg) -0.1ns假的简单的回答是在input delay上加clock insertion delay的值,在output delay上减去clock insertion delay的值但是当有上千个input和output port时,做起来⽐较⿇烦。
那个简单的办法是:设⼀个虚拟时钟,与clk同频同相,把所有input,output delay都指定到那个虚拟时钟上,CTS后,只要在虚拟时钟上加上(BC 0.1 WC 0.2)的latency就好了2.Why are most interrupts/reset active low?为什么⼤多数的中断和reset是低电平有效?地⽐电源的优越,波动⼩:原因:1-地⽹络/地平⾯最⼤,数字/模拟地也近似于相接,reset接上去之后不会造成电压升。
2-各个电压域的VDD电平各不相同,⽽VSS电平均是03-另外,在板级调试芯⽚中,如果你想reset⼀个3.3V的芯⽚,你在pcb上是找个3.3V信号接上⽅便呢?还是找个地信号⽅便?3. 问题由szp9912收集提供,特此感谢!What is difference between HFN buffer tree and CTS?⼤扇出net的buffer tree和CTS在时序和做法上的区别ANS:buffer tree和clock tree的共同点是它们都是解决high fanout net的问题,只不过要求不同⽽已。
CLP讲义

2020/6/29
7
Power Analyse Tool —— DC & PT_PX
• DC • PT_PX
正常syn的flow,增加下面这条指令: report_power -verbose 就可以产生average的power report。
2020/6/29
8
Power Analyse Tool —— DC & PT_PX
CLP
Outline
Agenda
➢Low Power Design ➢Power Analyse Tool —— DC & PT_PX ➢CPF ➢Sim with CPF
2020/6/29
2
Low Power Design
Power dissipation in CMOS
Total power is a function of switching activity , capacitance , voltage , and the transistor structure itself .
• DC • PT_PX
The techniques for power analysis using the PrimeTime PX tool are: • Averaged power analysis
✓ Net switching power ✓ Cell internal power ✓ Cell leakage power
N.A
78.27 80.177 5.745 85.922 494.8
72.99 72.996875
5.775 78.772
167
Time_based pattern3 0.007416 72.63 72.637416 5.815 78.452 218.9
SoC-Encounter设计流程ppt

SMIC 65nm process
2024/8/14
2011-10-24
主要内容
1. Initial_design 2. Floorplan 3. Pre_place 4. Place_opt 5. Clock_syn 6. Clock_opt 7. Nano_route
命令:
loadCPF $cpf_file
commitCPF
2024/8/14
1.Initial_design
MMMC:
MMMC=multi-mode and multi-corner 即多角多模分析法
一般情况下有以下几种分析方法:
Full MMMC(完全方法)
分析所有工作模式下的最好最坏角点。
#### scan trace and generate original scan def
:输出扫描链
另外还有specifyScanCell(指定扫描单元)和specifyScanChain(指定名称和输入输出端 口)命令等。
2024/8/14
1.Initial_design
Load CPF file:
normal_setup2_max_dcw_view normal_setup1_max_dcw_view} \
-hold { normal_func2_min_dcb_view }
#### set analysis mode
:设置时序分析模式
setAnalysisMode -analysisType onChipVariation \
根据上面产生的模式组合和角点组合,结合时间的情况及方法,生成能够切实代表时序分析情况的 view组合。一般情况下,每次进行时序分析和优化时,只激活部分的view进行操作,使用的命令为: set_analysis_view。下次再进行分析和优化时再激活别的部分view进行操作。
lowPowerDesign

46
LSI Confidential
END
47
LSI Confidential
23 LSI Confidential
Isolation control
• pmu control PD1 • Soft tie high cell control PD2 PD3. VDD off : output 1
24
LSI Confidential
DFT control insertion
19
LSI Confidential
Power domain (frontend) Create_power_domain …
• • • • PD1 PD2 PD3 default
20
LSI Confidential
Floorplan
DDR2/MDDR GPIO
default
PLL
CPU (PD1)
15
LSI Confidential
Power gating control
16
LSI Confidential
17
LSI Confidential
Physical design flow
18
LSI Confidential
Off chip power switch low power design (CPF flow)
• Retention register
14
LSI Confidential
Dynamic and adaptive Voltage Frequency Scaling (DVFS and AVFS)
• DVFS 即动态电压频率调整,动态技术则是根据芯片所运行的应用程序对计算 能力的不同需要,动态调节芯片的运行频率和电压(对于同一芯片,频率越高, 需要的电压也越高),从而达到节能的目的。 降低频率可以降低功率,但是单纯地降低频率并不能节省能量。因为对于一个 给定的任务,F*t是一个常量,只有在降低频率的同时降低电压,才能真正地降 低能量的消耗。
数字集成电路低功耗物理实现技术与UPF

数字集成电路低功耗物理实现技术与UPF孙轶群sun.yiqun@国民技术股份有限公司Nationz Technologies Inc摘要本文从CMOS电路功耗原理入手,针对不同工艺尺寸下数字集成电路的低功耗物理实现方法进行描述,并着重描述了Synopsys UPF(Unified Power Format)对低功耗设计的描述方法。
UPF是Synopsys公司提出的一种对芯片中电源域设计进行约束的文件格式。
通过与UPF 格式匹配的Liberty文件,UPF约束文件可以被整套Galaxy物理实现平台的任何一个环节直接使用,并将设计者的电源设计约束传递给设计工具,由工具完成设计的实现工作,从而实现整套数字集成电路低功耗物理实现的流程。
1.0 概述本文从数字集成电路低功耗设计原理下手,对设计中低功耗的实现技术进行描述,包括完成低功耗设计需要的库资料以及常用EDA工具对低功耗技术实现的方法。
2.0 CMOS电路的低功耗设计原理CMOS电路功耗主要分3种,静态功耗主要与工艺以及电路结构相关,短路电流功耗主要与驱动电压、p-MOS和n-MOS同时打开时产生的最大电流、翻转频率以及上升、下降时间有关,开关电流功耗主要与负载电容、驱动电压、翻转频率有关。
做低功耗设计,就必须从这些影响功耗的因素下手。
3.0 低功耗设计手段及Library需求低功耗的设计手段较为复杂,但对于不同的设计,或者不同的工艺,实现的方法却各不相同。
3.1 0.18um及以上工艺0.18um及以上工艺,在低功耗设计手段上较为有限,主要原因在于,静态功耗很小,基本不用关心。
动态功耗方面,主要的功耗来自于Switching Power,即与负载电容、电压以及工作中的信号翻转频率相关。
减小负载电容,就必须在设计上下功夫,减少电路规模。
减少信号翻转频率,除了降低时钟频率外,只有在设计上考虑,能不翻转的信号就不翻转。
至于电压,由于0.18um及以上工艺的阈值电压有一定的限制,因此,供电电压降低,势必影响工作频率。
数字集成电路低功耗物理实现技术与UPF

数字集成电路低功耗物理实现技术与UPF孙轶群sun.yiqun@国民技术股份有限公司Nationz Technologies Inc摘要本文从CMOS电路功耗原理入手,针对不同工艺尺寸下数字集成电路的低功耗物理实现方法进行描述,并着重描述了Synopsys UPF(Unified Power Format)对低功耗设计的描述方法。
UPF是Synopsys公司提出的一种对芯片中电源域设计进行约束的文件格式。
通过与UPF 格式匹配的Liberty文件,UPF约束文件可以被整套Galaxy物理实现平台的任何一个环节直接使用,并将设计者的电源设计约束传递给设计工具,由工具完成设计的实现工作,从而实现整套数字集成电路低功耗物理实现的流程。
1.0 概述本文从数字集成电路低功耗设计原理下手,对设计中低功耗的实现技术进行描述,包括完成低功耗设计需要的库资料以及常用EDA工具对低功耗技术实现的方法。
2.0 CMOS电路的低功耗设计原理CMOS电路功耗主要分3种,静态功耗主要与工艺以及电路结构相关,短路电流功耗主要与驱动电压、p-MOS和n-MOS同时打开时产生的最大电流、翻转频率以及上升、下降时间有关,开关电流功耗主要与负载电容、驱动电压、翻转频率有关。
做低功耗设计,就必须从这些影响功耗的因素下手。
3.0 低功耗设计手段及Library需求低功耗的设计手段较为复杂,但对于不同的设计,或者不同的工艺,实现的方法却各不相同。
3.1 0.18um及以上工艺0.18um及以上工艺,在低功耗设计手段上较为有限,主要原因在于,静态功耗很小,基本不用关心。
动态功耗方面,主要的功耗来自于Switching Power,即与负载电容、电压以及工作中的信号翻转频率相关。
减小负载电容,就必须在设计上下功夫,减少电路规模。
减少信号翻转频率,除了降低时钟频率外,只有在设计上考虑,能不翻转的信号就不翻转。
至于电压,由于0.18um及以上工艺的阈值电压有一定的限制,因此,供电电压降低,势必影响工作频率。
NORMA 4000 5000 Power Analyzer 用户说明手册说明书

Since some countries or states do not allow limitation of the term of an implied warranty, or exclusion or limitation of incidental or consequential damages, the limitations and exclusions of this warranty may not apply to every buyer. If any provision of this Warranty is held invalid or unenforceable by a court or other decision-maker of competent jurisdiction, such holding will not affect the validity or enforceability of any other provision.
BEGRENZTE GEWÄHRLEISTUNG UND HAFTUNGSBESCHRÄNKUNG
Fluke gewährleistet, daß jedes Fluke-Produkt unter normalem Gebrauch und Service frei von Material- und Fertigungsdefekten ist. Die Garantiedauer beträgt 2 Jahre ab Versanddatum. Die Garantiedauer für Teile, Produktreparaturen und Service beträgt 90 Tage. Diese Garantie wird ausschließlich dem Erster
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
±Methodology ±Clock gating considerations
– Physical synthesis – Clock tree synthesis – Summary of recommendations
• Sample results • Planned enhancements • Summary
less than 3
RTL Synthesis
12
Insert Clock Gating During RTL Synthesis
• Use the insert_clock_gating command
The -global option looks across hierarchical boundaries
• Easy to implement
– No RTL code change is required – Clock gating is automatically inserted by the tool – Technology independent
7
Agenda
• Objective • Introduction to clock gating • Clock gating methodology
Clock Gating Methodology for
Power and CTS QoR
2
Agenda
• Objective • Introduction to clock gating • Clock gating methodology
– Overview – RTL synthesis – Physical synthesis – Clock tree synthesis – Summary of recommendations
10
Clock Gating Methodology During RTL
Synthesis
Input RTL
RTL Synthesis
SSeettththeecclolocckkggaatitninggsstytylele sseett__cclloocckk__ggaattiinngg__ssttyyllee
13
Measure the Quality of Inserted Clock
Gating: Report Power and Clock Gating
• Use the report_power command
Cell Internal Power Net Switching Power
Total Dynamic Power
14
Agenda
• Objective • Introduction to clock gating • Clock gating methodology
– Overview – RTL synthesis
±Methodology ±Clock gating considerations
– Physical synthesis – Clock tree synthesis – Summary of recommendations
• Sample results • Planned enhancements • Summary
3
Objective
• Describe the clock gating methodology to meet target
– Skew – Insertion delay – Power
• Discuss recommendations during
– Gated by the enable signal, the clock network has less switching activity and consumes less switching power
• Area savings
– Eliminating multiplexers saves area
MMeergrgeecclolocckkggaatetess
MMeergrgeecclolocckkggaatetess
PPlalacceemmeennt taannddpplalacceemmeennt t oopptitmimizizaatitoionn
PPlalacceemmeennt taannddpplalacceemmeennt t oopptitmimizizaatitoionn
• Impact of clock gate fanout on
– Power and enable pin timing – Clock tree structure
RTL Synthesis
16
Clock Gate Styles
• Integrated, latch-based, clock gate (ICG) is recommended
Design Compiler X-2005.09
DDeetataililrorouutitningg
IC Compiler v1.1
Physical Compiler X-2005.09
Astro X-2005.09
Unified Flow in IC Compiler
9
Agenda
• Objective • Introduction to clock gating • Clock gating methodology
– Overview – RTL synthesis – Physical synthesis – Clock tree synthesis – Summary of recommendations
• Sample results • Planned enhancements • Summary
8
Clock Gating Methodology Overview
Input RTL
DDeessigignnCCoommppilielerr
InInsseertrtcclolocckkggaatitningg CCoommppiliele
ICICCCoommppilielerr
PPhhyyssicicaal lCCoommppilielerr
RReeaaddininVVeerriliologg rreeaadd__vveerriilloogg
DDeefifnineeththeecclolocckkss ccrreeaattee__cclloocckk
InInsseerrttcclolocckkggaatitningg iinnsseerrtt__cclloocckk__ggaattiinngg
CCoommppiliele ccoommppiillee
11
Specify Clock Gating Options
• Use the set_clock_gating_style command
• Maximum fanout
– This value is the maximum fanout of each clock gating element
• Sample results • Planned enhancements • Summary
5
What is Clock Gating?
• Register banks disabled during some clock cycles
– Typical implementation uses multiplexers – Clock gating cell replaces multiplexers
------------------------------------------------------------
| Number of Clock gating elements |
222
|
|
|
|
| Number of Gated registers
| 167512 (99.92%) |
|
|
• Discrete, latch-based or latch-free (simple AND or OR-AND gate) clock gates are also supported
– Discrete clock gates are not recommended (details on next slide)
= 160.6544 mW = 102.5581 mW
--------= 263.2125 mW
(61%) (39%)
(100%)
Cell Leakage Power = 3.0961 mW
• Use the report_clock_gating command
Clock Gating Summary
D EN CLK
Q
High activity
EN CLK
D
Q
gclk
Low activity
6
Benefits of Clock Gating
• Dynamic power savings
– With low toggle rate on clock pin, internal power of registers is reduced
– By default, the fanout is unlimited
• Minimum bitwidth
– This is the minimum bitwidth of register banks that will be gated
– By default, the minimum bitwidth is 3 – No area or power benefit with register banks with bitwidth