客戶退貨資訊不明已成為電源供應商及電力系統制造商亟待解決的問題;而利用內建黑盒子記錄功能的數位控制器來記錄電源供應器運作過程,不僅能為試產做驗證,更可使除錯效能大增,有效改善退貨的診斷方式,提高認證可靠度。
對于電源供應器及電力系統制造商來說,客戶的退貨是一個主要的頭疼問題。這類退貨通常只會提供很有限且不明確的失效機制資訊,以及環境條件和“犯罪現場”的模糊細節;而須要依這些粗糙的資訊來診斷并提出失效分析完整報告的時間壓力卻是持續的收縮,隨著設計進展到不同的階段,從原型到量產再到終端客戶,除錯及修正問題相關的成本很自然地增加,這還不包括客戶關系上及信譽的損失。
此外,在客戶退貨中,有一個相當比例看起來是屬于“未發現問題”的退貨類別。此種退貨通常不加以處理,從而永遠不會被正確的診斷,導致發生在終端客戶系統上的真正失效機制被掩蓋掉的風險。舉例來說,任何會造成過高溫限制(Over Temperature Trip)的失效問題,會在客戶設備中出現停機現象,但退回制造商時卻又看似功能正常。
這個問題可以透過類似飛機飛行記錄器概念的內建“黑盒子”來獲得解決,可以在當機發生前補捉到關鍵的資訊。本文將介紹用在隔離式電源供應系統中的先進PMBus數位控制器--ADP1055,如何使用其內部的黑盒子來記錄與儲存關鍵的資訊,此資料可以提供給電源系統制造商及終端系統使用者,以改善現場客戶退貨的診斷,并提高認證過程的可靠性。
記錄資料至黑盒子的選項
這款先進PMBus數位控制器的黑盒子特點功能,讓它可以將造成系統當機原因的重要資料,記錄到EEPROM中。黑盒子診斷工具可以被視為兩個部份,首先第一旗標識別碼(First Flag ID)功能會記錄失效發生的第一個情況,諸如過電流/電壓/溫度等。
接著,當控制器碰到如此的失效時,遙測結果的快照會被擷取下來(圖1),此資訊會被存在嵌入式非揮發EEPROM,以便稍后取出做為除錯用途;當有多個失效出現時,造成系統停機的第一旗標識別碼及所有的遙測資訊,會被補捉到黑盒子中。
圖1 從GUI中所看到的黑盒子旗標,顯示第一個失效ID為VOUT_OV_FAST。
由于在數位控制式電源供應器中,有多個參數須被量測,因此該控制器為每一個量測項,如電壓、電流、及溫度,采用了專屬的(而非多工的)時間平均Sigma-Delta ADC,且為確保能補捉到正確的資料,量測到的數量會在當機的瞬間被記錄到黑盒子中。
這個黑盒子的功能在測試與評估時,對于失效系統的故障排除非常有幫助,如果系統因失效分析而被召回時,可以從此EEPROM讀回此資訊,以協助失效原因的調查。
在記錄資料到黑盒子時,可以有以下的幾個選項:
?不記錄,黑盒子功能關閉。
?只在最后的停機前瞬間記錄遙測值。
?記錄最后的停機及所有斷續重試嘗試(如果IC被設定為停機與重試)的遙測值。
?記錄最后的停機、所有重試嘗試,以及透過CTRL接腳或OPERATION指令(如PMBus所敘述)來正常關機動作時的遙測值。
EEPROM可存放黑盒子內容
EEPROM中有兩頁(A頁與B頁)是專門用來存放黑盒子的內容,相當于總共十六筆的記錄(每一頁包含了八筆各有64位元組的記錄),此兩頁形成了一個循環緩沖,以記錄黑盒子資訊,而其資料在每第十六筆記錄時會被覆寫。
EEPROM是一種頁清除(Page-erase)型式的記憶體,亦即各頁必須在整個頁都被清除之后,才能再被寫入。由于EEPROM具有此頁清除的特性,在寫入任何一頁的第八筆記錄之后,下一頁會自動被清除以容許后續的黑盒子記錄。
每次一筆記錄被寫入黑盒子時,此晶片就會累進記錄編號。每一次的黑盒子寫入,都會記錄PMBus及制造商的特有暫存器,內容如圖1及圖2。
圖2 從GUI看到的黑盒子數值
黑盒子記錄時間考量
單一筆黑盒子記錄約需1.2ms來寫入,但還有一額外的頁清除時間必須被列入考慮,以確保失效記錄能成功。在PMBus數位控制器中,每一頁可被寫入八筆記錄,因此每當記錄編號為8n-1(n>0)時,就會對另一頁進行頁清除動作,此清除動作須耗掉額外的32ms來完成(圖3)。
圖3 黑盒子的寫入動作
也就是說,每一個“第(8n-1)筆寫入”都需要一次頁清除,而這會讓整個記錄時間累積到33.2ms。每一個停機及重試周期之間的最小延遲時間,最好能比最短黑盒子寫入時間來得長,也就是1.2ms,且在最差的狀況下可延長到33.2ms。
要讓黑盒子成功記錄的另一個考量點,是要確保IC的電源供應電壓或VDD不失電。ADP1055需要一穩定的3.3V VDD,來維持其本身及黑盒子的正常作業。一般來說,在一隔離DC-DC轉換器中,會由輔助或常開型供應器提供電力給控制器。在其他情況下,可以透過一VDD接腳上的停滯(Holdup)電容,將電壓維持在UVLO臨界值之上。
黑盒子讀回功能簡介
此IC有兩個制造商特有的專屬指令,可以用來讀回儲存在EEPROM中的黑盒子資料。READ_ BLACKBOX_CURR指令為一區讀取(Block-Read)指令,它會依本文中黑盒子的內容段的定義方式,回傳目前記錄N(最后被儲存的記錄)及所有相關資料。
READ_BLACKBOX_PREV指令為一區讀取指令,它會讀取前一筆的記錄N-1(倒數第二筆被儲存的記錄)資料。由于這些指令為區讀取指令,因此第一個收到的位元組被稱為BYTE_COUNT,是用來告知PMBus的主控者還有多少位元組要讀。 觀看黑盒子資料時,建議用ADP1055 GUI,因為它提供了易讀且使用者可存取的格式,來顯示整個黑盒子的內容(圖2)。
資料毀損功能
ADP1055中的黑盒子功能采用了封包錯誤檢查(Packet Error Checking, PEC)來確保資料的有效性,每一筆黑盒子記錄的最后一個PEC位元組,都是該筆記錄專屬,且透過周期性冗余檢查(Cyclic Redundancy Check, CRC)-8多項式所計算出來的。
在寫入EEPROM時,PEC位元組會被附在資料上且是該筆記錄的最后一個有效位元組。在讀取EEPROM時,每一筆記錄的頭區(Header Block)會被用來計算出一預期PEC碼,而此內部計算出來的PEC碼會與接收到的PEC碼進行比較。如果比較結果為不符,STATUS_CML暫存器中的PEC_ERR位元會被設定,而該記錄會因資料的有效性受到危及而被棄置。
資料偵測及復原功能
黑盒子演算法須要有充足的時間來儲存黑盒子資料,及/或進行頁清除動作,以便將黑盒子準備好來進行記錄。當VDD在最小寫入時間結束前就崩潰的情況下,就有可能發生EEPROM中資料的毀損;此外,如果VDD在EEPROM清除動作進行時崩潰,黑盒子內的資料也可能毀損。
當此情形發生時候,黑盒子演算法會偵測到資料毀損,并試圖采取矯正動作以便讓黑盒子的記錄繼續下去。請留意黑盒子不會嘗試去修正毀損的資料,而是忽略毀損的資料,并在另一筆記錄中回復繼續進行記錄。以下的敘述將詳細說明此情節。
在VDD電源啟動時,EEPROM兩頁中所有記錄的頭區會被讀取,并被判斷是否有效。如果該筆記錄能通過以下的測試,就會被視為有效:
?頭區與PEC位元組不可全部是1,因為這是每一筆記錄在頁清除之后的初始資料。
?計算出來的PEC碼(使用來自頭區的資料)必須符合接收到的PEC位元組。
?記錄的編號必須落在有效記錄的范圍內,也就是說,必須大于目前的記錄編號且小于最大記錄編號。
如果記錄無法通過以上任一測試,該記錄會被視為無效并被棄置。若記錄通過所有測試,則指到最后一筆有效記錄的指標器(Pointer)將被更新。
EEPROM的平均生命期與資料保留
先進PMBus數位控制器內部的EEPROM,是特別以電源供應器須能夠長期在現場使用的條件,做為其設計考量的。該EEPROM在125℃的條件下,具有高達15年的資料保存壽命。此外,在電源供應器的生命期內,會有多次寫入EEPROM,這也會是資料保存的限制因素。
為了改善EEPROM在過多次清除-寫入周期之后的資料可靠度,先進PMBus數位控制器將最大失效記錄的最大數量限制在158,000(當ADP1055的環境溫度低于85℃時的建議值),或16,000(當ADP1055的環境溫度低于125℃時的建議值)。
在每次黑盒子記錄到EEPROM之后,目前的記錄編號就會被累進;當失效發生而目前的記錄編號大于上述的最大記錄編號時,由于EEPROM已達到其最大容許清除-寫入周期數,任何新增的記錄已不可靠,因此不會再允許額外的黑盒子記錄,STATUS_CML暫存器中的MEM_ERR位元會被設定以顯示此狀況。
先進數位控制器可提供失效分析功能
圖4敘述了具有黑盒子功能的先進數位DC-DC控制器ADP1055,如何被使用在一典型的應用中,它適用于諸如全橋式(Full Bridge)、相位偏移(Phase Shifted)、主動箝位順向(Active Clamp Forward)等拓撲結構,并具有多種特點,如冗余OVP、平均與峰值過電流保護、使用mini FPGA的GPIO、及主動緩沖器(Snubber)(圖5)。
圖4 采用PMBus數位控制器的隔離DC-DC功率級架構圖
圖5 ADP1055評估板 圖片來源:亞德諾
本文介紹了使用先進的數位控制器所實現的黑盒子診斷法記錄的概念。這種新領域的晶片,透過失效訊息準確性的改善和失效診斷周轉時間的縮短,提供了客戶退貨失效分析的革新契機(圖6)。
圖6 先進數位控制器可使失效分析效能更上層樓。 圖片來源:亞德諾
黑盒子特性也可以被有效地部署應用在制造過程中,藉以在產品驗證和早期的試產階段,檢測出老化和環境測試下的失效。黑盒子將電源供應器的除錯帶入另一個階層,并為復雜系統的失效排除提供了聚焦性的指引。透過消除由黑盒子記錄器所發現的設計問題,此技術可降低客戶端故障,并提高可靠性指標,如平均失效間隔時間(MTBF)。