摘 要: 提出了基于軟件開發過程數據,構造用于可靠性預測的過程數據庫,并分析了此數據庫的內容與運作模型,以期得到更加可信、準確的軟件可靠性預測結果,為后續的研究奠定數據基礎。
關鍵詞: 軟件過程; 軟件可靠性; 過程數據庫
從20世紀70年代起,軟件可靠性預測技術大體上分為靜態和動態兩種。早期的靜態預測主要研究可靠性和軟件規模、程序復雜度等基本屬性之間的關系,以此預測軟件的可靠性。20世紀90年代初,人們發現缺陷在軟件中是隨機分布的,既而出現了針對缺陷分布的預測技術,也有一些取得了比較好的成果和應用。例如基于軟件規模的Halstead模型以及Lipow在此模型機上改進所得到的軟件缺陷與可執行代碼行之間的關系模型;Takahashi將代碼與具體的文檔數量對應起來,給出了缺陷密度的估計;Malaiya等在假設模塊規模符合指數分布的情況下,提出了缺陷估算的公式:缺陷密度D(s)=a/s+b+cs,指出軟件缺陷取決于程序員能力、過程成熟度以及測試程度等。20世紀90年代,隨著軟件規模和復雜度的不斷增長,同時由于面向對象技術的出現,許多基于面向對象度量元的缺陷預測技術涌現出來。而隨著軟件過程技術的發展,人們逐漸認識到了軟件過程對于軟件可靠性的影響[1-6]。不難發現,靜態預測主要是基于缺陷相關的度量數據,對缺陷的數量或者分布進行預測的技術;而動態預測則是基于缺陷或者失效產生的時間,對系統缺陷隨時間的分布進行預測的技術。這些現有的軟件可靠性預測模型一般只是對與缺陷有關的度量數據和對軟件可靠性測試后的失效數據進行分析,而忽略了軟件開發過程中大量有用信息。因此,筆者提出了基于軟件過程數據,構造用于可靠性預測的過程數據庫,并分析了此數據庫的內容與運作模型,以期得到更加可信、準確的軟件可靠性預測結果,為后續的研究奠定數據基礎。
1 軟件過程與軟件可靠性
軟件過程可以定義為人們用來開發和維護軟件以及相關產品(如工程計劃、設計文檔、規章、檢測事例及用戶手冊)的一組活動、方法、實踐及轉換[7]。軟件可靠性是軟件系統在規定時間內及規定的環境條件下,完成規定功能的能力。在ISO/IEC 9126的軟件質量特性表述中,軟件可靠性(Software Reliability)是軟件質量的一個重要特性。而軟件產品是軟件過程的產物,軟件過程的好壞決定了軟件產品的好壞,軟件過程的穩定也決定了軟件產品質量的穩定。軟件產品質量的穩定直接反映了軟件可靠性的穩定。SEI提出的CMM以及CMMI里也指出,軟件過程能力成熟度反映了一個軟件企業的過程能力以及開發能力,過程穩定的企業或者團隊,其軟件產品的質量也是相對穩定的。據此,不難得到這樣的結論:穩定的軟件過程,其軟件產品的可靠性也是穩定的[8]。
2 影響軟件可靠性的因素
在對13個公司的調查結果進行分析后,參考文獻[9]提出了基于經驗數據的影響軟件可靠性的32個因素。這32個因素貫穿了軟件開發的各個階段,其中最重要的是軟件復雜度、程序員的技能、測試工作量、測試覆蓋率、測試環境和程序規格說明書的改動頻率6個因素[9]。參考文獻[10]指出了影響軟件可靠性的主要因素包括: 需求的變更、開發團隊的經驗、設計的變更、編碼和測試、新技術、開發語言以及工具的使用、管理經驗、高層管理的支持力度、度量和模型的使用情況[10]。參考文獻[11]認為開發的復雜程度、代碼重用的比率以及軟件開發團隊的經驗和受教育程度是影響軟件可靠性的主要因素。參考文獻[12]指出影響軟件可靠性的因素可分為兩大類:缺陷引入和缺陷檢測。缺陷引入又由16個因素決定,而缺陷檢測由17個因素決定。這些因素中,與過程有關的因素包括開發人員的能力、領域知識、團隊協作、團隊結構、管理能力、程序復雜度、溝通能力、項目管理、過程管理、變更控制、文檔質量、需求質量、開發環境、計劃偏移度、開發過程成熟度、產品調研等[12]。軟件過程度量的三大類基本內容分別是質量、時間和資源,質量表示在不同的過程運作階段過程產品和過程執行有關的質量信息(例如軟件問題及其生命周期,過程執行的偏離度等),時間表示過程運作中各項活動的計劃時間和實際時間,資源表示在過程運作中不同階段活動消耗的物資資源和人力資源。綜合分析這些文獻提出的影響軟件可靠性的因素,不難發現,其中,很多因素也是軟件過程度量所關注的信息。
3 軟件可靠性預測度量體系
在已有的調查研究基礎之上[13-15],筆者構建了基于軟件過程的軟件可靠性預測度量體系。該體系模型共劃分為6個層次:影響軟件可靠性因素、影響軟件可靠性因子、特性、子特性、度量以及度量元。其層次結構如圖1所示。其中,軟件可靠性取決于影響軟件可靠性因素的性能如何,而對軟件可靠性因素的評價表現在多個可靠性因子,不同的可靠性因子的影響基于不同的性能特性,特性可能有子特性,通過度量來評價可靠性因子的特性和子特性,同時度量又有多種數據表現形式,即多個度量元。
對軟件可靠性的預測,筆者確定了6個影響軟件可靠性的主要因素,分別是:一般性因素、穩定性因素、過程依從性、開發文檔、編碼和人力資源因素。軟件測試因其產生的數據是軟件失效后的數據,更多的用于軟件可靠性的動態預測,故此處不予以考慮。對這6個可靠性因素的評價,筆者建立了如表1所示的度量和度量元,并據此來構建基于軟件過程的軟件可靠性預測度量體系。
4 基于軟件過程的軟件可靠性預測
一個過程穩定的軟件企業,其軟件產品的可靠性也是穩定的。通過對影響軟件可靠性的過程因素的分析,筆者確定了上述的度量和度量元。而軟件企業若考慮從歷史數據中得到關于以前項目的過程等信息,就必須擁有過程數據庫。過程數據庫的建設需要人員和軟件工具的支撐,如圖2所示。該過程數據庫建設模型結合前述分析,并綜合考慮了軟件度量技術和CMM/CMMI中的度量技術后抽象而成。
根據企業的測量定義,工作人員可以知道應該采集什么數據,并通過數據采集工具包使測量數據進入過程數據庫系統;另外工作人員也可以通過問題跟蹤軟件包(例如需求跟蹤系統)直接使測量數據進入過程數據庫。過程數據庫中除存儲了影響軟件可靠性的因素的度量值外,還應包含理解和解釋實際度量數據、評價其合理性和適用性所需要的信息和索引,以及可靠性分析的標準、模型和基線值、優先級等。
通過對過程數據庫里的基本測量項數據進行分析計算,得到關于以往項目的軟件可靠性相關的度量,此度量數據經過評估標準和預測模型分析,形成當前軟件產品的可靠性分析預測報告。
基于知識和數據挖掘的軟件可靠性預測是現在和未來幾年研究的方向。本文首先分析討論了軟件過程與軟件可靠性的關系,然后分析了影響軟件可靠性的因素,最后討論了建立基于軟件過程數據的過程數據庫,并抽象出運作模型,為后續的基于知識和數據挖掘的軟件可靠性研究奠定數據基礎。軟件可靠性預測中一些其他重要問題,如軟件可靠性預測環境的構建、軟件可靠性預測模型的選擇以及定量評價數據的驗證等問題,還有待進一步探討。
參考文獻
[1] HALSTEAD M H. Elements of software science. New York: Elsevier, North-Holland, 1977.
[2] OTTENSTEIN L. Predicting numbers of errors using software science. ACM SIGMETRICS Performance Evaluation Review, 1981, 10(1):157-167.
[3] OTTENSTEIN L. Quantitative estimates of debugging requirements. IEEE Trans. on Software Engineering,1979, SE-5(5):504-514.
[4] LIPOW M. Number of faults per line of code. IEEE Trans. on Software Engineering, 1982,8(4):437-439.
[5] TAKAHASHI M, KAMAYACHI Y. An empirical study of a model for program error prediction. IEEE Trans. on Software Engineering, 1989,15(1):82-86.
[6] MALAYIA Y, DENTON J. Module size distribution and defect density. In:Proc.of the 11th Int’l Symp. on Software Reliability Engineering. New York: IEEE Computer Society Press, 2000. 62-71.
[7] ZAHRAN S著.軟件過程改進[M]. 陳新,譯. 北京:中信出版社,2002.
[8] 吳洪麗. 支持軟件過程改進的軟件過程度量研究[D]. 重慶:重慶大學計算機學院,2004.
[9] ZHANG X, PHAM H.An analysis of factors affecting software reliability. The Journal of Systems & Software,2000, 50(1):43-56.
[10] SCHNEBERGER S L. Distributed computing environments: effects on software maintenance difficulty. Journal of Systems and Software,1997,37(2):101-116.
[11] EVANCO W M, LACOVARA R. A model-based framework for the integration of software metrics. Journal of Systems and Software,1994,26(1):77-86.
[12] JACOBS J J. MOLL V. Identification of factors that influence defect injection and detection in development of software intensive products. Information and Software Technology,2007,49(7):774-789.
[13] 王鐵江,酈萌.軟件可靠性的模糊綜合評估模型[J].計算機工程與應用,2002,38(20):23-26.
[14] 田濤,王昕. 一種基于模糊綜合評判的軟件可靠性模型選擇方法[J]. 空軍工程大學學報:自然科學版,2002,3(2):56-59.
[15] 馬颯颯, 陳自力.軟件可靠性定量評估過程研究[J]. 計算機測量與控制, 2005,13(5):503-505.