近日,國際電信聯盟電信标準分局第十六研究組(ITU-T SG16)于法國雷恩召開(kāi)全體會(huì)議(yì),《基于人工(gōng)智能(néng)的代碼生成技術要求和(hé)評估方法》國際标準項目成功獲得立項通過。據了(le)解,該項目由中國信通院牽頭,聯合華爲雲等産學研機構共同提出,這(zhè)也(yě)是國際上(shàng)首個代碼大(dà)模型的标準項目。
随着預訓練大(dà)模型、生成式人工(gōng)智能(néng)等技術的迅速發展,智能(néng)化應用(yòng)的深度和(hé)廣度持續提升,軟件工(gōng)程也(yě)正在經曆一場智能(néng)化變革,大(dà)模型所具備的生成和(hé)理(lǐ)解等能(néng)力驅使軟件工(gōng)程走向智能(néng)化道(dào)路,以代碼大(dà)模型爲基石的智能(néng)化軟件工(gōng)程新體系已初步形成。随着代碼大(dà)模型的規模不斷壯大(dà),各大(dà)榜單的評估結果卻存在較大(dà)差異性。因此,建立一套客觀公平、體系完整的代碼大(dà)模型評估體系迫在眉睫。
《基于人工(gōng)智能(néng)的代碼生成技術要求和(hé)評估方法》國際标準圍繞代碼大(dà)模型相關的通用(yòng)能(néng)力、專用(yòng)場景能(néng)力和(hé)應用(yòng)成熟度,主要從(cóng)輸入多樣性、任務多樣性、語言完備度、結果可接收性、結果準确度等維度,對(duì)代碼大(dà)模型提出了(le)全棧技術和(hé)管理(lǐ)要求。
國際電信聯盟(ITU)是國際三大(dà)标準化組織之一,其成員包括190多個國家、900多個公司與學術機構,是全球影響最廣、參與國家和(hé)成員最多、最具權威性的國标标準機構之一。此次國際标準項目的成功立項,有助于推動全球範圍對(duì)代碼大(dà)模型的整體技術框架形成認同和(hé)共識,提升代碼大(dà)模型的能(néng)力,促進代碼大(dà)模型的規範化應用(yòng),也(yě)标志着我國科技企業在智能(néng)化軟件工(gōng)程領域的技術探索受到(dào)國際認可。
華爲雲多年來(lái)在智能(néng)化軟件工(gōng)程領域持續開(kāi)展深入研究,此國際标準的研制中,華爲雲充分貢獻了(le)前期研究成果。早在2022年,華爲諾亞方舟實驗室聯合華爲雲PaaS技術創新實驗室,基于華爲的基礎大(dà)模型,研制出代碼大(dà)模型。2023年,華爲雲在此基礎上(shàng)進一步推出能(néng)力更強大(dà)的代碼大(dà)模型,在使用(yòng)相對(duì)更少的訓練數據和(hé)計(jì)算(suàn)資源的情況下(xià),代碼生成一次通過率大(dà)幅超越同等規模的模型,甚至可以做到(dào)遠超參數量規模更大(dà)的模型。
華爲雲CodeArts Snap是基于華爲雲盤古研發大(dà)模型的智能(néng)開(kāi)發助手,重塑智能(néng)化軟件研發的新範式,讓開(kāi)發者更加聚焦業務創新,事(shì)半功倍。基于智能(néng)生成、智能(néng)問答(dá)2大(dà)核心能(néng)力,覆蓋代碼生成、研發知(zhī)識問答(dá)、單元測試用(yòng)例生成、系統測試腳本代碼生成、代碼解釋、代碼注釋、代碼翻譯、代碼調試、代碼檢查等多種研發場景,釋放(fàng)軟件研發生産力。
軟件研發過程需經過多輪分層測試,包括單元測試、集成測試、系統測試、E2E場景驗收測試等。傳統自(zì)動化時(shí)代,需要消耗大(dà)量的測試開(kāi)發人力開(kāi)發測試代碼,以實現(xiàn)測試執行自(zì)動化。
華爲雲CodeArts Snap的測試腳本生成功能(néng)可以基于測試人員所寫的測試步驟自(zì)然語言描述,智能(néng)生成測試腳本代碼。該功能(néng)适用(yòng)于面向企業各産品領域特定測試框架和(hé)自(zì)定義一方、二方、三方測試方法庫的測試生成場景,實現(xiàn)根據測試業務上(shàng)下(xià)文(wén)檢索并增強生成測試方法和(hé)參數賦值。