基于多特征權(quán)重分配的源代碼搜索優(yōu)化
在軟件開發(fā)過程中,代碼復(fù)用是提高軟件開發(fā)效率的重要手段。目前,互聯(lián)網(wǎng)中積累了大量的開源代碼,如知名開源庫GitHub、OSChina、CodePlex等。在編制程序時,程序員可以對這些開源代碼進(jìn)行復(fù)用,從而降低開發(fā)成本。代碼搜索是對其復(fù)用的前提。如何從開源軟件中準(zhǔn)確地提取高質(zhì)量的代碼資源并復(fù)用到軟件產(chǎn)品中,是提高軟件開發(fā)效率需要解決的重要問題。
針對代碼搜索算法輸入的不同形式,當(dāng)前已經(jīng)出現(xiàn)了基于關(guān)鍵字、接口、輸入輸出等形式的開源代碼搜索引擎。不同于其他輸入形式的搜索方法,由于方法簽名是開發(fā)者通過一些能表達(dá)方法功能的詞語根據(jù)駝峰命名法則命名的,所以基于關(guān)鍵字的搜索在匹配方法簽名時往往更能體現(xiàn)方法功能的匹配;但針對面向?qū)ο笳Z言開發(fā)的開源軟件,當(dāng)前基于關(guān)鍵字的搜索沒有考慮其源代碼具有多種代碼特征,或者只考慮了用戶查詢語句與方法簽名的單一匹配而忽視了源代碼的其他重要特征如注釋、類名等。比如源代碼注釋是對代碼功能的描述,其中含有能體現(xiàn)方法功能的大量信息,這些信息對搜索特定功能的源代碼是有幫助的。同理,類名中也含有少量體現(xiàn)代碼功能的信息,而且源代碼中各特征之間會有一定的聯(lián)系。匹配時不能僅僅匹配單一方法名或者將多個代碼特征轉(zhuǎn)化成純文本進(jìn)行搜索而不考慮各代碼特征的重要度,因此,將方法簽名、源代碼注釋、方法體等代碼特征結(jié)合起來應(yīng)用于代碼搜索中。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于多特征權(quán)重分配的源代碼搜索優(yōu)化下載
相關(guān)電子資料下載
- 英偉達(dá)神奇研究:用別的模型權(quán)重訓(xùn)練神經(jīng)網(wǎng)絡(luò),改神經(jīng)元不影響輸出! 124
- 一種層次權(quán)重決策分析方法 830
- 無需權(quán)重更新、微調(diào),Transformer在試錯中自主改進(jìn)! 611
- 一種自適應(yīng)權(quán)重MSRCR低照度圖像增強(qiáng)算法 1466
- 將線性Transformer作為快速權(quán)重系統(tǒng)進(jìn)行分析和改進(jìn) 1392
- 如何使用較小的語言模型,并用少量樣本來微調(diào)語言模型的權(quán)重 1682
- 探討神經(jīng)網(wǎng)絡(luò)基本架構(gòu):單元/神經(jīng)元、連接/權(quán)重/參數(shù)、偏置項 6204
- 紫光展銳新一輪融資和股權(quán)重組已于日前完成 6271
- 不同于針對壓縮單個權(quán)重的方法 2049
- 量子霸權(quán)重大突破的重要意義 2821