chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

代碼革命的先鋒:aiXcoder-7B模型介紹

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2025-05-20 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

?

國內(nèi)開源代碼大模型

4月9日aiXcoder宣布正式開源其7B模型Base版,僅僅過去一個禮拜,aiXcoder-7B在軟件源代碼托管服務平臺GitHub上的Star數(shù)已超過2k。同時躋身HuggingFace趨勢榜單TOP30,令全球開發(fā)者矚目。

?

wKgZPGgsJBeAO6ziAAXwy3faxSY339.png

?

背后團隊

aiXcoder 團隊來自北京大學軟件工程研究所,2013就開始搞代碼生成,他們不但是國際上最早將深度學習技術(shù)用于程序代碼處理的團隊,也是最早推出基于深度學習的編程產(chǎn)品的團隊,從一開始他們就抓住并專注于代碼大模型這個前沿賽道。

團隊長期聚焦軟件工程、系統(tǒng)軟件、程序理解、程序生成、深度學習、可信人工智能等前沿領域,在多個國內(nèi)外頂級會議與期刊發(fā)表相關(guān)論文100余篇,多篇被國際同行視為“首創(chuàng)成果”。

從學界最前沿的理論研究,到廣泛應用部署的商業(yè)實踐,aiXcoder致力于將前沿人工智能技術(shù)應用于軟件工程,聚焦代碼大模型的企業(yè)個性化落地技術(shù),助力企業(yè)實現(xiàn)智能化開發(fā),為未來商業(yè)落地打下堅實基礎。

?

發(fā)展歷史

2017年,aiXcoder最開始的雛形——aiXcoder1.0發(fā)布,提供代碼自動補全與搜索功能。

2021年4月,團隊推出完全自主知識產(chǎn)權(quán)的十億級參數(shù)代碼大模型aiXcoder L版,支持代碼補全和自然語言推薦。這也是國內(nèi)?個基于“?模型”的智能編程商?產(chǎn)品。

2022年6月再次推出了國內(nèi)首個支持方法級代碼生成的百億級參數(shù)量模型aiXcoder XL版,同樣具有完全自主知識產(chǎn)權(quán)。

2023年7月,aiXcoder團隊推出聚焦企業(yè)適配的aiXcoder Europa,具有代碼自動補全、代碼自動生成、代碼缺陷檢測與修復、單元測試自動生成等功能。aiXcoder Europa可根據(jù)企業(yè)數(shù)據(jù)安全和算力要求,為企業(yè)提供私有化部署和個性化訓練服務,有效降低代碼大模型的應用成本,提升研發(fā)效率。

2024年4月9日,aiXcoder-7B Base版誕生。

?

有何能耐

盡管aiXcoder只是一個7B大小的模型,但在HumanEval、MBPP和MultiPL-E等主流代碼生成評測集上,它平均得分居然超過340億參數(shù)的Codellama。要知道,后者來自Meta、基于Llama2,可是開源界最先進的AI編程大模型之作。

?

wKgZO2gsJBeAYbe2AAEkuQMrLBU886.jpg

?

?

核心能力

代碼生成與補全的卓越性能

aiXcoder-7B模型在HumanEval、MBPP和MultiPL-E等主流評測集上的表現(xiàn)超越了參數(shù)規(guī)模更大的模型,這得益于其深度學習架構(gòu)和大規(guī)模的訓練數(shù)據(jù)。它能夠生成和補全包括方法塊、條件判斷、循環(huán)處理、異常捕捉等多種代碼結(jié)構(gòu),大大提升了代碼編寫的效率。

測試顯示,在貼近真實開發(fā)場景的評測集CrossCodeEval上,aiXcoder-7B一舉拿下了同級別模型的最好效果:

wKgZPGgsJBmAabHLAAW7NvxlbIc572.png

?

企業(yè)級場景的深度定制與私有化部署

aiXcoder-7B模型支持企業(yè)根據(jù)自身的軟件開發(fā)框架和API庫進行個性化訓練,確保模型能夠理解并適應企業(yè)特定的代碼規(guī)范和業(yè)務邏輯。同時,模型的私有化部署能力,讓企業(yè)能夠在本地安全地使用模型,保護了企業(yè)的核心知識產(chǎn)權(quán)。

?

跨文件的智能分析與補全

aiXcoder-7B模型不僅理解單個文件的上下文,還能跨多個文件進行智能分析,這對于大型軟件項目尤為重要。模型能夠識別項目中不同文件的關(guān)聯(lián),生成和補全代碼時考慮到整個項目的結(jié)構(gòu),提高了代碼的一致性和可維護性。

測試顯示,aiXcoder-7B Base版結(jié)合單文件上下文的代碼補全能力超越StarCoder2、CodeLlama等一眾模型,在Python、JS和Java語言上綜合得分最高。

wKgZO2gsJBqAW_lFAAN-6wpspQQ187.png

?

持續(xù)的技術(shù)創(chuàng)新與優(yōu)化

aiXcoder團隊在模型訓練中采用了創(chuàng)新的方法,如將代碼的抽象語法樹結(jié)構(gòu)融入預訓練過程,顯著提升了模型對代碼語義和邏輯的理解能力。此外,團隊還構(gòu)建了大規(guī)模的優(yōu)質(zhì)代碼語料庫,通過精心的數(shù)據(jù)預處理,確保了模型訓練的質(zhì)量和效果。

?

應用案例

金融行業(yè)代碼生成應用

以正在進行數(shù)智化轉(zhuǎn)型的某行業(yè)頭部券商為例,該企業(yè)采用了aiXcoder的大模型解決方案,在本地環(huán)境私有化部署代碼大模型,并結(jié)合企業(yè)自身領域知識進行個性化訓練。結(jié)果顯示,在業(yè)務邏輯代碼上,代碼生成占比提升了2倍,顯著提高了開發(fā)效率。

?

跨文件動態(tài)規(guī)劃狀態(tài)類補全

在另一個案例中,aiXcoder-7B模型展現(xiàn)了其跨文件分析的能力。面對需要在樹結(jié)構(gòu)上應用動態(tài)規(guī)劃的復雜任務,模型準確識別了不同文件間的邏輯關(guān)系,并給出了正確的預測結(jié)果,展現(xiàn)了其在處理復雜編程問題上的實力。

?

技術(shù)細節(jié)

訓練數(shù)據(jù)的構(gòu)建與優(yōu)化

aiXcoder-7B模型的訓練數(shù)據(jù)量達到了1.2T Unique Tokens,這一龐大的數(shù)據(jù)集經(jīng)過了嚴格的語法分析和靜態(tài)分析,排除了常見的Bug和代碼缺陷,確保了模型訓練的高質(zhì)量。

?

預訓練方法的創(chuàng)新

aiXcoder團隊在預訓練方法上進行了創(chuàng)新,將代碼的抽象語法樹結(jié)構(gòu)融入到預訓練過程中,這一方法有效地提升了模型對代碼結(jié)構(gòu)特征的捕捉能力,從而生成更高質(zhì)量的代碼。

?

模型的個性化訓練技術(shù)

aiXcoder-7B模型的個性化訓練技術(shù)是其另一大亮點。通過構(gòu)建企業(yè)專屬的數(shù)據(jù)集和測評集,結(jié)合企業(yè)代碼特征和員工編程習慣,模型能夠更好地適應企業(yè)的開發(fā)環(huán)境,實現(xiàn)更高效的個性化應用。

?

總結(jié)

科技的璀璨星河中,每一次技術(shù)的突破都如同新星的誕生,照亮了未來的無限可能。隨著代碼大模型的能力日益增強,它們在解決復雜編程問題上的卓越表現(xiàn),不僅在提高軟件開發(fā)的效率和質(zhì)量上發(fā)揮著重要作用,在推動編程自動化的浪潮中扮演著關(guān)鍵角色,更激發(fā)了程序員們的創(chuàng)新潛能,讓他們能夠?qū)⒏嗟木ν度氲教剿骱蛣?chuàng)造中。

aiXcoder-7B模型的出現(xiàn),預示著軟件開發(fā)領域?qū)⒂瓉硪粓鲂碌母锩?。隨著技術(shù)的不斷進步,aiXcoder-7B將成為軟件開發(fā)領域中的“新質(zhì)生產(chǎn)力”,幫助企業(yè)實現(xiàn)智能化開發(fā),推動技術(shù)行業(yè)的生態(tài)發(fā)展。

隨著代碼大模型不斷發(fā)展,不僅加速了軟件開發(fā)自動化的進程,更在重塑技術(shù)行業(yè)的生態(tài),引領著未來發(fā)展的趨勢:加快實現(xiàn)軟件開發(fā)自動化。這既是行業(yè)大勢所趨,更是發(fā)展的必然選擇。榮幸的是,我們正站在這個轉(zhuǎn)折點面前,見證著這一趨勢的興起和實現(xiàn)。

作為一名IT技術(shù)人員,我對代碼大模型的未來發(fā)展充滿期待。它不僅解決了當前軟件開發(fā)中的多個痛點,更為大家展示了一個全新的編程未來。模型的不斷開源和企業(yè)級特性,將推動整個行業(yè)向更高效、更智能的方向發(fā)展。對于熱愛編程的人來說,不僅僅是一個工具,更是一個能夠激發(fā)創(chuàng)新、提升生產(chǎn)力的伙伴。讓我們一起期待并擁抱這場由AI引領的編程革命吧!

?

開源地址

https://github.com/aixcoder-plugin/aiXcoder-7B

https://gitee.com/aixcoder-model/aixcoder-7b

https://www.gitlink.org.cn/aixcoder/aixcoder-7b-model

感興趣的小伙伴可自行體驗,也可以等我后續(xù)的測試分享,讓我們一起支持國產(chǎn)開源大模型吧!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1805

    文章

    48898

    瀏覽量

    247831
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5557

    瀏覽量

    122645
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3085

    瀏覽量

    3963
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2K0300先鋒派Openharmony開發(fā)介紹

    *附件:2K0300先鋒派Openharmony開發(fā)介紹-241114.pdf
    發(fā)表于 11-17 21:36

    KaihongOS操作系統(tǒng)FA模型與Stage模型介紹

    FA模型與Stage模型介紹 KaihongOS操作系統(tǒng)中,F(xiàn)A模型(Feature Ability)和Stage模型是兩種不同的應用
    發(fā)表于 04-24 07:27

    廣東龍芯LS2K500先鋒板使用介紹

    以下內(nèi)容1.龍芯2K500先鋒板硬件介紹:2.龍芯2K500先鋒板使用入門。 龍芯LS2K500先鋒板使用介紹-230408.pd
    發(fā)表于 04-22 21:26

    詳細介紹CY7B991,CY7B992的信息及RoboClo

    The following application note provides a detailed description of the CY7B991, CY7B
    發(fā)表于 05-25 15:58 ?16次下載

    先鋒LED-39B500液晶電視數(shù)據(jù)資料免費下載

    本文檔的主要內(nèi)容詳細介紹的是先鋒LED39B500數(shù)據(jù)資料免費下載。
    發(fā)表于 11-26 08:00 ?44次下載

    華為是5G革命性技術(shù)的先鋒

    《時代》的評語稱:任正非并不是計算機天才,但他的管理工作幫助華為成為全球最大的電信設備公司。華為是5G革命性技術(shù)的先鋒,這項技術(shù)將為第四次工業(yè)革命中的無人駕駛汽車和智能工廠提供動力。
    發(fā)表于 04-22 09:01 ?794次閱讀

    使用單卡高效微調(diào)bloom-7b1,效果驚艷

    在本文中我們將對QLoRA的基本原理進行介紹,并且在Firefly項目中進行實踐。我們在bloom-7b1的基礎上,使用QLoRA進行中文指令微調(diào),獲得firefly-7b1-qlora-v0.1
    的頭像 發(fā)表于 06-08 15:19 ?2486次閱讀
    使用單卡高效微調(diào)bloom-<b class='flag-5'>7b</b>1,效果驚艷

    智能開源大模型baichuan-7B技術(shù)改進

    baichuan-7B 主要是參考LLaMA進行的改進,且模型架構(gòu)與LLaMA一致。而在開源大模型中,LLaMA無疑是其中最閃亮的星,但LLaMA存在如下問題: LLaMA 原生僅支持 Latin
    的頭像 發(fā)表于 06-17 14:14 ?1317次閱讀

    Meta推出最新版AI代碼生成模型Code Llama70B

    Meta近日宣布了其最新版本的AI代碼生成模型Code Llama70B,并稱其為“目前最大、最優(yōu)秀的模型”。這一更新標志著Meta在AI代碼
    的頭像 發(fā)表于 01-30 18:21 ?1777次閱讀

    谷歌發(fā)布用于輔助編程的代碼模型CodeGemma

    谷歌發(fā)布了用于輔助編程的代碼模型 CodeGemma。CodeGemma 基于谷歌今年 2 月發(fā)布的輕量級開源大模型 Gemma,針對 Gemma 的兩個不同參數(shù)規(guī)模的版本 Gemma 2B
    的頭像 發(fā)表于 04-17 16:07 ?1052次閱讀
    谷歌發(fā)布用于輔助編程的<b class='flag-5'>代碼</b>大<b class='flag-5'>模型</b>CodeGemma

    Zyphra推出Zamba2-mini 1.2B模型

    近日,AI創(chuàng)新先鋒Zyphra公司在科技界投下了一顆震撼彈,正式揭曉其最新力作——Zamba2-mini 1.2B模型。這款被譽為端側(cè)SOTA(State-Of-The-Art)級別的小語言
    的頭像 發(fā)表于 08-29 18:13 ?1002次閱讀

    阿里云開源Qwen2.5-Coder代碼模型系列

    Qwen2.5-Coder-32B-Instruct,在代碼生成領域取得了顯著成就。據(jù)官方介紹,該模型在EvalPlus等十多個主流的代碼
    的頭像 發(fā)表于 11-14 11:28 ?903次閱讀

    阿里通義千問代碼模型全系列開源

    近日,阿里云通義大模型團隊宣布了一項重大決策:將通義千問代碼模型全系列正式開源。此次開源的模型系列共包含6款Qwen2.5-Coder模型
    的頭像 發(fā)表于 11-14 15:26 ?925次閱讀

    獵戶星空發(fā)布Orion-MoE 8×7B模型及AI數(shù)據(jù)寶AirDS

    近日,獵戶星空攜手聚云科技在北京共同舉辦了一場發(fā)布會。會上,獵戶星空正式揭曉了其自主研發(fā)的Orion-MoE 8×7B模型,并與聚云科技聯(lián)合推出了基于該大模型的數(shù)據(jù)服務——AI數(shù)據(jù)寶AirDS
    的頭像 發(fā)表于 11-29 13:57 ?624次閱讀

    使用 QWQ:32B 模型搭配 VSCode 的 Cline 插件實現(xiàn)自動化代碼編程!

    。結(jié)合 Visual Studio Code(VSCode)的 Cline 插件,開發(fā)者可以實現(xiàn)高效的自動化代碼編程。本文將詳細介紹如何配置和使用 QWQ:32B 模型與 Cline
    的頭像 發(fā)表于 03-21 18:12 ?542次閱讀
    使用 QWQ:32<b class='flag-5'>B</b> <b class='flag-5'>模型</b>搭配 VSCode 的 Cline 插件實現(xiàn)自動化<b class='flag-5'>代碼</b>編程!