久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区

會寫代碼的 AI 開源了:掌握 12 種編程語言 C 語言寫得比 Codex 還要好

人工智能
2022
03/11
11:09
量子位
分享
評論

來源:量子位

比 Codex 還會寫 C 語言的 AI 代碼生成模型,現在開源了!這段時間,用 AI 寫代碼可以說是大火,其中最著名的要屬 OpenAI 的 Codex 和 DeepMind 的 AlphaCode。然而,這兩個 AI 模型,全都沒有開源:其中 AlphaCode 只給出了一些測試樣例,而 Codex 只開放了 API。

△基于 Codex 的 Copilot

為此,來自 CMU 的幾個研究人員,用 GPT-2 搞出了一個名叫PolyCoder的 AI 代碼生成模型,而且還是開源的

據研究人員表示,雖然 PolyCoder 最大只有 27 億參數(相比 Codex 有 120 億參數),但它用C 語言寫出來的代碼,比 Codex 的效果還要好。

這里面究竟有什么秘訣?

用 12 種編程語言代碼集訓練

首先來看訓練用的數據集,這也是 PolyCoder 的最大特點之一。

此前,包括 Codex、CodeParrot 等 AI 代碼生成模型,主要都是基于Python語言的代碼來訓練。

例如 Codex 的評估數據集之一 HumanEval,評估的也是生成 Python 代碼的效果。

相比之下,PolyCoder采用了多種編程語言代碼集來訓練,一共有 12 種:

C、C#、C++、Go、Java、JavaScript、PHP、Python、Ruby、Rust、Scala 和 TypeScript。

其中,C 語言的代碼量是最多的,達到了 221GB;而 Python 代碼的數據量比 Codex 和 CodeParrot 用得都要少。

這里 PolyCoder 用的是 GitHub 上的公開代碼,主要選取的是各種編程語言中比較受歡迎的庫,每個庫至少有 50 Stars。

據研究人員表示,每種編程語言庫的 Stars 總數加起來不超過 25k,以避免模型生成的代碼效果太過于傾斜最流行的編程語言(通常編程語言越流行,庫的 Stars 就越多)。

通過提取庫中的文件、經過簡單處理(包括消除重復代碼)后,一共篩選出大約254GB的數據用于訓練。

然后是預訓練的方法。

語言模型的預訓練方法通常有三種。

第一種是自左向右的語言模型,根據上文預測下文,比較適用于代碼生成等;第二種是掩蔽語言模型,基于上下文預測屏蔽片段,比較適合代碼分類等;第三種是編解碼器模型,比較適用于代碼注釋等任務。

這里 PolyCoder 主要采用的是第一種預訓練方法。

相比于同樣采用 GPT-2 訓練的 CodeParrot 和 Codex,PolyCoder 在超參數設置上也稍微有一些差異:

PolyCoder 一共提供了三種不同的模型,分別有 27 億參數、4 億參數和 1.6 億參數,研究人員可以根據自身需求和不同的訓練能力來選取合適的模型。

那么,最終訓練出來的 AI 模型,代碼生成效果如何?

C 語言寫得尤其好,但 Python 不行

研究人員將 PolyCoder 與已有的 AI 代碼生成模型進行了對比。

由于 AlphaCode 不好比較(接口沒開放),所以研究人員主要分析了下面這些模型,包括 GPT-Neo、CodeParrot 和 Codex 等。

其中藍色的是開源的,橙色的是沒開源的:

從參數量來看,PolyCoder 并不是最頂尖的,最大的 27 億參數模型也只有 Codex 的四分之一不到。

研究人員先是用語言模型評估常用的困惑度對一系列模型進行了比較。

困惑度(Perplexity),用于衡量語言模型(LM)的好壞。困惑度越低,語言模型面對代碼感到困惑的程度就越低,模型生成效果越好。

從圖中來看,PolyCoder 在C 語言中意外取得了最好的效果(困惑度最低)。

用大量 C 語言訓練 PolyCoder 的結果說明,即使模型整體原理不變(基于 GPT-2),單純改變訓練用的代碼集,也能訓練出擅長不同語言風格的 AI 代碼生成模型。

可惜的是,從其他語言來看,生成的效果就完全沒辦法和 Codex 相比了:

例如,在主要用于評估 Python 代碼的 HumanEval 上,PolyCoder 的能力遠不如 Codex 好:

據論文分析,這可能是 Python 代碼數據量、模型參數量不足等原因導致的。

此外,作者們也提到,做出 PolyCoder 的目的主要還是為了開源一個 AI 代碼生成模型,讓更多人參與研究和使用。

目前代碼已經開源,無論是直接拿來用,還是試著在它的基礎上開發新模型都可以。

感興趣的小伙伴可以上手一試了 ~

作者介紹

一作許方正(Frank Xu),目前在 CMU 讀博,研究方向是 NLP、信息抽取等,發表過多篇頂會論文,包括 ICLR、ACL 和 EMNLP 等。本碩畢業于上海交通大學,師從朱其立教授。

Uri Alon,在 CMU 進行博士后工作,研究方向是編程語言處理(PLP)、NLP 和深度學習。

Graham Neubig,CMU 助理教授,研究方向是 NLP、機器翻譯和基于機器學習的自然語言理解。

Vincent J. Hellendoorn,CMU 計算機助理教授,主要研究方向是軟件工程和機器學習,致力于利用智能方法幫助軟件開發人員減少代碼調試、程序優化等繁瑣工作的時間。

不知道作者們是否已經在用這個 AI 擼代碼了(手動狗頭)

THE END
廣告、內容合作請點擊這里 尋求合作
ai
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

1 月 25 日消息,近日,網易試水 AI 音樂創作,推出全球首個一站式音樂創作平臺天音。
業界
該研究是由三星高級技術研究院(SAIT)與三星電子代工業務和半導體研發中心一起展開,由SAIT員工研究員Seungchul Jung博士、SAIT研究員、哈佛大學教授Donhee Ham博士、以及SAIT技術副總裁Sang Joon Kim博...
業界
1 月 12 日消息,根據韓國媒體 businesskorea 報道,韓國科學技術研究院(KAIST)研發出了一種專門針對 AI 人工智能相關運算進行優化的 SSD。
業界
根據Politico的報道,Clearview AI有望為其面部識別技術獲得一項美國專利。
業界
11 月 16 日消息,據“清華大學智能產業研究院”公眾號消息,日前,華深智藥、清華大學智能產業研究院(AIR)和清華大學醫學院共同合作,利用新型人工智能抗體平臺,在新冠抗體設計和優化等方面取得了突破...
業界

相關推薦

1
3
久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区
欧美成人欧美edvon| 国产日产精品1区| 亚洲欧洲精品成人久久奇米网| 一本一本大道香蕉久在线精品| 国产精品色哟哟| 久久国产精品无码网站| 岛国精品一区二区| 国产女人水真多18毛片18精品视频| 狠狠色丁香婷婷综合| 国产精品日韩精品欧美在线| 91福利社在线观看| 国产成人亚洲综合a∨猫咪| 一级日本不卡的影视| 欧美大片在线观看一区二区| 麻豆精品国产91久久久久久| 日韩免费一区二区| 99精品视频在线观看免费| 亚洲一区二区三区精品在线| 欧美国产日韩亚洲一区| 日韩欧美国产午夜精品| 波多野结衣欧美| 激情久久五月天| 亚洲午夜三级在线| 亚洲午夜久久久久久久久久久 | 国产欧美日韩一区二区三区在线观看| 在线视频一区二区三区| 不卡av免费在线观看| eeuss鲁一区二区三区| 午夜精品一区在线观看| 国产女同互慰高潮91漫画| 精品少妇一区二区三区在线播放| 精品1区2区3区| 91久久线看在观草草青青 | 亚洲视频免费看| 亚洲高清免费在线| 亚洲一区影音先锋| 国产精品卡一卡二卡三| 欧美亚洲一区二区在线| 日本韩国欧美一区| 在线免费亚洲电影| 精品国产91久久久久久久妲己| 欧美视频一二三区| 成人午夜在线播放| bt7086福利一区国产| 欧美一级二级三级乱码| 综合久久给合久久狠狠狠97色| 一区二区三区国产精品| 国内偷窥港台综合视频在线播放| 91在线观看美女| 久久午夜国产精品| 麻豆成人91精品二区三区| 亚洲国产精品一区二区www| 国产成人av网站| 欧美一级欧美三级| 欧美高清一级片在线观看| 蜜桃一区二区三区在线观看| 欧美伊人久久大香线蕉综合69| 丁香婷婷综合网| 国产精品久久久久久久久晋中 | 国产露脸91国语对白| 欧美日韩五月天| 亚洲精品乱码久久久久久| 91免费视频网| 亚洲免费在线观看视频| 91视频在线观看| 亚洲午夜视频在线观看| 在线免费观看日本一区| **性色生活片久久毛片| av电影一区二区| 亚洲精品国产一区二区三区四区在线| 91在线丨porny丨国产| 亚洲成人精品一区二区| 精品国产免费久久| 成人福利视频在线看| 亚洲欧美综合网| 精品成人免费观看| 国内外成人在线| 午夜影院久久久| 欧美日韩一区二区在线观看视频| 亚洲卡通欧美制服中文| 欧美另类z0zxhd电影| 国产99精品国产| 亚洲国产一区二区三区青草影视| 欧美一级日韩不卡播放免费| 国产成人免费视频网站高清观看视频 | 亚洲宅男天堂在线观看无病毒| 欧美在线制服丝袜| 国产不卡高清在线观看视频| 欧美一区二区网站| 北条麻妃一区二区三区| 亚洲国产精品精华液网站| 亚洲女同女同女同女同女同69| 欧美日韩一区二区三区四区 | 91电影在线观看| 色综合网站在线| 国产精品123区| 亚洲精品久久久蜜桃| 亚洲成人先锋电影| 亚洲高清久久久| 在线播放欧美女士性生活| 国产1区2区3区精品美女| 亚洲chinese男男1069| 亚洲三级电影全部在线观看高清| 亚洲天堂中文字幕| 婷婷综合另类小说色区| 亚洲免费观看高清完整版在线观看 | 国产亚洲综合色| 色94色欧美sute亚洲线路一ni| 欧美日韩一二区| 亚洲国产精品成人久久综合一区 | 久久精品国产久精国产| jlzzjlzz亚洲日本少妇| 日韩欧美一区在线| 国产亚洲成av人在线观看导航| 在线看日韩精品电影| 色哟哟一区二区| 91丨九色丨国产丨porny| av在线不卡观看免费观看| 国产酒店精品激情| 久久电影网站中文字幕| 高清在线观看日韩| 久久精品国产精品亚洲综合| 亚洲成人av资源| 91麻豆精品在线观看| 91精品麻豆日日躁夜夜躁| 亚洲国产高清在线| 久久99精品久久久久久国产越南 | 日韩女同互慰一区二区| 丝袜亚洲另类欧美综合| 欧美日韩中字一区| 亚洲一区二区视频| 日韩一级片网站| 国产精品夜夜嗨| 久久精品视频一区二区| 九九在线精品视频| 久久综合久久综合亚洲| 国产91精品精华液一区二区三区| 欧美国产激情二区三区| 97精品久久久午夜一区二区三区| 中文乱码免费一区二区| 色素色在线综合| 青青草成人在线观看| 国产情人综合久久777777| 在线观看av不卡| 午夜精品久久久久久久| 国产亚洲精品aa午夜观看| 成人av在线看| 久久99国产精品成人| 亚洲激情图片一区| 7777精品伊人久久久大香线蕉最新版| 激情图片小说一区| 日本亚洲三级在线| 18欧美亚洲精品| 国产欧美日韩在线视频| 日韩欧美电影一区| 九一九一国产精品| 亚洲成在线观看| 宅男噜噜噜66一区二区66| 99久久精品国产精品久久| 午夜国产不卡在线观看视频| 亚洲欧洲精品成人久久奇米网| 亚洲成人激情综合网| 欧美精品一区二区三区很污很色的| 日日夜夜免费精品| 亚洲一区二区免费视频| 久久久久青草大香线综合精品| 在线不卡a资源高清| 欧美喷水一区二区| 欧美私人免费视频| 欧美精品自拍偷拍| 欧美性受xxxx黑人xyx性爽| 99国产精品久久久久久久久久久| 国产精品久久久久久久久免费桃花| 粉嫩av一区二区三区粉嫩| 不卡的av中国片| 欧美日韩性生活| 日韩欧美在线综合网| 国产精品你懂的在线| 亚洲激情网站免费观看| 国产亚洲一区字幕| 国产精品第四页| 亚洲在线观看免费| 日本特黄久久久高潮| www.综合网.com| 精品盗摄一区二区三区| 亚洲欧美日韩成人高清在线一区| 亚洲免费在线看| 国产麻豆91精品| 日韩视频免费观看高清完整版 | 日韩欧美一级二级三级| 国产精品免费av| 视频一区国产视频| 成人动漫精品一区二区| 精品国产免费人成电影在线观看四季| 精品国产青草久久久久福利| 亚洲少妇中出一区| 色婷婷综合久久久中文一区二区| 久久久亚洲综合| 亚洲一区二区三区美女| 91最新地址在线播放|