Qodo推出開(kāi)源代碼嵌入模型,性能超越OpenAI和Salesforce

2025-03-03 14:31  瀏覽:  

Qodo,前身為Codium,是一家專(zhuān)注于人工智能驅動(dòng)的代碼質(zhì)量平臺的公司。近日,該公司發(fā)布了Qodo-Embed-1-1.5B,這是一款開(kāi)源的代碼嵌入模型,擁有15億個(gè)參數,旨在提升代碼搜索、檢索和理解的能力。該模型在行業(yè)基準測試中表現優(yōu)異,超越了OpenAI和Salesforce的大型模型,同時(shí)以更小的規模和更高的效率樹(shù)立了新的企業(yè)標準。

對于管理龐大復雜代碼庫的企業(yè)開(kāi)發(fā)團隊來(lái)說(shuō),Qodo-Embed-1-1.5B代表了AI驅動(dòng)軟件工程工作流程的重大進(jìn)步。通過(guò)實(shí)現更準確、更高效的代碼檢索,該模型解決了AI輔助開(kāi)發(fā)中的關(guān)鍵挑戰——大型軟件系統中的上下文感知問(wèn)題。

代碼嵌入模型的重要性

AI驅動(dòng)的編碼工具傳統上側重于代碼生成,大型語(yǔ)言模型(LLM)因其編寫(xiě)新代碼的能力而備受關(guān)注。然而,Qodo的首席執行官兼聯(lián)合創(chuàng )始人Itamar Friedman指出:“企業(yè)軟件可能包含數千萬(wàn)甚至數億行代碼。僅僅生成代碼是不夠的,還需要確保代碼質(zhì)量高、功能正常,并與系統的其他部分無(wú)縫集成。”

代碼嵌入模型在A(yíng)I輔助開(kāi)發(fā)中扮演著(zhù)關(guān)鍵角色,能夠有效搜索和檢索相關(guān)代碼片段。這對于代碼量龐大、涉及多個(gè)團隊、存儲庫和編程語(yǔ)言的大型組織尤為重要。Friedman強調:“在當今的軟件開(kāi)發(fā)中,上下文至關(guān)重要。要從龐大的代碼庫中獲取正確的上下文,必須依賴(lài)高效的搜索機制。”

Qodo-Embed-1-1.5B的性能與效率

Qodo-Embed-1-1.5B以其高效性和準確性脫穎而出。盡管許多先進(jìn)模型依賴(lài)數十億個(gè)參數(如OpenAI的text-embedding-3-large擁有70億個(gè)參數),Qodo的模型僅用15億個(gè)參數就實(shí)現了卓越的性能。在代碼信息檢索基準(CoIR)測試中,Qodo-Embed-1-1.5B得分為70.06,優(yōu)于Salesforce的SFR-Embedding--2_R(67.41)和OpenAI的text-embedding-3-large(65.17)。

這種性能水平對企業(yè)尤為重要,因為該模型能夠在低成本GPU上運行,降低了基礎設施成本,同時(shí)提高了軟件質(zhì)量和開(kāi)發(fā)效率。

解決代碼復雜性與細微差別

AI驅動(dòng)軟件開(kāi)發(fā)中的一大挑戰是外觀(guān)相似的代碼可能具有截然不同的功能。Friedman舉例說(shuō)明:“嵌入代碼的最大挑戰之一是,兩個(gè)幾乎相同的函數(如‘withdraw’和‘deposit’)可能只差一個(gè)加號或減號。它們在向量空間中需要接近,但又必須明顯區分。”

為了解決這一問(wèn)題,Qodo開(kāi)發(fā)了一種獨特的訓練方法,結合高質(zhì)量的合成數據和真實(shí)代碼樣本。通過(guò)與Nvidia和AWS的合作,Qodo改進(jìn)了模型訓練過(guò)程,使其能夠識別功能相似代碼中的細微差異,確保開(kāi)發(fā)人員檢索到正確的結果。

多語(yǔ)言支持與未來(lái)擴展

Qodo-Embed-1-1.5B已針對10種最常用的編程語(yǔ)言(包括Python、JavaScript和Java)進(jìn)行了優(yōu)化,并支持其他語(yǔ)言和框架。未來(lái),Qodo計劃進(jìn)一步擴展模型功能,提供更深入的企業(yè)開(kāi)發(fā)工具集成和更多語(yǔ)言支持。

Friedman表示:“許多嵌入模型難以區分編程語(yǔ)言,有時(shí)會(huì )混淆來(lái)自不同語(yǔ)言的代碼片段。我們專(zhuān)門(mén)訓練了模型以防止這種情況,重點(diǎn)關(guān)注企業(yè)開(kāi)發(fā)中最常用的10種語(yǔ)言。”

企業(yè)部署與可用性

Qodo通過(guò)多種渠道提供其新模型。1.5B參數版本可在Hugging Face上免費獲取,采用OpenRAIL++-M許可證,允許開(kāi)發(fā)人員自由集成到工作流程中。企業(yè)用戶(hù)可選擇商業(yè)許可版本,獲取更多功能。此外,Qodo還提供企業(yè)級平臺,能夠自動(dòng)更新代碼嵌入,確保模型在代碼庫變化時(shí)保持準確性。

該模型還將通過(guò)Nvidia的NIM平臺和AWS SageMaker JumpStart提供,便于企業(yè)部署和集成到現有開(kāi)發(fā)環(huán)境中。

AI在企業(yè)軟件開(kāi)發(fā)中的未來(lái)

隨著(zhù)AI驅動(dòng)的編碼工具快速發(fā)展,其重點(diǎn)正從代碼生成轉向代碼理解、檢索和質(zhì)量保證。Qodo-Embed-1-1.5B等工具將在使AI系統更可靠、高效和經(jīng)濟高效方面發(fā)揮關(guān)鍵作用。

Friedman總結道:“對于財富15,000強企業(yè)的開(kāi)發(fā)人員來(lái)說(shuō),AI不僅僅是代碼生成工具。他們的工作流程需要對大型代碼庫有深入理解。高質(zhì)量的代碼嵌入模型正是解決這一需求的關(guān)鍵。”

Qodo的最新模型為企業(yè)在復雜軟件生態(tài)系統中理解、管理和優(yōu)化代碼提供了高性能的解決方案,標志著(zhù)AI在軟件開(kāi)發(fā)中的應用邁出了重要一步。

免責聲明:本網(wǎng)轉載自合作媒體、機構或其他網(wǎng)站的信息,登載此文出于傳遞更多信息之目的,并不意味著(zhù)贊同其觀(guān)點(diǎn)或證實(shí)其內容的真實(shí)性。本網(wǎng)所有信息僅供參考,不做交易和服務(wù)的根據。本網(wǎng)內容如有侵權或其它問(wèn)題請及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。
相關(guān)推薦
英飛凌在印度開(kāi)設研發(fā)中心

英飛凌在印度開(kāi)設研發(fā)中心

3月24日消息,歐洲芯片大廠(chǎng)英飛凌科技在印度古吉拉特邦艾哈邁達巴德的研發(fā)中心正式開(kāi)業(yè)。據介紹,英飛凌的全球能力中心 (GCC) 位于古吉拉特邦國際金融技術(shù)城 (GIFT City),將在未來(lái)五年內雇用 500 名工程師。該中心將專(zhuān)注于半導體芯片設計和產(chǎn)品軟件的研發(fā),以及信息技術(shù)、供應鏈管理和系統和應用工程。目前英飛凌印度在該國擁有 2500 多名員工,的新研發(fā)中心的啟用意味著(zhù)英飛凌現在印度的五個(gè)地點(diǎn)設有代表處,其中班加羅爾是最大的。我們新的...

英偉達攜手聯(lián)發(fā)科發(fā)力ASIC市場(chǎng),打造NVLink IP、長(cháng)距離224G Serdes

聯(lián)發(fā)科與英偉達的合持續深化,除了硬件之外,在半導體IP方面,雙方也將攜手打造NVLink IP、長(cháng)距離224G Serdes、車(chē)規AEC。業(yè)界分析,英偉達欲跨入ASIC領(lǐng)域,然由于品牌包袱,所以藉由聯(lián)發(fā)科將更能快速擴展。未來(lái)將有更多CSP業(yè)者尋求與聯(lián)發(fā)科合作,而一旦客戶(hù)采用NVLink IP,也能增加英偉達Switch解決方案之客戶(hù)采購意愿、達到雙贏(yíng)局面。在近期的英偉達GTC大會(huì )上,聯(lián)發(fā)科介紹了其Premiun ASIC設計服務(wù),顯示聯(lián)發(fā)科與英偉達的合作擴展至IP領(lǐng)域,更彈性的商業(yè)...
繼芯片與人工智能后,美國或考慮推出機器人國家戰略

繼芯片與人工智能后,美國或考慮推出機器人國家戰略

繼芯片、人工智能等產(chǎn)業(yè)之后,美國政府和國會(huì )接下來(lái)可能將考慮把智能機器人行業(yè)的發(fā)展納入國家戰略。美東時(shí)間周三,包括特斯拉、波士頓動(dòng)力(Boston Dynamics)和敏捷機器人(Agility Robotics)在內的多家美國機器人公司代表前往國會(huì )山,會(huì )見(jiàn)了美國議員,并敦促他們開(kāi)啟一項國家機器人戰略,建立一個(gè)專(zhuān)注于促進(jìn)機器人行業(yè)發(fā)展的聯(lián)邦辦公室,從而推動(dòng)美國公司在全球競爭中開(kāi)發(fā)下一代機器人。美國企業(yè)敦促推出機器人國家戰略美國德克薩斯州的人形機...
庫克重申:加大在華投資規模

庫克重申:加大在華投資規模

蘋(píng)果CEO庫克近兩年來(lái)持續加強與中國市場(chǎng)的聯(lián)系。自上周末到訪(fǎng)中國以來(lái),他從北京到杭州,一路表達著(zhù)對中國創(chuàng )新的贊譽(yù)。庫克訪(fǎng)華之際,正值蘋(píng)果iPhone銷(xiāo)量增長(cháng)乏力之時(shí)。不過(guò)蘋(píng)果重申了對加大中國投資規模的承諾。盡管近期其在高端市場(chǎng)表現不佳,但蘋(píng)果正在從新產(chǎn)品到新功能等多方蓄力。盛贊DeepSeek和黑悟空庫克此次訪(fǎng)華的重頭戲在杭州,這也是火遍全球的AI應用DeepSeek的誕生地。他被媒體問(wèn)到對DeepSeek的看法時(shí)稱(chēng):DeepSeek的模型非常出色。...
中國自主研發(fā)12英寸碳化硅襯底全自動(dòng)激光切割技術(shù)

中國自主研發(fā)12英寸碳化硅襯底全自動(dòng)激光切割技術(shù)

記者27日從西湖大學(xué)獲悉,由該校孵化的西湖儀器(杭州)技術(shù)有限公司成功開(kāi)發(fā)出12英寸碳化硅襯底自動(dòng)化激光剝離技術(shù),解決了12英寸及以上超大尺寸碳化硅襯底切片難題。與傳統的硅材料相比,碳化硅具有更寬的禁帶能隙以及更高的熔點(diǎn)、電子遷移率和熱導率,可在高溫、高電壓條件下穩定工作,已成為新能源和半導體產(chǎn)業(yè)迭代升級的關(guān)鍵材料。碳化硅襯底激光剝離系統。圖片來(lái)源:西湖大學(xué)西湖大學(xué)工學(xué)院講席教授仇旻介紹,碳化硅行業(yè)降本增效的重要途徑之...

推薦閱讀

熱文

Copyright © 能源界
国产精品欧美一区喷水_婷婷久久综合九色综合_精品国产高清在线拍_美女作爱全过程免费观看国产