前言
近日,aiXcoder发布了一款全新的自主研发的代码大模型,拥有70亿参数。这个模型在多个主流的评估标准测试中表现出色,与同等规模的开源模型相比效果最佳,显示了它作为百亿参数级别的代码大模型的卓越实力。
在过去的十年里,北京大学软件工程研究所的aiXcoder团队一直致力于利用人工智能技术推动软件开发的自动化,并专注于智能化工具在企业开发场景的实际应用。
测评表现惊艳,力压群雄
aiXcoder 7B在HumanEval、MBPP和MultiPL-E三个主流代码生成效果评估集上表现出明显优势,不仅在基础能力上超越了同级别的现有模型,甚至在一些特定任务上比参数更大的15B、34B的代码大模型效果更好。
在实际的软件开发环境中,仅凭NL to Code模型根据自然语言生成代码的能力是远远不够的。当前主流的评估方式与真实场景存在较大差距,因为编写程序或代码涉及到各种集成、扩展和调用关系。NL to Code模型给出的方法在实际场景中可能显得孤立无援。
aiXcoder-7B在模型构建过程中特别考虑了与实际开发场景对齐的项目级代码处理能力,因此相比其他模型更能综合考虑到软件项目内其他相关代码文件中包含的重要信息,例如类定义、类属性、方法定义等。在专门考虑项目级信息的代码生成测评数据集CrossCodeEval上,aiXcoder-7B表现出了明显优于其他模型的准确性,这进一步证明了其在真实开发环境中的实用性和优越性。
在代码补全场景中,开发者不仅期望模型能够生成具有完整语法结构和处理逻辑的代码块,还希望尽可能地利用上下文已实现的函数,以符合实际开发风格。为了在实际开发场景中评估补全效果,aiXcoder在一个包含超过16000条真实开发场景代码的开源测评数据集上展现了最佳效果。此外,相较于其他模型,aiXcoder 7B更倾向于使用较短的代码来完成用户指定的任务。
“开箱即适配”的企业代码大模型
针对企业需求,aiXcoder-7B Base版设计了三大“易”特性:易部署、易定制、易组合,旨在让更多开发者受益于这款强大的工具。
易部署:aiXcoder-7B由于其较小的参数规模,易于部署,成本低廉,性能优越,在企业实际环境中部署时具有明显优势。
易定制:大多数企业都拥有自己的软件开发框架和API库,以及与之相关的个性化业务逻辑和代码架构规范,这些内容具有私密性。为了让大型模型真正为企业所用,必须让它们学习和理解这些企业代码资产,并通过有效的个性化训练进行适配。
易组合:为了让大型模型真正服务于企业,必须让其学习并理解企业的代码资产,并通过有效的个性化训练进行适配。
总之,aiXcoder-7B Base版以其对企业级软件开发场景的深刻理解与卓越适应能力,成功打破了AI编程工具在实战中“水土不服”的瓶颈。
文章结尾
如有疑问或有需求可以进群交流。


