文章详细-FM Agent登顶OpenAI MLE-Bench，由百度智能云研发

　　近日，百度智能云研发的FM Agent登顶OpenAI机器学习工程权威基准MLE-Bench，拿下SOTA成绩，超越微软R&D Agent和OpenAI展示的AIDE系统。

　　MLE-Bench由OpenAI主导，是目前评估AI Agent“实战”能力的核心榜单，其测试集包含了75个真实的Kaggle竞赛项目——这些项目均为往年全球顶尖数据科学家团队参与解决的真实工程难题，测试AI在模型训练、数据准备、实验运行等机器学习工程中的能力。

　　公开信息显示，百度FM Agent在“中等”和“高难度”任务上的表现显著领先，显示出强大的攻坚能力。

　　同时，该Agent框架具备自主优化能力，通过构建具备自驱演化的智能系统，系统性分析问题、并自主优化解决方案。

　　近期百度在AI领域动作频频，最新开源的文心4.5衍生模型PaddleOCR-VL模型以0.9B参数量，在全球权威榜单OmniDocBench v1.0+v1.5双榜夺得综合性能第一、四项子任务全线SOTA成绩

技术支持：中关村中慧先进制造产业联盟电话：010-68706686 地址：北京市海淀区紫竹院南路17号院中国企业联合会3号楼5层