助力通用人工智能 武智院正打造“紫东太初”2.0全模态大模型

时间:2023-05-09 17:59:47 来源: 九派新闻


近日,在华为昇腾AI开发者峰会上,武汉人工智能研究院院长王金桥介绍,基于华为全栈国产化软硬件平台昇腾AI,武汉人工智能研究院联合中科院自动化所、华为正在打造“紫东太初”2.0全模态大模型,可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习,助推认知智能时代加速到来。

超前布局,以多模态技术探索通用人工智能


(资料图)

2019年开始,武智院研发团队瞄准多模态大模型领域联合攻关,2021年7月正式发布全球首个千亿参数多模态大模型“紫东太初”,以多模态技术探索通用人工智能发展道路。

王金桥介绍,有别于以文本为主的大部分语言大模型,“紫东太初”在研发之初即坚持以多模态技术为核心,利用图-音-文等更多类型数据进行跨模态的统一表征和学习,实现图像、文本、语音三模态数据间的“统一表示”与“相互生成”,使人工智能大模型的理解和生成能力更加接近人类,为贯通多模态人工智能行业应用提供创新基础,向通用人工智能迈出关键一步。

武智院院长王金桥现场演讲

“紫东太初”2.0,从感知到认知世界

针对数字物联时代的新需求与新趋势,武智院研发团队研究探索全模态大模型体系架构和基础算法,持续推动“紫东太初”技术和应用发展。

在文本、图片、音频、视频的基础上,“紫东太初”2.0可融入3D、视频、传感信号等更多模态数据,并优化语音、视频和文本的融合认知以及常识计算等功能,进一步突破感知、认知和决策的交互屏障,让人工智能从感知世界进化为认知世界,延伸出更强大的通用能力。

同时,基于“紫东太初”2.0,武智院近期先后推出了全栈国产化、支持低代码一站式开发的“紫东太初”开放服务平台以及人人皆可“妙语生画”的AI内容创作平台“江城洛神”等。

王金桥表示,“紫东太初”开放服务平台可实现高效率开发,同时也是全栈国产化平台,支持公有云、私有云一键部署,行业用户可基于该平台开发自己的行业大模型。“江城洛神”AI内容创作平台,能让普通人实现“一语成画”,也可以让艺术家开拓创作思路和视野,创造出更多更美好的作品。

王金桥介绍,“江城洛神”平台同时支持数据自动构建及多任务扩展,通过交互实现内容补全、图像编辑及室内可控的图像生成。比如,在室内装修设计方面,只需提供一张户型图,“江城洛神”就可以自动生成多种装修设计样式,提示词越多、越精细,生成质量也越高,还能根据不同提示自动对结果进行编辑。目前,“江城洛神”AI内容创作平台已经对外开放。

“紫东太初”具有广阔应用潜力

目前,武智院联合中科院自动化所打造的多模态人工智能产业联合体已陆续吸纳产学研各界近70家成员单位,围绕多模态大模型技术及应用,“紫东太初”大模型已在手语教学、法律咨询、交通出行、广电、医疗机器人、医学影像判读等数十个行业场景领域,展现出广阔的落地应用潜力。

其中,在法律咨询行业,“紫东太初”大模型仅用0.546秒就可对法律案件进行拆解、提取关键事件,在办公效率方面实现案件分析速度的百倍提升,可有效解决律师整体资源匮乏、服务成本高等问题。

在智慧交通领域,基于“紫东太初”大模型构建的面向公路路网孪生仿真、调度、养护、节能、服务等全周期、全天候、安全安心的数智平台,让道路通行率有效提升30%。

在医疗领域,基于“紫东太初”打造的MicroNeuro颅内微创手术机器人系统已完成国际首例深位颅内活检手术,支持视觉、触觉的跨模态融合,该大模型的升级也将加速优化针对神经外科手术场景的自主理解。

来源丨武汉人工智能研究院、中新网

出品丨东湖高新区科技创新和新经济发展局

声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com

关键词:

网站简介 网站团队 本网动态 友情链接 版权声明 我要投稿

Copyright© 2014-2020 中原网视台(www.hnmdtv.com) All rights reserved.