融合创新,让AI应用更容易

文章正文
发布时间:2021-09-22 15:39

融合创新,让AI应用更容易

  “我们正处在第四次工业革命的阶段,每一次产业变革的核心驱动力都是科技创新。当下,人工智能技术日趋成熟,像以往每一次工业革命的核心驱动技术一样,呈现出很强的通用性,并且已经具备了标准化、自动化和模块化的工业大生产特征,成为第四次工业革命的核心驱动力量。”百度集团副总裁吴甜在9月13日的“AI面对面”媒体沟通会上如是说。

  在前不久的百度世界2021上,百度大脑宣布升级到7.0,具备“融合创新”和“降低门槛”两大显著特点,这背后是基于对趋势的深刻洞察。“目前以人工智能为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革,在新的发展阶段,人工智能技术越来越复杂,融合创新正在成为新常态;同时,随着人工智能技术在各行业的渗透,面向不同应用场景,降低门槛也变得越来越重要。”吴甜表示。

  作为百度人工智能多年技术积累和产业实践的集大成,百度大脑已然具备了上述特征,并构建了包括基础层、感知层、认知层、平台层和AI安全的全面技术布局。基础层包含算力、数据和飞桨平台,是支撑新一代人工智能快速发展的核心基础;感知层包括语音、视觉、虚拟现实和增强现实技术,使机器像人一样拥有视觉、听觉等能力,对世界有感知和感应;认知层包括语言与知识技术,是让机器像人一样,掌握知识、理解和运用语言,具备认知能力;通过平台层,百度大脑和千行百业有非常重要的联系,通过开放平台支持到整个行业智能化升级;安全体系则纵贯百度大脑各层,为AI技术及应用保驾护航。

  在跨模态多技术融合创新方面,通过融合了语言、语音、视觉等不同模态的技术,百度大脑得以像人类一样,实现对复杂真实场景的跨模态深度语义理解,进而获得对真实世界的统一认知。比如,针对一张球赛图片,机器过去只能识别出人员数量,如今机器可以推理出谁是教练,谁是运动员,以及各自的行为。这背后,正是基于跨模态深度语义理解模型的推理。基于这一技术能力,百度在视觉常识推理、视觉问答、引用表达式理解、跨模态图像检索、跨模态文本检索等5项典型多模态任务中刷新了世界最好效果,并在多模态领域权威榜单视觉常识推理任务(VCR)上超越微软、谷歌、Facebook等机构,登顶榜首。

  百度大脑在图像语言一体化理解上,通过知识增强的多模态特征融合与结构化关系图分析,提升OCR应用的准确率;基于语音语言一体化理解的技术,使得语音识别及图像识别准确率大幅提升;跨模态多技术融合创新的代表性成果之一便是“数字人”,亮相央视五四晚会的AI虚拟主持人晓央,全球首个火星车数字人“祝融号”,都给大众留下深刻印象。在百度世界2021上,百度CTO王海峰用短短两句话,就让百度大脑生成了数字人,并为他“换”上了航天服,背后正是跨模态多技术的融合创新。

  从应用角度,不同领域都有各自的特点和难题,AI技术深入到实际应用场景中,与场景融合创新。

  比如AI与搜索场景融合创新的智能搜索引擎,已具备图谱问答、推理计算、智能推荐、语义理解、智能排序、深度问答等能力,可深刻理解用户意图,并结合语音、图像、AR等感知技术能力,更便捷地与用户交互,为用户提供更精准、更便捷的信息服务。

  在翻译场景下,高质量、多语言的产业需求,遭遇计算复杂度高、漏译等问题突出,以及资源稀缺、部署复杂等技术挑战。而百度的AI同声传译技术,通过机器翻译、语音技术与同声传译场景融合,攻克以上挑战,成功实现了高质量、低延迟的同传效果,翻译准确率超过80%,时延3秒,与人类水平相当,已经服务了2020全球人工智能技术大会、2020全球人工智能产品应用博览会,以及连续两年的中国国际服务贸易交易会,总观看量接近500万次。

  而在办公会议场景下,智能工作平台“如流”可以实时记录参会者的对话发言,并基于自然语言处理技术自动提取对话内容的关键要点,从而快速生成会议纪要,在此前的百度世界2021上,已经一显身手。

  产业则是技术与场景融合创新的广阔用武之地。比如在工业场景中,百度用AI打造安全可控的工业智能基础设施,赋能设计研发、生产制造、供应物流、销售经营、客户服务、综合保障等环节,助力企业降本增效、绿色双碳、智能升级。

  借助百度大脑的AI能力,化纤行业部署AI质检设备,较既有检测设备能力提升50%;能源领域部署AI中台,实现变电站人工巡视工作量下降40%,输电线路缺陷人工图像复查量下降60%;区域工业互联网实现了6类产业的广泛覆盖,可监测300亿工业产值。

  在金融业务场景中,数字员工、远程银行、智能营销、产业金融平台等智慧金融应用正在加速落地,助力营销、审核、风控、客服等环节提质增效,辅之以百度AI自主创新、安全可控的特点,助力中国金融基础设施与服务升级。

  基于百度大脑技术的智慧城市解决方案,正在雄安洞察城市发展,在丽江实现城市大脑精准治理,在上海张江为产业赋能,在成都落地智能无感停车应用。

  有百度大脑技术加持的循证AI赋能基层医疗,联合爱尔眼科医院打造眼底筛查机,让眼疾筛查更便捷;在湖北省基层医院落地辅助诊疗,让优质诊疗更可及;落子国家级糖尿病医防融合试点,让慢病管理更规范。

  基于百度大脑技术的智慧媒体解决方案,正通过全链条生产、全方位安全、全渠道分发、全场景应用等特征,赋能媒体创作全链条,助力媒体行业数智化转型升级。

  由百度大脑技术打造的智慧体育应用,通过AI助力打造冠军模型,推进体育训练的数字化、科学化,为中国跳水队定制的3D+AI跳水系统,实现了20%的训练效率提升。

  在软硬一体融合创新方面,硬件设计与软件算法融合,会产生1+1>2的应用效果。百度自主研发的云端通用AI芯片——百度昆仑,针对语音、自然语言处理、图像等AI技术优化。百度世界2021上正式官宣量产的昆仑2芯片,采用7nm制程,搭载第二代XPU架构,相比一代性能提升2-3倍,年底前可实现推理卡的交付。

  针对远场语音交互研制的芯片——百度鸿鹄,由软件定义,可实时处理远场阵列信号,360度唤醒和识别,让人与汽车、智能家居等设备的语音交互更便捷、更流畅。

  同时,百度也与合作伙伴一起构建软硬一体的生态,比如飞桨平台目前已经适配30多款芯片。  

  百度大脑的“降低门槛”,让开发者更容易获得AI能力。降低门槛主要通过百度大脑的核心基座——飞桨平台来实现。

  吴甜分享了飞桨与企业伙伴广泛合作中观察总结的AI工业大生产路径。她认为,企业应用AI的过程分三个阶段,第一阶段是AI先行者探路阶段,即企业中有少数先行人员尝试引入AI进行原型验证;当进行了验证产生效益后,会从个人实践转变成建设团队来学习和应用AI,这便进入第二阶段——AI工作坊应用阶段;当企业进行大量的AI应用,几百、几千人一起工作,多人多任务协同生产,就进入了AI工业大生产阶段,更长期看,还会实现社会化协同大生产。

  飞桨以全面而丰富的技术、功能、产品和服务,支持着合作伙伴应对各个阶段的困难,实现阶段的跃迁,将AI越来越多且深入地引入到自身业务中。譬如,在AI先行者阶段,源于产业实践的模型库可支持高效原型验证,全面且灵活的硬件适配和生态基础可保障AI落地应用;在AI工作坊阶段,丰富且多层次的产品结构可助力团队应用AI创新;在AI工业大生产阶段,企业级AI开发平台可实现支撑多人多任务协同全流程开发效能的提升。

  除了提供丰富工具,帮助开发者快速、高效地使用AI技术。百度还意识到,加速AI工业大生产,还需要会算法、懂业务、知工程的复合型AI人才。为此,百度以飞桨为创新基座,联合学术界和产业界,共同培养AI人才,目前已构建起涵盖实践、比赛、认证、就业在内的全周期服务体系。

  面向企业,飞桨设立了AICA、AI私享会、AI快车道等培训项目,培养CTO、架构师、技术负责人、算法工程师等不同层级的AI人才;面向高校,飞桨为学生提供教学资源和工具、实践平台与算力支持等,同时设立师资培训班,已培训690多所高校的超2900余名专业AI教师,支持270余所高校基于飞桨开设开设人工智能课程。据统计,百度已培养AI人才超过100万。未来5年百度还将继续培养500万AI人才。

(责编:赵超、陈键)

分享让更多人看到

首页
评论
分享
Top