Title
您当前的位置: 首页 > 百强动态 > 文章详细
普粤英三语混杂也能秒懂,讯飞听见多语种会议系统上线
发布时间:2025-08-14
日前,香港特区立法会正式宣布,其与科大讯飞联合打造的搭载AI实时字幕功能的智慧誊录系统“智识听”正式上线。从即日起,公众可以通过法会站的上播等平台,收看带有实时字幕的法会会会议直播。 早在2021年,香港立法会选举制度改革后,议员及工作人员数量增加,对议事效率和信息公开提出了更高要求。以往一场会议的完整文字记录发布需耗时约7个工作日,信息发布稍显滞后。 如何在不额外增加人力成本的情况下提升效率?香港特区立法会经过数次交流考察,与科大讯飞达成了合作计划,开发“智识听”系统。 不过,粤语可细分为多种不同方言,在具体场景中,普通话、粤语、英语经常交替出现,这些“湾区日常”都是语音识别系统需要攻克的难题。为了解决这一问题,项目团队整理了2.5亿汉字的中英文对照和20万个高频粤语词汇,将其作为语料库提供给引擎学习,进一步提升了该技术实际应用效果。 “智识听”实时字幕的准确率已达96%,通过幕后同事的实时修正,人机结合,准确率可达99%,可以支持粤语、普通话、英语三语混读场景下的逐字记录、实时速录、实时修改、声纹识别,以及智能粤普翻译和中英双向翻译等功能。 具体来说,这套系统可自动转写为繁体中文并生成会议纪要,声纹识别功能可以区分不同发言人,实现中英粤三语互译,同时具有单机版可实现私有化部署,并支持自主选择在线或离线功能。 “过往的会议发言都要用人手逐字誊录,就好像锤石子一样,现在通过智慧誊录系统‘智识听’,会议内容可以即时转为文字,议会的效率和透明度大幅提升。”香港立法会主席梁君彦说。 这背后,科大讯飞花费大量时间进行产品打磨,例如,一开始科大讯飞中、英、粤语是三个分开的引擎,当时的识别率只能达到90%,比如,香港立法会的很多议员都是中英粤三语混合使用,科大讯飞也调整中、英、粤三语的混合引擎。 科大讯飞副总裁王玮对此表示,“三语转换”不是简单地将简体字转换成繁体字,还有语言习惯、语言表达甚至是文化差异,只有融入香港文化,才能够真正理解文字背后的涵义。 “要想做好香港市场,就一定要在香港扎根。”她举例说,内地产品无法直接引入到香港,比如内地“转写”一词,香港称之为“誊录”,常用的入口交互设计,甚至用什么样的操作系统,都要进行大量本地化适配。 事实上,机器转写、机器同传并不是一件新鲜事。但此前由于延迟高、专业术语错误率高、不同语种切换不便等,机器同传在大型会议活动中只能作为参考。但在近日结束的世界人工智能大会上,诺奖得主、AI教父杰弗里·辛顿发表一场主题演讲,会后中国外交部原副部长傅莹告诉他,这场演讲AI全程语音识别,实时中文翻译字幕,“AI在聆听你。” 能够“秒听懂”辛顿的中国AI,是科大讯飞语音同传系统。同传是比转写难度更高的技术,目前,科大讯飞把中英同传首字响应压缩到2秒以内,达到了人类顶尖同传译员的反应速度。 目前,科大讯飞已形成多元化全球业务布局,加速推动中国人工智能技术出海。其自主研发的多语种智能语音技术已支持72个语种,为华为、比亚迪、海尔等中国企业的过亿台(套)设备提供语音交互支持,为“中国智造”走出去提供语言与AI能力保障。 南方+记者 郜小平 【作者】 郜小平 【来源】 南方报业传媒集团南方+客户端
上一篇:
除了国补 洗衣机市场靠什么增长?
下一篇:
用友网络获准注册20亿元中期票据 可分期发行科技创新债券
Title