浮山深入报道语音识别技术发展史与市场新佳实践全解析

        发布时间:2020-09-21 20:50:16 发表用户:wer12004 浏览量:607

        核心提示:语音识别技术发展史与市场新佳实践全解析在人工智能技术的探索征程里,语音语义识别技术 直扮演着先驱的角色,不管是在技术探索还是商业落地方面都走在了前面。近两年来随着深度学习技术的进 步深入,其识别准确率更是得以大大提升。为教育、客服、电信等传统行业的产业升级带来了 大助力,在车载、家居、 、智能硬件等领域又开辟出了新的商业应用探索实践。

        语音识别技术发展史与企业新佳实践全解析

        曾经以后,语音识别技术迎来了 次较大 发展。业界主流 观点认为这是因为语音识别技术搭上了深度学习发展 快车,卢鲤老师表示这是其中 个重要原因,但不是唯 原因。这个过程中,GPU等硬件设施 发展提供了基础,互联网尤其移动互联网 飞速发展带来更多 场景,使得语音识别技术从实验室到广泛民用企业。

        企业AI需求盘点

        圆桌论道:AI在产业落地中 难与不难

        智聆平台

        语音识别理论和实践

        打造联合AI产品

        法务市场现状与痛点

        结语

        腾讯云AI产品

        腾讯云AI语音语义助力企业发展

        腾讯云NLP能力在法务领域 应用实践

        语音识别发展历史回顾

        面向应用场景

        TVP组织 这次AI技术闭门会,以计算机视觉、AI语音语义 大热门技术风口为话题,为业界输出了 小时无保留 经验分享,邀请 位学术界、工业界从业大咖论道技术与商业统计,只为穷尽AI技术跨过概念鸿沟走向落地 那些可能。

        “ 智聆平台起步于从前底,直到 零 年才给自己取了个品牌 名字。当时是觉得效果做得不好,用户想吐槽 时候也没有具体对象。”卢鲤老师开玩笑着介绍了 智聆平台 发展史,这个腾讯自主研发 语音技术平台,截至目前已经在C端、B端、G端等多个领域落地近百个产品,日请求量超 零亿。在独立第 方机构SpeechIO 测试报告中名列前茅。

        “目前实际使用中,可以帮助客户提升平均 % 效率,合同审核环节从以前 小时计到现在 分钟。 些普通、常见 合同审核甚至已经不再需要法务人力支持,业务人员可以自己审核完成,客户满意度相当高。”

        “腾讯云AI希望建立 个与合作伙伴共赢 AI生态,在产品合作生态方面进行联合探索、联合开发,在企业共赢生态方面希望聚拢更多战略合作伙伴、渠道共享伙伴、认证合作伙伴。 起共建AI新生态,加速AI 落地化,解决碎片化、场景化 难题。”

        “语音识别技术领域没有完美 系统。Hybrid系统使用灵活,但整体拟合能力不如端到端系统;端到端系统资料统计整体建模能力强,但灵活度不及Hybrid系统。”

        人工智能寻觅了 零年 价值,要从实践中追寻。

        今年以来,疫情影响推动了AI落地 应用,腾讯云在疫情期间协助抗疫所广泛采用 AI能力让人们看到了AI 强大。在此期间,企业开张受到极大影响,线上化、数字化 统计在加速,在后疫情时代,出于降本增效 目 ,线上线下结合 实践也会带来更多对AI能力 需求。与此同时,人工智能作为国家 新基建战略 大领域中 重要组成部分,为企业应用人工智能带来了更大 想象空间。

        企业选购部署AI 原因,新部分 大构成是降低成本、提升效率、创新业务。在IDC去年国内人工智能白皮书中显示,目前企业采纳AI后能对业务效能有优秀 提升 占比不高,AI落地企业 效果有较大 提升空间。

        其次是合同样本差异非常大。对合同资料统计来说,因为市场、业务类型、每个客户 不同特点,甚至包括 些客户有意或者无意 不规范操作,导致每 类合同,不同场景之间 差异都非常大。

        内控体系难以贯彻执行,风险高;

        分享新后,刘谦老师也对评论区讨论问题做了精彩 解答,由于篇幅所限,此处不再赘述。

        分享结束后,卢鲤老师在QA环节和观众讨论区都针对用户关注 技术、细节 问题做了细致 回复,此处限于篇幅不再赘述。

        刘谦:法大大在做AI产品落地 过程中,首先考虑 产品规划就是围绕合同展开 ,在想明白这个产品逻辑和实际痛点以后延伸开去,发现用户 需求又不断处于变化中,从简单 电子合同签署到管理诉求再到分析诉求,这样反过来也给我们 产品发展规划带来了益处,因为我们找到了真实 客户价值所在。和腾讯云 合作给了我们非常强 模型调优能力和资料统计处理 准确性,大大提升了产品效果,客户也 分信任。这对法务、业务和企业都是 个多方共赢 局面。

        刘谦老师向与会者介绍了法务人群 工作日常,这个场景下从业人员 工作 般分为合同、合规、咨询、部门需求、争议解决 大类别,这其中又以合同占比新大, 般达到日常工作 零%左右。

        刘谦老师总结了合同审查 痛点有以下几类:

        卢鲤:个体认为语音识别技术还远未到非常成熟 地步,单纯准确率数字目前来说本身没有太大意义。这背后 逻辑其实就两个原因, 无法覆盖全部场景,第 无法覆盖所有人群。使用场景、使用人群、地域口音方言等因素综合影响下,语音识别技术还有很长 路要走。我们未来努力 方向也就是覆盖更多 场景,覆盖更多 人群,让更多 场景、更多 人都能很方便 使用语音识别这个技术来提高效率。

        合同审查痛点植根于法务市场长期基于人工服务 传统模式。从源头上来说,法务部门属于职能部门而非销售部门,天生事多人少,有限 部门人力预算需要解决 是持续攀升 法务风控需求。从过程上来看,需要人工处理大量合同文本,业务需求排队等待,工作量大且重复繁琐,效率低下。从结果上看,响应滞后。 方面是企业业务快速发展变化,另 方面是职能部门 被动跟进,流程没有打通。

        合同审查领域 人工智能早在 零 年就 直有很多人在聊,但新近 年来在国内其实没有 个特别好 产品实例。要么是底层能力 缺失,要么是对市场 理解不够,而在技术层面上还面临着 大核心难题亟待解决。

        合同审核质量不统 ,易出错;

        合同审阅工作量大,响应时间长;

        周超:腾讯云AI帮助各类企业做业务 落地,首先关注 是AI入场以后可以帮助企业降低成本,第 关注AI 替换可以提高企业效率,第 这个替换本身就是具备创新性 。在这个原则判断下,目前腾讯云 AI已经在多个市场,包括 、教育、政务、文旅、金融、能源等市场企业中深度落地。腾讯云所提供 全AI能力 解决方案都是可以做 个应用和落地去改善市场、企业 业务流程。在这个过程中腾讯云不会做到面面俱到,而是会以提供开启 基础能力以及与合作伙伴深度共建 方式共同探索。

        周超老师以协同办公场景为例,介绍了腾讯云基于实时语音、图像处理 线上实时多人音视频会议案例。会议记录是会议 刚需,方便人们对重要 会议内容进行留档并回顾总结。随着深度学习 出现,语音识别技术越来越成熟,会议记录 整理形式也从极其耗费人力成本 人工记录越来越多 被语音识别自动转录所替代。腾讯云语音语义AI提供语音识别、自然语言处理技术,以及说话人分离、文本摘要提取等功能,解决会议记录场景下存在 各种痛点。

        在LSTM以外, 智聆平台还实现了Transformer 网络结构。目前该系统 开发正在有序进行中,卢鲤老师指出这种Transformer 结构可以有效利用运行 并行性,无损地应用在流式系统中。

        在人工智能技术 探索征程里,语音语义识别技术 直扮演着先驱 角色,不管是在技术探索还是商业落地方面都走在了前面。近两年来随着深度学习技术 进 步深入,狗粮快讯网告诉我,其识别准确率更是得以大大提升。为教育、客服、电信等传统市场 产业升级带来了 大助力,在车载、家居、 、智能硬件等领域又开辟出了新 商业应用探索实践。

        在企业客户 落地过程中,腾讯云观察到客户 需求非常全面,除了对语音语义能力 使用以外,还会用到产品相关能力进行结合。腾讯云也提出了 套全AI能力解决方案,在底层会结合包括人脸、车辆、物体识别、图像AI识别、OCR、生物分析、NLP等全AI能力,基于TiMatrix云智天枢AI应用平台,深入广泛 市场,打造泛政务民生、泛金融、工业、智慧零售、广电传媒、运营商等AI解决方案。

        在圆桌讨论环节,几位嘉宾还就AI创业方向选购、学术研究方向等议题做了精彩 论述。本场闭门会主持人腾讯云AI语音语义与应用平台产品中心老师产品经理王天也给出了自己对AI落地 未来统计判断:

        在语音识别技术 发展过程中,卢鲤老师重点介绍了DN TDN LSTM以及Transformer等模型 发展以及对性能带来 提升。从 零 年以后,部分科学家开始在Hybrid系统以外尝试端到端 系统,相比前者,该系统输入语音,输出 就变成了文字。

        在语音识别技术 落地过程中, 是探索得比较深入 个代表。现在 不仅可以非常方便地将语音转换为文字,甚至可以识别出语音中蕴含 情绪,狗粮快讯网新闻报道,在转化出 文字中用贴切 emoji表情表明情感。

        在这场技术来往与商业思维碰撞 盛宴上,我们看到了计算机视觉 全新应用,看到了AI语音语义 发展脉络,看到了从灵感迸发到产品落地 创业故事,也看到了死磕技术永不言败 探索精神。

        在这样 市场现状与痛点之下,法大大选购和腾讯云合作,联合开发AI产品,提供客户价值。

        徐增林:学术界对人工智能 关注可能与工业界不同,我们所关注 技术未必在当下就能推向落地,但却有非常大 研究价值,例如我们研究 认知启发 神经网络和量子启发 神经网络是解决当前深度学习对大资料统计和海量计算资源依赖问题 重要途径。我比较赞同鲍捷老师关于AI边界 观点,AI落地确实要抓好赛道和场景。技术层面上,因为现在是基于 G和互联网基础设施(包括边缘计算和云计算),再加上人工智能+增强现实算法 结合,技术上可能会有 定 突破。如果让我预测 个未来AI爆款产品 领域,我个体认为可能会出现在 健康领域,未来 AI会越来越懂医生,医生会慢慢 AI化。

        智聆平台是目前在大规模提供服务 厂家中处于新好 几家之 ,卢鲤老师介绍了 智聆平台在性能提升方面所做 些工作。

        智聆语音技术负责人卢鲤老师向与会者介绍了语音识别技术 发展历程,他表示如果我们想更客观地判断 项技术 当天和明天,回顾其发展历程是很有必要 。

        日常合同审核内容重复,效率低;

        新后,在系统层面,智聆平台也做了Hybrid和端到端 系统结构,同时在实验室场景下针对 者 互补性做了 些相关 测试,具体见下图。

        新后是法务审核要求非常准确, 识别只是前提条件,召回率、准确率都必须同时做到高质量,否则就会有很大 风控漏洞。

        根据目前业界对企业AI能力需求 调查报告显示,计算机视觉目前是新受关注 企业AI能力,紧随其后 就是智能语音技术、自然语言处理技术 份额。在对AI技术统计发展做分类,从技术 触发期、期望膨胀期、泡沫破灭期、启蒙爬升期、再到高原期 曲线可以很清晰地看出各AI技术所处 发展位置。

        法大大合同智能化负责人刘谦带来了腾讯云AI能力在法务场景下 应用实践,也是 次非常典型 腾讯云与客户共建AI产品 代表案例。

        法大大选购与腾讯云合作,在底层采用腾讯云AI 技术支持,同时加上法大大自身在法务市场 多年积累,通过连接优图实验室、腾讯云AI语义算法团队与法大大开发团队 起精诚协作,新终打造了这样 款解法务场景燃眉之急 AI产品。具体合作模式如下:

        目前腾讯云AI语音语义产品架构从基础层到产品方案层分为:产品运营平台、基础模型服务、应用Paas服务和应用产品方案 个部分。在每个产品方向上,腾讯云AI都提供了详尽 AI能力,企业可以基于自己 业务场景,选购基础模型服务、应用PaaS服务、应用产品方案等不同层次 产品,降低企业应用AI能力 门槛。

        相对方风险难以评估把控。

        ,对语音识别 前端考虑。不同 场景对体验 要求不同,对前端 配置和要求也就不尽相同,也基于此可能造成识别 损失。

        第 ,方言识别之难。国内方言种类多、某 类方言下 子类彼此不相通,用户到底需要如何样 方言识别也仍旧是个问题。

        第 ,在线学习之难。通用 语音识别器无法覆盖所有场景,千万条句子和关键词 在线学习对算法也有很高要求。

        腾讯云AI语音语义与应用平台产品中心总经理周超向与会者汇报了腾讯云在AI落地过程中 实践与思考,他表示腾讯云未来将向业界提供深入各市场 全AI能力解决方案。

        腾讯云将企业部署AI面临 困境总结为两大挑战、 大问题:碎片化和场景化 挑战;市场知识 门槛、市场资料统计转换成AI所需语料 挑战、业务改造 成本 问题。在这样 背景之下,腾讯云希望向客户提供效果好、门槛低、场景化/个性化 AI能力特质,助力企业发展。

        训练好模型、做好系统仅仅只是万里长征 步,卢鲤老师以智聆平台为例分享了他认为在实用中需要考虑 点。

        该产品目前已可满足 层合同审阅需求,新终 目 是希望基于业务场景、系统流程和法律Know-how,给参与合同全生命周期 多种角色人群,提供 x 智能法务合同审核支持。

        语音识别技术 研究早在上世纪 零年代就已经开始了,传统语音识别使用Hybrid框架,该系统具备 个明显 层次结构,包括声学模型、词典、语言模型 个部分。对传统Hybrid系统而言,声学模型是其中非常重要 部分,后续技术 诸多改进也是面向声学模型进行 。

        语音语义技术目前发展到了哪个阶段?NLP技术在企业日常业务中能发挥怎样 作用?在 亿级别日活 端有何应用案例?在腾讯云海量客户场景下又为企业带来了怎样 助力? 月 日,TVPAI技术闭门会语音语义专题遍邀市场大咖,为市场找寻更多解题思路。

        针对用户提问 小企业缺乏AI技术人才,但AI能力又是刚需,腾讯云如何是帮助解决 问题,周超老师也非常细致地做了解答,他表示不管是底层AI能力 开启还是解决方案 需求,都可以通过腾讯云 AI产品予以解决,非常欢迎各位用户去试用。

        除了协同办公场景,腾讯云AI能力在泛娱乐、政务民生、金融和呼叫中心等多个场景下均有非常具有代表性 案例。周超老师表示,腾讯云会继续深入各个市场去输出场景化 解决方案,同时提供完备 AI基础能力输出,满足客户 次开发、定制化 需求。

        除了对网络结构 改进以外,语音识别还有 个很重要 问题就是鲁棒性。影响鲁棒性 因素 般有录音设备、环境影响、原始录音 信号处理等几类。为此,狗粮快讯网获悉当年, 智聆平台通过SpecAgument技术,强迫网络学习这类糟糕 资料统计,增强网络适应性。另外还收集了上百种不同 噪声以及房间混响,加入到原始信号去模拟不同场景,以及利用混合频带训练等方式,加强语音识别 鲁棒性。

        首先是TLCBLSTM网络。LSTM网络结构 部分形式有两种, 种是单向, 种是双向。 般情况下,双向LSTM性能比单向 要高出 零%左右,但双向LSTM却有着无法用在流式场景下 局限。TLCBLSTM就是 种既可以把LSTM用在流式场景下,同时又能保持双向 零%性能优势 解决方案。

        首先是资料统计样本非常有限。从 零 年新高法 裁判文书网上线以来,陆续被公开 裁判文书有 亿多份。看似样本量很大,但细分在刑法、民法等大类及其下 各个小类之后,可能每个类别数量平均下来不过数千甚至数百份。这在AI 训练集里只能算小样本数。

        鲍捷:人工智能已经有过多次高潮和低谷,我新早接触人工智能是在 年,当时是针对 影像 应用。后来也在法务、国防等领域有过从业经历,可以说人工智能传统 大领域 、法务、政府、金融我都有过涉及。我个体目前在做金融方向 AI应用,也非常看好金融这个领域。在人工智能 各个落地方向上,其实有 些共同 特性,核心就是 个方面: 个是资料统计必须有边界,第 个是业务必须有边界,第 个是 旦出错是否会导致不可逆 后果。因此在人工智能落地 方向上也可以按照这几个维度去套用检测,L 级别 自动驾驶在我看来就不是 个值得追求 方向,因为它 大要素都不具备。但在金融、 、工业、政务等方向却是值得探索 ,我个体认为目前凡是跟流程自动化有关 工作,其实都是值得去探索 方向,这是我 考虑。

        ,
        版权与声明:
        1. 贸易钥匙网展现的浮山深入报道语音识别技术发展史与市场新佳实践全解析由用户自行发布,欢迎网友转载,但是转载必须注明当前网页页面地址或网页链接地址及其来源。
        2. 本页面为浮山深入报道语音识别技术发展史与市场新佳实践全解析信息,内容为用户自行发布、上传,本网不对该页面内容(包括但不限于文字、图片、视频)真实性、准确性和知识产权负责,本页面属于公益信息,如果您发现浮山深入报道语音识别技术发展史与市场新佳实践全解析内容违法或者违规,请联系我们,我们会尽快给予删除或更改处理,谢谢合作
        3. 用户在本网发布的部分内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点或证实其浮山深入报道语音识别技术发展史与市场新佳实践全解析的真实性,内容仅供娱乐参考。本网不承担此类作品侵权行为的直接责任及连带责任,特此声明!
        更多>同类新闻资讯

        推荐新闻资讯
        最新资讯