工业人工智能应用
端到端语音识别解决方案
通用语音识别团队介绍
苏州协同拥有多位资深博士构成了多学科交叉的立体式技术矩阵和研发能力。在NLP技术、知识图谱构建、深度学习技术、大规模并行训练、推荐系统技术以及工业互联网云技术、工业云分布式服务技术、工业物理机理建模领域拥有十分资深的研发和落地能力。
核心价值
高效
端到端的模型旨在一步直接实现语音的输入与解码识别,从而不需要繁杂的对齐工作与发音词典制作工作,具有了可以节省大量的前期准备时间的优势,真正的做到数据拿来就可用。
兼容
更换识别语言体系时可以利用相同的框架结构直接训练。例如同样的网络结构可以训练包含 26 个字符的英文模型,也可以训练包含 3000 个常用汉字的中文模型,甚至可以将中英文的词典直接合在一起,训练一个混合模型。
高速
端到端的模型在预测时的速度更快,对于一个 10 秒左右的音频文件,端到端的模型在一块 GPU 的服务器上仅需 0.5 秒左右的时间便可给出预测结果。
场景赋能
深度学习推荐系统
在深度学习推荐系统领域,我们以YouTube的世界领先的推荐系统框架为模型参考,以我们协同自己的大规模深度学习训练平台为框架,快速完成研发落地,迁移到我们工业千万量级的SKU推荐引擎开发工作上面。
行业知识图谱
苏州协同将会结合已有的众多知识图谱技术,基于NLP和深度学习团队,快速完成知识图谱的初步构成和技术搭建。随着深度学习的发展,知识图谱中最重要的知识表示技术基本已经由深度学习统治。包括线性/双线性模型、矩阵分解模型、前馈神经网络模型、卷积神经网络模型、循环神经网络、基于注意力机制的Transformer模型、基于图的神经网络模型等等。
AI+苏云工业云平台
苏云服务平台已搭载AI的数据处理能力,在我们的项目研发框架下苏云的规则+AI的云服务系统将会极大提升整个工业大数据流处理的精准度和多判断多样性,从而从根本上提升传统工业云服务的经济价值,创造极大的经济聚集效应。
高可复用性及行业扩展性
协同现在已有的这套深度学习计算框架,有非常大的可复用性和行业延展性,可以应用在包括工业节能,工业云监控预警等相关深度学习技术研发上线上。也可以用在工业驾驶舱领域语音识别技术研发上线,工业NLP自然语言处理技术研发上线,以及工业相关选型推荐任务,和工业相关的视觉检测任务的模型训练和上线部署,具有极大的延展性,可拓展性,行业渗透力以及想象空间。
端到端通用语音识别方案
端到端通用语音识别方案支持按场景、语种、年龄、性别、发音人定制化采集对话语音、儿童语音、情感语音、远场语音、背景噪音、声纹识别语音、车载语音、多语种混读语音等。同时支持定制发音词典、语音过滤与清洗、正字转写标注、语音质量检测等
合作伙伴