需求列表 需求列表详情

智能语音同声传译解决方案

需求领域:信息技术 所在地: 研发经费:面议

发布时间:2022-07-29 期望解决时间:2022-12-01

联系方式:****** 企业规模:****** 主营业务:******

需求描述

公司经营范围包括信息技术开发、计算机软、硬件开发及销售技术咨询、技术服务;计算机网络工程设计;智能微电子信息系统、通讯系统、楼宇智能化系统的开发及销售;系统工程、信息服务电子产品、计算机通讯设备研发及销售;安全技术防范工程。 

技术现状:

遵循云加端加芯片,其中核心提供是云服务。云和手机进行通讯,其中音频传输通过opus进行1:16的压缩。手机APP和云端通过http协议进行指令和数据的上传,聚合云和nuances云平台与Google云之间通过TCP协议进行服务器之间中转。这里的难点是语音从发起到结束,要保证在200毫秒之内的低延迟,同时设备与手机之间通过蓝牙通讯由于安卓手机的开源性,安卓的很多底层内核都被修改以后导致了很多蓝牙的兼容性问题。

需求详情及期望:

(1)利用基于神经网络的强大的建模能力,使用一个模型直接对给定文本时语音的条件分布进行建模;

(2)通过对语音波形的小波变换进行基频粗定位,然后根据对语音能量的分析生成平滑的基频轨迹,最后根据语音的噪声能量和语音能量的大小对基频进行微调,得到精确稳定的基频轨迹;

(3)基于DNN和RNN的统计参数语音合成系统训练通常采用MMS训练准,采用BP算法和SGD算法更新模型参数,使预测的声学参数和自然声学参数尽可能接近。

(4)服务器分布式部署。在集群前面增加负载均衡设备,实现流量分发。采用负载均衡(Load Balancing),简单地说就是将负载(工作任务,访问请求)进行平衡、分摊到多个操作单元(服务器,組件)上进行执行。

(5)ecdn 网络加速。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接,负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。

(6)支持多国语言,且接口调用流程完善。