北京时代拓灵科技有限公司是2015注册在中关村的高新技术企业,单位主要业务在智能音视频采集、处理以及播放等领域,特别是在人工智能、语音交互、VR/AR全景声等领域拥有充足的项目经验与技术储备,已拥有数十项专利和软件著作权。公司团队由国内、外知名院校博士和硕士组成,除此以外还有来自于美国杜比实验室、北大、清华、中科院声学所、华为等知名企业的员工加盟。
项目承担人员孙学京博士,毕业于北京大学,获得美国西北大学博士学位。在博士期间发明并实现了音频领域领先的基频提取算法和基于机器学习的声调模型,被下载超过两万次。毕业后曾就职松下美国语音技术研究所,负责语音合成和语音识别研究,实现公司第一个基于机器学习的多语种音调模型,完成嵌入式语音合成和语音识别系统。后来加入CSR(现被高通收购)任职资深科学家,为CSR世界占有率第一的蓝牙芯片CVC音频处理套件的核心算法开发人员之一。在杜比实验室,孙博士任高级主管研究员,带领一只世界级团队开发新一代的沉浸式音频会议系统Dolby Voice。曾获得两项创新奖项(Executive Theme Award, Executive Special Mentions),并担任杜比全球专利委员会委员。孙博士有超过100篇的专利,专利申请,和技术文章,于2016年获得北京“海聚人才”专家称号。
1.
基于全景声技术的军事仿真项目是一种基于Ambisonics声道独立的球形声场再现技术,不仅可以还放水平面信息,还能还放自下而上的高度信息,720°全方位展现声场信息。它能更真实的营造四周由远及近以及沉浸式的听觉感受,同时我们的算法融合了噪声抑制、回声消除、波束形成、定向增强等技术,可以应用到军事仿真领域,包括360度声场采集、声纹识别、声源定位、战场仿真培训科目、心理对抗等。
公司拥有数十项发明专利和软件著作权。关键技术优势,实现了针对不同场景,不同内容,动态生成最优虚拟环绕声的音频技术。通过头部跟踪器获取用户头部旋转的旋转角度,根据该旋转角度,生成旋转矩阵,根据第一音频信号,获取第一音频信号的调整参数,根据该调整参数,对第一音频信号进行调整得到第二音频信号,根据第二音频信号和该旋转矩阵,生成虚拟环绕声,从而可以提高虚拟环绕声的真实性。通过Direct-ambience signal decomposition(指向-环境信号分析)算法分析音频信号,得到音频信号包括的指向性信号的比重,也可以得到音频信号包括的非指向性信号的比重。
应用到军事仿真领域包括360度声场采集、声纹识别、声源定位、战场仿真培训科目、心理对抗等。
基于VR/AR/MR的高沉浸、强交互、新一代军用仿真训练等