数据堂取得语音识别模型相关专利,解决低资源语音识别痛点,提升识别精度
新浪证券-红岸工作室
6月3日消息,国家知识产权局信息显示,数据堂(北京)科技股份有限公司申请一项名为“一种低资源语音识别模型的构建方法与装置”的专利,授权公告号CN121354543B,授权公告日为2026年5月29日。申请公布号为CN121354543A,申请号为CN202511926790.0,申请公布日期为2026年5月29日,申请日期为2025年12月19日,发明人王大亮、齐红威、王佳、王子昕,专利代理机构北京希夷微知识产权代理事务所(普通合伙),专利代理师畅文芬,分类号G10L15/06、G10L19/02、G10L25/18、G10L25/24、H04W4/80。
专利摘要显示,本发明公开了一种低资源语音识别模型的构建方法和装置,方法包括:预处理准备:从预训练模型中提取线性层权重并配置LoRA参数;初始化构建:构建结构化的低秩适配器,生成融合频谱与相位信息的A/B矩阵初始值,对基础权重进行残差化处理;训练执行:使用低资源数据集,通过参数高效微调框架更新LoRA参数;权重整合及输出最终模型。本发明通过频谱‑相位残差初始化与参数高效微调技术,在不改动原有模型架构的前提下,有效解决了传统低资源场景下模型训练效率低、相位信息丢失、跨环节适配差等技术痛点,显著提升了方言识别、小众词汇识别及热词适配的精度。
天眼查数据显示,数据堂(北京)科技股份有限公司成立日期2010年8月26日,法定代表人齐红威,所属行业为科技推广和应用服务业,企业规模为大型,注册资本15199.3687万人民币,实缴资本15199.3687万人民币,注册地址为北京市海淀区宝盛南路1号院11号楼1层101-01。数据堂(北京)科技股份有限公司共对外投资了11家企业,参与招投标项目233次,财产线索方面有商标信息23条,专利信息55条,拥有行政许可4个。
数据堂(北京)科技股份有限公司近期专利情况如下:
| 序号 | 专利名称 | 专利类型 | 法律状态 | 申请号 | 申请日期 | 公开(公告)号 | 公开(公告)日期 | 发明人 |
|---|---|---|---|---|---|---|---|---|
| 1 | 一种低资源语音识别模型的构建方法与装置 | 发明专利 | 授权 | CN202511926790.0 | 2025-12-19 | CN121354543B | 2026-05-29 | 王大亮、齐红威、王佳、王子昕 |
| 2 | 基于大模型多模态数据融合方法及系统 | 发明专利 | 实质审查的生效、公布 | CN202511221598.1 | 2025-08-29 | CN121093272A | 2025-12-09 | 齐红威、何鸿凌、丰强泽、郑继龙、栗全峰、史红欣 |
| 3 | 多模态大模型数据清洗治理方法及系统 | 发明专利 | 授权、实质审查的生效、公布 | CN202510820032.4 | 2025-06-19 | CN120336725B | 2025-09-02 | 齐红威、何鸿凌、丰强泽、王大亮、高禹、郑继龙 |
| 4 | 大模型训练数据增强方法 | 发明专利 | 授权、实质审查的生效、公布 | CN202510717135.8 | 2025-05-30 | CN120235194B | 2025-08-26 | 齐红威、何鸿凌、丰强泽、王大亮、高禹、郑继龙 |
| 5 | 自动驾驶场景点云数据跨帧共享属性的后处理方法及装置 | 发明专利 | 实质审查的生效、公布 | CN202510601265.5 | 2025-05-12 | CN120126143A | 2025-06-10 | 史红欣、王大亮、齐红威 |
| 6 | 基于多模态大模型的问答数据处理方法及系统 | 发明专利 | 发明专利申请公布后的撤回、实质审查的生效、公布 | CN202510510268.8 | 2025-04-23 | CN120030132A | 2025-05-23 | 齐红威、丰强泽、肖永红、栗全峰、郑继龙、史红欣 |
| 7 | 一种点云数据的动静目标区分标注方法及系统 | 发明专利 | 授权、实质审查的生效、公布 | CN202510512020.5 | 2025-04-23 | CN120031970B | 2025-07-15 | 马晓光、王大亮、齐红威 |
| 8 | 多帧点云目标检测与分割融合标注方法、装置及终端 | 发明专利 | 实质审查的生效、公布 | CN202510354273.4 | 2025-03-25 | CN119888739A | 2025-04-25 | 史红欣、王大亮、齐红威 |
| 9 | 多维度的大模型数据质量评测方法及系统 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN202411946980.4 | 2024-12-27 | CN119377625A | 2025-01-28 | 齐红威、丰强泽、肖永红、栗全峰、郑继龙、史红欣 |
| 10 | 大模型多模态数据语义表征对齐方法 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN202411946533.9 | 2024-12-27 | CN119380341A | 2025-01-28 | 齐红威、何鸿凌、丰强泽、郑继龙、栗全峰、史红欣 |
| 11 | 多模态大模型训练数据采集方法及系统 | 发明专利 | 授权、实质审查的生效、公布 | CN202411946438.9 | 2024-12-27 | CN119380144B | 2025-04-04 | 齐红威、丰强泽、王大亮、高禹、郑继龙、史红欣 |
| 12 | 大模型数据智能标注方法及系统 | 发明专利 | 授权、实质审查的生效、公布 | CN202411949511.8 | 2024-12-27 | CN119378564B | 2025-04-25 | 齐红威、王大亮、丰强泽、栗全峰、高禹、郑继龙 |
| 13 | 联邦数据管控下的基于规则对齐的激励方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN202411911075.5 | 2024-12-24 | CN119357754B | 2025-04-08 | 贾晓丰、齐红威、章敏、邢刚、李凝云 |
| 14 | 一种基于前置节点的联邦数据共享方法和装置 | 发明专利 | 授权、实质审查的生效、实质审查的生效、公布 | CN202411845229.5 | 2024-12-16 | CN119316229B | 2025-02-28 | 章敏、齐红威、贾晓丰、王大亮、王宇航 |
| 15 | 基于联邦控制的多源数据协同方法、装置、电子设备及介质 | 发明专利 | 实质审查的生效、公布 | CN202411803953.1 | 2024-12-10 | CN119273260A | 2025-01-07 | 贾晓丰、齐红威、章敏、丰强泽、王睿宇 |
| 16 | 基于场景生成与供需匹配的联邦数据服务方法、装置、电子设备和介质 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN202411804034.6 | 2024-12-10 | CN119273113A | 2025-01-07 | 贾晓丰、齐红威、章敏、王大亮、高嵩 |
| 17 | 基于联邦机制的多主体共治数据协同方法、装置、电子设备及介质 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN202411784495.1 | 2024-12-06 | CN119248887A | 2025-01-03 | 贾晓丰、齐红威、章敏、何鸿凌、骆亦飞 |
| 18 | 一种高效自适应面向语音识别引擎的热词纠错方法与系统 | 发明专利 | 专利申请权、专利权的转移、授权、公布 | CN202410910592.4 | 2024-07-09 | CN118471201B | 2024-09-20 | 兰亮、余越、宁一鉴、王大亮、冯静、杜自强、汪文勇 |
| 19 | 一种基于特定标志物的激光雷达与相机联合标定方法 | 发明专利 | 实质审查的生效、公布 | CN202410239833.7 | 2024-03-04 | CN117830438A | 2024-04-05 | 史红欣、王大亮、齐红威 |
| 20 | 自动驾驶场景下不完整点云数据标注方法、装置及终端 | 发明专利 | 授权、公布 | CN202410213038.0 | 2024-02-27 | CN118071994B | 2024-08-27 | 史红欣、王大亮、齐红威 |
| 21 | 一种联邦数据学习的安全参数交换方法 | 发明专利 | 授权、实质审查的生效、公布 | CN202410199786.8 | 2024-02-23 | CN117786768B | 2024-05-14 | 邢刚、贾晓丰、齐红威、章敏、王大亮 |
| 22 | 一种可信联邦智能安全计算平台的方法和装置 | 发明专利 | 著录事项变更、授权、实质审查的生效、公布 | CN202410167961.5 | 2024-02-06 | CN117714217B | 2024-05-28 | 邢刚、李强 |
| 23 | 多维度人工智能产品评测方法及装置 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN202310687517.1 | 2023-06-12 | CN116483733A | 2023-07-25 | 丰强泽、齐红威、何鸿凌、肖永红、王大亮 |
| 24 | 一种数据驱动式人工智能技术评测系统及方法 | 发明专利 | 实质审查的生效、公布 | CN202310087039.0 | 2023-02-09 | CN115830419A | 2023-03-21 | 丰强泽、齐红威、何鸿凌、肖永红、王大亮 |
| 25 | 一种交互式人工智能技术评测方案的构建方法 | 发明专利 | 授权、实质审查的生效、公布 | CN202310087037.1 | 2023-02-09 | CN115810137B | 2023-06-02 | 丰强泽、齐红威、何鸿凌、肖永红、王大亮 |
| 26 | 语音摘要生成模型训练方法、语音摘要生成方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN202211687868.4 | 2022-12-28 | CN115827854B | 2023-08-11 | 王大亮、李昱璇、齐红威、姜丹 |
| 27 | 分级预测模型训练方法、标点符号恢复方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN202211602620.3 | 2022-12-14 | CN115617955B | 2023-03-21 | 王大亮、王萌、齐红威、姜丹 |
| 28 | 基于联邦数据及联邦服务的数据共享方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN202110764949.9 | 2021-07-07 | CN113204795B | 2021-09-24 | 丰强泽、齐红威、何鸿凌、肖永红 |
| 29 | 数据标注方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN202110764998.2 | 2021-07-07 | CN113205163B | 2021-11-19 | 郑继龙、齐红威、何鸿凌、肖永红 |
| 30 | 迭代式大规模发音词典构建方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN202110178948.6 | 2021-02-08 | CN112530414B | 2021-05-25 | 王治愚、王大亮、王丽媛、齐红威 |
| 31 | 一种图像去重方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN201911327469.5 | 2019-12-20 | CN111078928B | 2023-07-21 | 郑继龙、丰强泽、齐红威、何鸿凌 |
| 32 | 一种语音数据质量检测方法、装置、服务器及存储介质 | 发明专利 | 授权、实质审查的生效、公布 | CN201910870667.X | 2019-09-16 | CN110580917B | 2022-02-15 | 丰强泽、齐红威、何鸿凌、肖永红 |
| 33 | 一种图像标注方法及通用图像标注工具 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN201810631648.7 | 2018-06-19 | CN108829435A | 2018-11-16 | 李建峰、齐红威、戴文娟 |
| 34 | 多媒体文件的同步方法及装置 | 发明专利 | 授权、实质审查的生效、公布 | CN201810546057.X | 2018-05-25 | CN108769559B | 2020-12-01 | 袁鲲、齐红威、丰强泽 |
| 35 | 一种提供数据服务的方法及系统 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN201810437347.0 | 2018-05-09 | CN108600386A | 2018-09-28 | 栗全锋、齐红威、汪琪峰、李鑫 |
| 36 | 一种音频质量检测方法及音频质量检测系统 | 发明专利 | 授权、实质审查的生效、公布 | CN201710517195.0 | 2017-06-29 | CN107170465B | 2020-07-14 | 宋扬、程兰颖、赵涛 |
| 37 | 一种对象的搭配推荐方法及装置 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN201710465115.1 | 2017-06-19 | CN107256513A | 2017-10-17 | 丰强泽 |
| 38 | 一种元数据采集方法和系统 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、发明专利申请公布 | CN201510289443.1 | 2015-05-29 | CN104933104A | 2015-09-23 | 丰强泽、王大亮、揭宇飞 |
| 39 | 一种数据去重方法及系统 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、发明专利申请公布 | CN201510266694.8 | 2015-05-22 | CN104809256A | 2015-07-29 | 王大亮、杨琪 |
| 40 | 一种数据加密方法及系统 | 发明专利 | 授权、实质审查的生效、公布 | CN201510199706.X | 2015-04-23 | CN104767610B | 2018-11-20 | 王大亮、杨琪 |
| 41 | 一种任务外包方法和系统 | 发明专利 | 发明专利申请公布后的驳回、实质审查的生效、公布 | CN201510041889.2 | 2015-01-28 | CN104573988A | 2015-04-29 | 丰强泽、揭宇飞、杨琪 |
| 42 | 短文本聚类设备及方法 | 发明专利 | 专利申请权、专利权的转移、授权、实质审查的生效、公布 | CN201110160561.4 | 2011-06-15 | CN102831119B | 2016-08-17 | 赵凯、胡长建、王大亮、许洪志 |
| 43 | 用于识别非结构化文本中的信息的方法和装置 | 发明专利 | 专利申请权、专利权的转移、发明专利权授予、实质审查的生效、发明专利申请公布 | CN201110077305.9 | 2011-03-23 | CN102693244B | 丰强泽、齐红威 | |
| 44 | 多播树建立方法及多播系统中的服务器和节点 | 发明专利 | 专利申请权、专利权的转移、发明专利权授予、实质审查的生效、发明专利申请公布 | CN201110077395.1 | 2011-03-22 | CN102694833B | 罗彦林、夏勇 | |
| 45 | 概念识别设备和方法 | 发明专利 | 专利申请权、专利权的转移、授权、实质审查的生效、公布 | CN201110077605.7 | 2011-03-18 | CN102682042B | 2014-07-02 | 李建强、赵彧、刘博 |
| 46 | 评价信息抽取方法和设备 | 发明专利 | 专利申请权、专利权的转移、发明专利权授予、实质审查的生效、发明专利申请公布 | CN201110035018.1 | 2011-01-21 | CN102609424B | 王大亮、许洪志、赵凯、邱立坤、胡长建 | |
| 47 | 知识标注结果检查方法和系统 | 发明专利 | 专利申请权、专利权的转移、授权、实质审查的生效、公布 | CN200910005716.X | 2009-02-03 | CN101794282B | 2013-11-06 | 丰强泽、福岛俊一、齐红威 |
| 48 | 构建引擎的流程的方法和设备 | 发明专利 | 专利申请权、专利权的转移、发明专利权授予、实质审查的生效、发明专利申请公布 | CN200910009755.7 | 2009-02-02 | CN101794216B | 丰强泽、齐红威 | |
| 49 | 实体关系挖掘设备和方法 | 发明专利 | 专利申请权、专利权的转移、授权、实质审查的生效、公布 | CN200710167974.9 | 2007-10-31 | CN101425065B | 2013-01-09 | 许荔秦、胡长建、福岛俊一 |
| 50 | 自适应服务推荐设备及方法、自适应服务推荐系统及方法 | 发明专利 | 专利申请权、专利权的转移、授权、实质审查的生效、公布 | CN200710162463.8 | 2007-10-15 | CN101414296B | 2012-07-25 | 丰强泽、福岛俊一 |