新浪财经 基金

深度|泰康资产副总经理、首席技术官迟哲:构建弹性、精细、高效的数字基础设施,助力数字金融稳健发展

市场投研资讯

关注

2023年召开的中央金融工作会议提出,要做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章,并进一步明确了未来金融业在助力经济结构优化过程中的发力点。以数字金融为例,作为数字经济背景下的全新业态,其既是现代社会、经济、科技融合发展的必然产物,也为持续优化金融服务、赋能金融业务提供了关键抓手。尤其是随着人工智能、区块链、云计算及大数据等技术的快速发展,数字技术和实体经济结合得愈发紧密,而加快发展数字金融也成为实现共同富裕、推动经济社会高质量发展的应有之义。

大势之下,作为推动金融创新的现实基底,数字基础设施建设同样呈现出新的时代特征,即在控制总拥有成本的前提下,通过打造高可靠、高性能、高可用的云化资源平台,实现对敏态应用和稳态应用的融合管理,进而更好满足金融创新的稳定性与高速迭代需求;同时,通过高效支撑大模型应用落地及行业场景重塑,逐步改变人与数据的交互方式,助力新质生产力落地金融领域。

伴随金融数字化转型的持续深入,云原生、平台化成为打造数字基础设施的共识途径。金融机构纷纷以解决实际问题为目标,引入分布式技术打破架构、设备和运维管理层面的传统约束,力求为业务发展提供更为安全、可靠、灵活的技术支撑。顺应这一趋势,泰康资产管理有限责任公司(以下简称“泰康资产”)积极探索可替代“传统SAN存储基础架构+成熟商业虚拟化软件”的转型方案。以某开源版解决方案为例,尽管其具有功能迭代快等技术优势,但该方案不仅管理节点众多、架构复杂,且还需对存量虚拟化架构进行大幅改进,风险不可控因素较多。与之相比,超融合架构通过将服务器虚拟化、存储、网络与安全等组件融合部署于x86服务器之上,可使IT基础设施更加简单紧凑,从而减轻运维人员压力。鉴于此,泰康资产最终选择基于超融合架构搭建云化资源平台,并以对业务影响最小为原则,分阶段实施了超融合云化资源平台部署及迁移工作。

第一阶段:资源池架构的“云化转型”。该阶段的主要任务是将专有存储硬件升级为软件定义存储模式和分布式架构,底层硬件资源基于超融合分布式架构完成整合,虚拟化层则继续使用原有的成熟商业虚拟化软件,并通过虚拟化迁移的方式,将应用系统在线平滑迁移至新的云化资源平台。

第二阶段:云化资源平台“双芯升级”。随着自主可控改造的稳步推进,泰康资产通过构建新一代云化资源平台,引入基于超融合架构的KVM用于生产与开发测试,以及完成与现有虚拟化软件互备的虚拟化技术储备,为下一步技术转型打下了良好基础。

第三阶段:云管平台统筹“多芯协同”。该阶段通过部署全栈云管平台,面向基础设施云化资源实现了统一管理,并通过功能对标,规范虚拟化设备的管理标准和接口,着力探索多云管理的最佳实践。

第四阶段:容器平台提供“敏捷赋能”。该阶段通过搭建统一容器平台,为以云原生为核心的现代化开发方式提供了可靠的基础设施支撑,同时充分满足了敏态应用快速部署、快速迭代的需求。

自2019年开启底层资源平台转型,泰康资产的云化部署能力迎来了爆发式增长,计算资源管理规模迅速扩张15倍,资源申请后的交付时效由小时级缩短为分钟级;与此同时,通过对云化资源开展精细化管理与动态回收,不仅使计算资源的采购成本每年降低了20%,且推动“资源管理运维”加速向“资源服务运营”转变,高效支撑了公司数智化发展。

研发生命周期管理升级,规范化控制风险

面对日益激烈的市场竞争和不断变化的市场需求,数字基础设施不仅要能支撑业务更快、更好地适应市场变化,还要能不断提高研发效率和质量,深入推动敏捷开发模式的实践和落地。对于中小金融机构而言,在科技资源有限的情况下,如何有效保障交付质量、控制安全风险成为当前亟待解决的典型问题。针对该领域,泰康资产全面推动敏捷开发模式的落地应用,统一制定研发技术规范和质量管理标准,并将其与DevOps平台建设相结合,显著提升了研发全生命周期管理的自动化水平,进一步提升了产研团队创造和交付业务价值的效率。

首先,跨科技条线组建技术架构团队。通过持续建设公司内部云原生、大数据、开放服务、人工智能等四大技术平台,泰康资产深入推动统一规范体系建设,涵盖技术选型、代码管理、编码规范、代码审查、UI规范、用户行为分析、服务连续性和灾备能力等多个不同领域;同时,梳理完善技术架构评价体系,设计制定5个核心量化指标与22个架构评价指标,统筹推进企业级技术架构的升级和优化,不断提升研发人员工作效率和代码质量,为业务平台发展提供了基础支撑和变革驱动力。

其次,全面升级研发质量管理体系。泰康资产建立两级QA联动工作机制,发布多项应用类、数据类质量管理规范,并通过梳理20项研发质量活动,以及固化18个质量活动标准模板,进一步明确了活动质量要求与操作指引;同时,发布5个质量核心KPI指标,通过持续采集指标数据、优化过程管理,确保研发团队在开发过程中遵循统一的质量要求,逐步提升研发产品交付的整体质量。

最后,基于DevOps平台构建工作流。打通需求、设计、研发、测试、上线全流程,泰康资产将研发规范流程、质量卡点与平台工作流深度融合,确保研发过程高效、规范;同时,通过整合工具链,将企业现有工具和自动化流程相结合,实现自动化的构建、测试和部署操作,并以此不断推动开发和运维团队之间的沟通协作,持续提升软件交付及部署速度。

支持“AI+金融”,探索大模型应用落地

伴随大模型技术在金融行业进入应用落地的新阶段,金融大模型的复杂性和参数规模不断增加,并为数字基础设施带来了新的任务和使命,即不仅要为大模型的训练、部署和应用提供必要的算力资源,还要高效保障网络通信和数据的安全。紧跟行业发展趋势,泰康资产在投研支持、量化投资和辅助研发等场景积极探索大模型应用,并着力解决“算力进不来、数据出不去”等难点问题。

首先,在算力领域,采购成本和限购条件是算力基础设施建设面临的重大挑战。大模型的训练和应用均需要高性能的计算资源支持,而这对很多中小金融机构来说是一项巨大的财务负担,从而限制了其在大模型探索方面的投资热情。其次,对于金融行业来说,金融数据通常包含较多的客户敏感数据和隐私信息,不能在公域直接使用。为突破上述困境,泰康资产通过全面分析保险资产管理行业的客户特征和业务特点,选择为不同的大模型应用场景合理匹配算力资源,进而以更加经济、高效的方式解决算力供需矛盾。

面向AI赋能内部运营质效提升的诸多场景,泰康资产通过接入成熟的国内大模型、租用公有云算力服务、改革传统人机交互方式等举措,持续提升数据的提炼和处理能力,加速推动AI智能应用的落地和推广。对于涵盖公司内部数据的私域大模型,泰康资产在推理和训练场景,特别是短期内出现高并发、高性能需求的场景,选择租用高性能计算资源,并在公司内部搭建临时算力平台,以减少推理潮汐属性和训练间隔带来的算力资源浪费;此外,对于投研支持、量化投资等已落地的私域成熟大模型应用,则使用公司自有的算力服务平台来保证业务的稳定高效,同时不断探索算力池化调度方案,以有效提升高价值计算资源的使用效率。在可以预见的未来,AI应用将为投资、投研和财富管理等领域带来重大变革,大模型技术在深挖数据价值、优化场景需求的同时,也将持续促进公司服务向智能化演进。

数智时代,数字金融是金融行业高质量发展的必由之路,而构建安全、稳健、高效的数字基础设施具有重大的战略意义。企业数字化转型不仅意味着科技条线需要更加努力地修炼内功,提升整体自研能力和科技水平,更需要持续探索对基础资源和研发效能的精细化管理,让科技支撑能力更具弹性、更精细、更高效。后续,泰康资产将进一步结合自身业务特点,着力构建运营支持平台和软件全生命周期管理平台,不断提高数字化转型和创新效率,实现算力、数据、智能应用的融合赋能,以领先科技在激烈的市场环境中持续打造竞争优势。

转自:《中国金融电脑》2024年第6期

加载中...