【深度】华夏基金的数据征途
恒生电子股份有限公司 君宝
2022年一季度,沪深两市持续探底。对于资管新规后整体规模屡破新高的公募基金行业来说,无疑是一次经营情况的大考。
在前端,调仓判断、渠道沟通、压力测试,在后台,客户申赎行为分析、全面了解投资者投资过程中的困难障碍、习惯心理行为等等。无疑,数字营销体系搭建得越完整,越能够更充足地提供客户服务辅助。
而这,仅仅是金融机构整体数据体系建设成果的一次小小体现。
当前,金融科技和数字化正在改变金融行业竞争格局,国内基金公司不断加大金融科技领域的投入,特别是在数据方面的投入。
作为高度信息化的行业,基金公司系统众多,包含办公、投资、风控、运营、资讯等多个维度。完备数据体系、挖掘数据价值,横向连接多个部门及业务条线、纵向贯穿数据采集到应用的全生命周期,是当前行业数据战略投入的重点之一,作为行业头部基金公司的华夏基金也不例外。
为助力数字化转型战略的落地,华夏基金现已形成由数据中心、金融科技部、智能投研科技中心构成的立体化金融科技架构体系。
在数据战略方向,以数据中心为原点,构建基于业务发展需要的大数据平台以及金融人工智能体系,并通过对金融大数据深度研究、分析、挖掘和应用,优化实际运营和业务决策。
近日,华夏基金首席数据官陈一昕接受《恒生世界》专访,分享华夏基金对于“数据驱动”的思考和实践。
“一体两面n中心”
在华夏基金首席数据官陈一昕看来,2022年一季度业务的起伏,也给金融科技团队一个完善数据底座的机会。
在2021年,华夏基金详尽制定数字化转型的“十四五”规划,致力于通过五年时间,打造业界领先的数字化资产管理公司,真正的实现以科技促质效,推进科技支撑到科技引领的转变。
这其中,包含基础设施与营销体系的完善、投研一体化的实施、展开大数据技术应用创新、积极推进人工智能技术应用等。陈一昕着重提到了华夏基金“一体两面n中心”的数据体系建设框架。
陈一昕认为,基金公司作为非数字原生态的企业,信息化建设围绕各业务活动的展开发展,核心业务数据都存储于相对独立的、不同的架构系统当中,普遍存在数据割裂、质量不高的问题。因此,在数字化转型总蓝图下,华夏基金正有规划、有体系地推进数据体系建设。
浓缩起来,便是“一体两面n中心”的数据体系建设框架。华夏基金通过这一体系,沉淀公司一体化的数据资产和技术能力,向各个部门提供数据服务。
所谓一体,是华夏基金的数据资产管理体系。
这一体系着力打通固有的数据孤岛,全面汇聚打通内外部数据,在保证数据安全的前提下,同时实现数据在公司内部的快速共享与使用。其中,需要扎实的数据治理,提升数据质量,为高质量的数据资产持续积累、保驾护航。同时,需要对数据资产进行专业化、体系化的管理。
针对数据资产的梳理,华夏基金从数据资产是什么、谁来管理、怎么管三个角度切入。
在数据资产定义方面,华夏基金开展系列的数据资产盘点与数据架构体系梳理,解决数据信息缺失与不规范的历史包袱问题。在管理方面,华夏基金根据数据治理原则,对数组进行权威性准确性的管理,制定相应的管理办法细则,明确了归属认证的原则,再结合相关的痛点和数据需求,稳步推进全方面的主数据的归属认定。与此同时,建立达摩平台,形成可视化的数据资产目录,帮助业务部门快速找到所需的数据资源。
“一体”构建的同时,还包括“两面”,它的一面是Oracle等传统结构化数据库,一面是新引进的大数据平台,后者用于支撑非结构化大规模数据的管理趋势,使得快速分析海量数据成为可能。在这样的一体两面基础之上,打造n中心。
“n中心,简单来说就是以业务发展的需求为核心来打造一系列的数据服务的中台,给各个部门提供数据服务,如交易管理中心、交易信息中心、统一资讯中心、机构管理中心,还有营销数据中心等等,来持续地为各个业务部门赋能”,陈一昕详细补充道。
值得一提的是,在数据服务的过程中,前端业务的需求与场景依旧灵活多变,针对这一挑战,华夏基金一方面树立一站式的数据共享分析能力,通过面向不同的业务用户提供差异化的工具和资源,提升业务人员和数据分析师的体验。其次,加强可视化数据分析。
投研数据之用
在所有基金公司的数据之用中,投研数据的重要性毋庸置疑。
从研究员的角度来看,一方面,市场数据分析、组合数据分析、业绩归因、资产配置优化等信息数据质量欠佳可能导致投资决策风险,另一方面,当前投研信息的海量供给、数据异构、信息系统割裂,也同样会导致投研效率的降低。
在投研过程当中如何利用数据?如何让数据产生价值?陈一昕分享了华夏基金在实际的业务中,对投研数据的梳理和整体框架建设。
在基础数据方面,华夏基金依托证监会发布的基金行业的数据模型标准结合公司实际情况,开展对主题域子模型的设计及落地,包括交易、产品、资讯、另类数据等不同的主题域。同时根据业务线的需要,提供离线的数据服务通道,以及实时的数据服务通道,来满足不同的数据消费场景。
在投研指标方面,华夏基金打造投研指标中心,覆盖收益分析、风险分析、交易分析、持仓分析、绩效分析等不同类别的投研指标体系,并且提供类似实时头寸、实时风控等实时指标的计算能力,支持高实效性的分析场景。
最后,打造了面向投资研究的一站式数据服务平台,基于高性能、低代码的数据流转工具,将内外部的多元异构的投研数据进行统一归集、融合、输出。联通各个券商以及数据服务商,让数据方便、易得,打通不同数据提供方与使用方在数据定义、数据维护、数据应用等维度的差异和壁垒。
总结来看,通过将海量的多元异构数据进行标准化和规一化的处理,提高投研效率,为数据价值深度挖掘创造了条件。
而在投研的数据创新应用方向,华夏基金也积极做了很多其它积极尝试。
陈一昕介绍,华夏基金与境外投研机器学习公司Boosted.ai合作,打造可解释的人工智能算法在投研方面的应用。
“它可以作为AI的量化投资工具辅助基本面的研究,如海量另类数据处理等。另外,这个工具是可解释的,有别于传统的、黑箱式的机器学习,可以对类似基本面因子等进行可解释的输出,让我们的研究员更加了解,为什么模型会做出这样的决策,这一特征也受到我们科研人员的欢迎。”
在目前受到金融机构瞩目的自然语言处理NLP方向,华夏基金也将其与投研业务结合,力图以大规模训练与文本模型为技术基础,基于多项前沿的自然语言处理技术,打造舆情分析的处理模型,未来希望能够以能力层和平台产品为载体,面向业务部门提供使用。
在最后,陈一昕还提到了华夏基金自研的量化投资平台。这一平台针对华夏基金量化投资团队量身定制,将各个部门量化投研人员的研究成果沉淀在平台内,方便投研人员查询各种量化模型信号、常用的量化指标等等。
资管科技的未来之向
在资管科技领域,相较于国内,国外头部资管公司对于金融科技的投入程度和广度要深得多。
在陈一昕的眼中,资管行业迅速发展的今天,国内金融科技在资管领域的科技投入相对不足。从海外资管科技的发展中,也可以得出三点启示:
首先,要看重科技的长期效能,持续投入,一以贯之,把金融科技当作公司发展的利器,作为金融机构科技战略转型的保障。其次,可以像BlackRock那样技术、业务同时发力,将科技投入从成本中心转向利润中心,从“科技投资”到“科技创收”。第三,打造技术生态,通过合作来拓宽能力边界,明确自身核心优势和能力边界,找到最适合的合作伙伴。
展望未来资管科技的发展情况,有两个方向陈一昕认为值得关注。
其一是隐私计算。
“数据资源的开放、共享、流转是当前发展的重要趋势。如何在确保数据安全和实现数据共享中找到平衡,是各方需要高度重视的问题。在此大背景下,隐私计算作为一种解决方式,受到了各方关注。”
具体来看,在用户画像方向,一家基金公司获得的客户信息有限,通过隐私计算技术,有可能与其它的金融机构进行联合建模。在确保不泄露任何参与方保密数据的前提下,帮助基金公司更好更全面地做到KYC(know your client),实现精准营销的战略。
另一个隐私计算可能发挥作用的场景是联合风控。基金公司借助同业部署或混业部署的隐私计算系统,在各方数据不出域的前提下,通过黑名单共享、信用评分模型联合训练等方案,及时对潜在的威胁作出反应,在反洗钱、信用评估、风险预警等诸多业务上都有一定的应用前景。
除了隐私计算,在人工智能方面,可解释AI也是陈一昕着力看好的一个资管科技发展方向。
陈一昕认为,在金融领域中,机器学习的可解释性往往需要面对多种对象,包括开发者、使用用户、应用用户、金融监管、社会大众等。不同对象所看重的“可解释性”重点虽各不相同,但都有其必要性。
对于开发者来说,算法的“可解释性”可以保证后续调优改进过程的有效进行;对于金融工具的使用用户来说,“可解释性”则可以使机器学习模型像其他传统金融理论或公式一样被理解与接受;对于应用用户,如使用模型的投资研究人员,“可解释性”可以为模型给出的不同资产定价结果做出详细说明;对于金融监管者来说,“可解释性”可以保证其从全流程上对AI模型进行约束并防范金融风险;而对于社会大众来说,任何一门学科的深入发展都是不可或缺的,人们需要对金融机构的决策进行审慎监督。
金融人工智能是一个在不断发展的领域,随着社会共识的加深以及金融人工智能可解释性相关的法律、监管规章的持续完善,可解释性将成为金融AI能够长期可持续应用的必要原则之一。
正如上文所述,目前华夏基金正就可解释机器学习在基金业务领域的落地应用进行积极探索和尝试,将AI技术作为一种辅助性的投资工具,集中应用在辅助评估海量数据集、动态股票筛选、提高投资效率等领域。
面对资管科技的应用与创新挑战,陈一昕表示,华夏基金积极布局数字化转型战略,将数字化视作实现加速发展和转型升级的核心引擎,从夯实顶层设计、应用探索和配套机制这三个层面,既做好统筹规划,又做好技术创新。
“在顶层规划设计方面,华夏基金坚持统筹推进,结合战略目标制定了华夏基金的十四五的数字化发展规划,致力于从数字赋能向科技引领升级。在应用探索领域,华夏在数字化战略的框架内,优先聚焦重点难点,攻坚重大课题,成立若干研究中心和工程团队,在数字化营销、智能投研、运营提效三个领域挖掘数字化场景,深耕细作。同时扩大金融科技的合作生态圈。最后,在配套机制方面,我们持续推进数据能力的建设、架构管理的升级、流程组织的优化,不断提升我们数字化的转型能力以及企业的数字化文化”。
随着数字经济上升为国家战略,金融科技推动金融业数字化转型持续深入发展。无疑,数字化是一个征途,这其中的前行者均在顶层设计、创新应用等方面针对各自的业务特点下苦工。
在华夏基金的蓝图当中,数据的驱动力是一面旗帜,也是基础的动力,为有效推动数字化转型,注入源源不断的活力,满足各类业务场景的数据需求。
责任编辑:石秀珍 SF183