星环科技:大数据全栈解决方案平台级公司
新浪财经
来源:中信证券研究
文丨梁程加 陈俊云
随着5G时代来临,数据量爆炸式增长、数据复杂度不断提高,人工智能等前沿技术的发展催生了对非结构化数据的强劲需求,从而推动全球大数据市场高速增长。在国产替代背景下,中国大数据厂商迎来结构性机遇。星环科技依托Hadoop生态不断迭代,在与云融合的趋势下持续展现生命力。此外,公司作为国内唯一覆盖数据库和大数据领域全栈解决方案的厂商,凭借市场稀缺性、核心技术自主可控、本地部署+云化并行战略、布局人工智能/数据科学等优势构建核心竞争力。参考Cloudera等美股大数据公司,我们给予公司2021E PS 20~25x的估值区间,建议投资者重点关注。
▍公司简介:中国领先的大数据全栈解决方案厂商。
星环科技成立于2013年6月,创始人孙元浩曾负责英特尔Hadoop发行版研发及产品化工作,主要从事基于Hadoop分布式引擎和数据分析算法研究。公司致力于打造“云计算+大数据+数据库+人工智能”的基础平台产品,已推出一站式大数据综合平台TDH、智能大数据云平台TDC、智子人工智能平台Sophon和超融合一体机,涵盖操作型数据库、数据仓库、数据集市、数据湖、实时计算、人工智能等应用场景。
技术路线方面,公司基于Hadoop开源架构打造产品,后经不断研发替换组件,实现核心技术自主可控。
商业模式方面,公司目前采用本地部署授权+订阅和云产品订阅的方式。证监局备案信息显示,2020年12月星环科技已签署上市辅导协议,拟登陆科创板上市,腾讯为最大机构投资方,恒生电子持有3%股权。
▍行业分析:全球数仓市场稳定增长,中国市场增速高于全球水平。
根据IDC数据,2019年全球数据仓库市场规模为168亿美元,IDC预计2024年全球数据仓库市场规模将达到297亿美元,2019-2024年复合增速为12%。IDC预计2020年中国大数据市场规模将达到104.2亿美元,较2019年同比增长16.0%,增速高于全球平均水平。
从细分市场来看,当前国内大数据市场软件部分占25%,对应市场规模为26亿美元(约合169亿元)。我们认为,随着技术的成熟与融合、以及数据应用和更多场景的落地,软件规模占比将逐渐增加。
竞争格局方面,中国大数据领域厂商包括三类公司,分别是云服务厂商:阿里云、腾讯云等,传统ICT厂商:华为、浪潮信息、新华三等公司,纯大数据企业:星环科技、Kyligence硅智信息、偶数科技、Hashdata等。星环在技术和客户积累方面处于领先地位。
▍Hadoop大数据架构持续演进,与云融合是未来方向。
Hadoop奠定现代大数据分析架构,且公司核心解决方案同样基于Hadoop生态。Hadoop定义了最基础的分布式大数据批处理体系,打破了传统数据库一体化的模式,将计算与存储分离,并聚焦于解决海量数据的低成本存储与规模化处理。Hadoop在面对上百PB数量级数据查询分析时能够极大地提升效率,同时通过使用廉价硬件集群搭建的分布式系统实现成本效益,相比于MPP架构可拓展性得到较大提升。
但Hadoop存在结构复杂、难以维护、易用性较低等问题。云时代下,云原生数仓提供近乎无限的延展性、高弹性、更低成本存储和更高易用性,给Hadoop生态带来巨大冲击。然而,我们认为Hadoop架构与云并不冲突,三大公有云厂商早早拥抱了Hadoop架构,并在云上推出相应发行版。Hadoop生态中Spark、Flink等新兴组件目前仍是最佳解决方案,且对容器资源调度引擎Kubernetes支持越来越强。
因而,我们认为Hadoop与云结合一定是未来的发展方向,Hadoop生态仍将展现持续的生命力。
▍公司分析:凭借稀缺性、核心技术自主可控、本地部署+云化并行、业务拓展至数据科学等优势构建核心竞争力。
1) 若公司上市科创板后,将是目前A股二级市场唯一具有全栈大数据解决方案提供能力的厂商,具有稀缺性。竞争对手Kylingence、偶数科技、Hashdata均专注于提供数据仓库产品,未涉及OLTP数据库;明略科技专注于数据中台建设,提供智慧城市等方案。且这四家公司均为一级市场标的,目前暂未公布上市计划;
2)公司核心技术已实现自主可控,体现出强大的研发能力,符合国产替代的大背景。目前除云容器编排技术仍使用Kubernetes外,公司已实现所有核心组件自主研发,产品性能强劲。在Gartner发布的2016版数据仓库及数据管理解决方案市场魔力象限中,星环科技是唯一上榜的中国公司。2018年,公司的TDH产品成为全球首个通过TPC-DS的产品;
3)本地部署与云化并行策略:分析公司标杆案例客户结构,超过77.8%的客户来源于金融、电信、政府等数据敏感型行业,预计短期不会上公有云。同时,零售传媒等其他行业上云进程已加速。因此,公司采取本地部署与云平台方案同时推进策略;
4)5G时代数据量爆炸式增长、数据结构复杂度也不断提升,而人工智能与机器学习则对海量非结构化数据有巨大需求。公司推出人工智能平台Sophon,将业务从数据底层拓展至AI平台层,协助客户迅速完成从特征工程、模型训练再到模型推演的机器学习全生命周期工作。
▍海外对标:Cloudera、Teradata和Databricks。
Cloudera和Teradata均为美股大数据综合方案提供商,发展历史较长。Cloudera 是Hadoop生态的第一家商业化公司,从产品体系角度与公司具有较强可比性。此外,Databricks专注于数据湖、数据仓库、湖仓一体和机器学习等大数据综合解决方案,其核心产品Spark为分布式数据批处理引擎,已成功取代MapReduce成为目前Hadoop生态中应用最广泛的计算引擎。Databricks预计今年上市,最新估值280亿美元。而Cloudera和Teradata处于成熟期后的转型时期,无法充分反映星环的高成长性。因此我们还选取云原生数仓Snowflake、搜索引擎公司Elastic N.V.和非关系型数据库领导者MongoDB作为参考,给予星环科技2021E PS 20~25x的估值区间。
▍风险因素:
大数据领域国产化替代进程不及预期风险;疫情冲击企业短期IT支出缩小、项目延迟交付风险;公司核心研发技术人员流失风险;市场客户拓展不及预期风险;公司上市进展不及预期风险等。