Insights | 数据驱动创业投资 - 写在Q三周年之际

上个月,Q满三周岁了!Q是我们诺基亚成长基金(NGP Capital)自有的人工智能平台,助力我们发掘潜力公司和市场洞见。我们决定投资一个内部数据平台的原因有很多,但最主要的原因是我们想化被动为主动,我们需要走在市场的前面,在公司信息、投资动向和结果成为已知事实之前就对市场有一个全面的掌握。

我们做出的另一重要决定是:以触手可及的方式搭建我们的数据平台。为了让团队充分获益,使每个人都能够积极利用这个工具,我们决定Q不仅能用于探索数据,而且可以将数据与项目流管理紧密结合起来。

 

Q有什么?

在技术层面,我们把Q分成三部分:首先,我们采购一些与我们决策相关的数据源,获取每个公司大约700个数据点。采购数据是为了减少不必要的精力耗费,我们不相信自己可以建立一个独特的数据集。

然后,我们对数据进行建模,建立机器学习模型来支持我们的决策。这里的关键是实体识别和数据标签:我们如何识别像成长型公司这样普遍存在的实体,以及我们如何创建训练数据来预测出色(或不太出色)的结果。

第三,我们坚信数据需要便于使用,让团队触手可及,所以我们投入了大量精力,把数据与现有及新的工作流程进行整合,确保Q也会主动将有意义的数据和事件推送给团队。

 

Q是如何助力投资的?

我们要从大约250万家技术创业公司中,寻找出那些可能成为NGP投资目标的公司。

Q通过两个步骤将公司范围缩小,第一步着重筛选与我们投资战略契合的公司,第二步侧重筛选发展势头和财务前景良好的公司。下图说明了我们是如何基于Q把这两方面结合起来,将我们的目光从250万家聚焦到7000家我们认为可投资的公司。

第一步,与投资战略相适应,意味着公司要与我们通常投资的地域和发展阶段相匹配。此外,我们还有主题相关性的标准,目标公司需要集中在网络安全、边缘云、数字工业和数字化转型等领域。基于公司的文本信息和分类数据,我们可以归纳哪些公司会与我们其中的一个标准相符合,如果有多项符合,哪一项关联是最强的。经过这些过滤筛选,我们把目标缩小至35000家。

第二步,公司的发展势头,我们需要确保我们的投资产生回报。我们发现,最好方法是寻找估值上升的公司。由于我们知道估值数据不容易获得,而且只有在融资或退出时才得以体现,所以我们通过预测所有公司在任何特定时刻(包括未来一年)的假设估值来解决这个问题。通过估值增值,我们从35000家战略符合的公司中筛选到可投资的7000家公司。

当查看不同的数据点并试图整合所有的信息时,最大的问题不是数据的稀缺性,而是正好相反,实际上有太多的数据,我们需要了解每个数据点和时间序列的相对重要性。由于这个问题,我们决定尝试将尽可能多的信息归纳成三类评分(即Q匹配, Q推荐,Q合格),我们称之为Q评分。

即使7000家公司在250万家公司中只占不到0.5%的比例,但对团队来说,这个待审核的数字仍然很大。因此,Q评分为我们提供了一种简单的方法来对公司进行分类和过滤,并迅速获得对数据库中任何一家公司的第一印象。

通常情况下,我们希望关注列表的顶部公司,但我们也会经常使用其它筛选器与其相辅相成,如旅行时我们会关注相关区域的公司,参加活动时相关的参会公司,做研究时相关的市场和行业, 等等。另一方面,Q根据这些评分主动向团队推送公司,以及监测一段时间后的进展情况。

 

Q为我们实现了什么?

那么,Q帮助我们取得了什么成就?现在,我们70%以上的项目源来自于Q:Q既是我们团队的数据探索工具,也主动向团队推送有趣的公司,供其审核。

值得注意的是,Q并没有完全取代其它更传统的渠道:我们深入查看的公司中仍有20-30%来自圈内、业界活动和内部研究等渠道。

最后,我们需要明确的是,Q只是一个辅助工具,绝不是一个决策人。在我们看来,Q是一个帮助发现和观察公司的得力助手,但我们绝不会只根据Q来进行投资,直接来自公司的数据往往更占据主导地位。

对于一个数据驱动的投资者,这意味着我们要对自己的流程不断进行学习和反思,根据我们的实际情况,从最初的审查到最后决定投资的转换率还不到0.5%。

 

Q的下一步是什么?

Q是,并将永远是一项正在进行式的任务。那么,Q的未来会是怎样的呢?当然是更多的数据点,更广泛的公司,更高的使用率。除此之外,我们注意到VC数据平台有两种应用模式:即分析平台和搜索平台。目前,我们自认为在分析方面做得很好,所以现在是时候,可以在搜索方面多做一些尝试!

 

PS:分享一张我们为Q庆生的蛋糕照片

点击阅读英文原文