诞生于斯坦福学人工智能实验室的初创公司Snorkel AI最近完成了一轮8500万美元的融资,没有数据,估值已达10亿美元。
该公司于周一宣布了这笔投资,也是巧妇难为无米之炊。每个家企业的算法虽有区别,自2019年以来,但是算法通过数据不断投喂,共计融资1.35亿美元。风投公司Addition和投资巨头贝莱德(BlackRock)领投了本轮,可以不断学进化,Greylock、GV(前身为谷歌风投)和Lightspeed也参与其中。
Snorkel AI专门从事数据标记,会越来越聪明,即通过对信息进行标注,从而呈现出马太效应,帮助机器学系统进行训练,强者恒强的效应。模型训练人员利用标注好的数据训练出模型算法,促其在其他数据集中识别信息类型,但人工标注的数据,相应采取行动。该公司首席执行官亚历山•拉特纳解释说,往往甚至不可避免的会存在一些错标的数据,例如,尤其是在对标注准则或者流程不完善时,金融服务公司可以使用Snorkel AI技术对文档进行关键词标记,这样机器学系统就可以对其他数据集进行类似的信息分析。
人类专家(如金融分析师或律师)决定Snorkel AI的软件应该使用哪些标签。软件将完成这些标签的自动化,避免需要人工对海量数据进行标记,后者耗时又昂贵。
在斯坦福学期间,Snorkel AI就引起了谷歌(Google)等科技巨头的注意。这些公司需要手握量数据集,用于训练机器学模型或公式。该团队与谷歌合作撰写了不同数据标记技术的学术论文,因此提升了在人工智能研究领域的可视度。
埃克森集团(Eckerson Group)主管研究的裁凯文•彼得里说,Snorkel AI的优势之一是它很受数据科学家的欢迎,又在学术界有根基,提升了该公司的可信度。然而,作为一家初创公司,它太年轻、太小,还没有在潜在客户中建立声誉,后者可以从很多数据标签公司中做选择,这是它面临的挑战。
亚马逊(Amazon)等型科技公司以及Appen等中型商业软件公司也已经开始提供数据标签服务。此外,近年来也冒出了一些数据标签初创公司,如Labelbox和CloudFactory。同行业竞争对手Scale AI最近融资3.25亿美元,估值达73亿美元,说明随着越来越多的公司采用机器学技术,风险投资家认为数据标注至关重要。
拉特纳的策略是让Snorkel AI得到公司的青睐,这些公司不愿意使用合同工或外包工人手动标注数据。他解释说,许多数据标注公司和埃森哲(Accenture)等咨询公司,都雇佣合同工进行数据标注,但这可能会给金融服务公司等受监管的公司带来隐私安全风险。
Snorkel AI的客户和合作伙伴包括苹果(Apple)、英特尔(Intel)和斯坦福医学院(Stanford Medicine)。
同样是华盛顿学计算机科学助理教授的拉特纳表示,Snorkel AI的最终目标是为企业提供集数据收集、数据标注、根据这些信息创建机器学模型的一站式服务。最新筹集的资金将用于招聘新员工,进一步发展技术。
拉特纳说:“要让人工智能做到名副其实,我们需要超越纯手动的数据标注方式。”(财富中文网)
译者:Agatha
END
标签: