您的位置 首页 新闻

独家披露:VC数千万抢投1位北大学霸 让数据标注比PS简单 效率升10倍

记者 | 古典典在AI行业有句行话:“有多少智能,就有多少人工。”在贵州的农村或山西的产业园,成千上万人的工作是做AI的“老师”。他们被称作“数据标注员”,日常工作是给车道线打点,或是给人脸拉框,将各式各样的生活场景数据“投喂”给AI。2019年,中国数据标注产业的规模达到了30.9亿元,但在外界的印象里,这依然是一个劳动密集型产业。

独家披露:VC数千万抢投1位北大学霸 让数据标注比PS简单 效率升10倍

记者 | 古典典

在AI行业有句行话:“有多少智能,就有多少人工。”

在贵州的农村或山西的产业园,成千上万人的工作是做AI的“老师”。他们被称作“数据标注员”,日常工作是给车道线打点,或是给人脸拉框,将各式各样的生活场景数据“投喂”给AI。2019年,中国数据标注产业的规模达到了30.9亿元,但在外界的印象里,这依然是一个劳动密集型产业。

“数据好比是AI行业发展运行的石油,现在的问题是石油的供应不稳定。AI的成本需要降下来,这样AI应用才能在各个行业落地。”2018年,此前在网易工作的赵剑与此前在阿里工作的章越加入了AI创业的行列,从最上游的AI数据入手,创办了曼孚科技。

曼孚科技主打的产品是数据服务SaaS平台“SEED”,可以将企业标注成本降低30%,部分场景的标注效率达到原来的近10倍;此外,公司研发的AI数据中台系统,可以与AI训练平台无缝对接,提升AI算法迭代的效率。

目前,SEED平台可以处理计算机视觉、语音交互、自然语言处理等领域的数据,服务的客户涵盖阿里巴巴、百度、字节跳动、网易等科技企业,以及高校和传统制造企业等。曼孚科技已于近日完成了数千万元的天使轮融资,本轮融资由立元创投领投,老股东伽利略资本持续加码,春泥资本担任独家财务顾问。

在AI行业有句行话:“有多少智能,就有多少人工。”

在贵州的农村或山西的产业园,成千上万人的工作是做AI的“老师”。他们被称作“数据标注员”,日常工作是给车道线打点,或是给人脸拉框,将各式各样的生活场景数据“投喂”给AI。2019年,中国数据标注产业的规模达到了30.9亿元,但在外界的印象里,这依然是一个劳动密集型产业。

“数据好比是AI行业发展运行的石油,现在的问题是石油的供应不稳定。AI的成本需要降下来,这样AI应用才能在各个行业落地。”2018年,此前在网易工作的赵剑与此前在阿里工作的章越加入了AI创业的行列,从最上游的AI数据入手,创办了曼孚科技。

曼孚科技主打的产品是数据服务SaaS平台“SEED”,可以将企业标注成本降低30%,部分场景的标注效率达到原来的近10倍;此外,公司研发的AI数据中台系统,可以与AI训练平台无缝对接,提升AI算法迭代的效率。

展开全文

目前,SEED平台可以处理计算机视觉、语音交互、自然语言处理等领域的数据,服务的客户涵盖阿里巴巴、百度、字节跳动、网易等科技企业,以及高校和传统制造企业等。曼孚科技已于近日完成了数千万元的天使轮融资,本轮融资由立元创投领投,老股东伽利略资本持续加码,春泥资本担任独家财务顾问。

注:赵剑承诺文中数据无误,为内容真实性负责。铅笔道作客观真实记录,已备份速记录音。

改变AI的上游

改变AI的上游

曼孚创始人赵剑对创业有一种执念。在北大读书时,他已经有了两次创业经历:做了外国留学生交友平台“Laowai In Beijing”和托福口语点评软件“众余toeking”。2015年毕业后,他进入网易从事市场营销的工作,但一直没有放下创业的梦想。

2018年,他终于等到了机会。那时,创投圈热烈地讨论着5G、区块链和AI,技术创业者纷纷入局。赵剑按捺不住,找到了在阿里做架构师的高中好友章越,同怀创业梦想的两个人坐下来开始选赛道。

做5G,两个人都没有硬件背景;做区块链,两个人觉得技术创新的空间有限;最后,他们选择了AI。AI行业有三大板块——算力、算法和数据,赵剑和章越最终放弃了需要大量烧钱的算力和算法,选择进入尚处于初期发展阶段的AI数据行业。

他们发现,AI的进步,尤其是有监督学习算法的进步,需要学习大量的标注数据,因此催生了数据标注行业。在不少人工智能产业园,这样的场景数见不鲜:几百个数据标注员坐在一排排屏幕前,给车道线打点,或是给人脸拉框,把复杂的生活场景数据源源不断地“投喂”给AI。行业内流行这么一句话:有多少智能,就有多少人工。作为行业上游,数据标注常常给人“人工智能富士康”的刻板印象。

依赖密集劳动力的数据标注,成品往往差强人意。“很多企业培训数据标注员就是放个视频,新人可能没真正学会就上岗了,导致的结果就是交付的时候良品率低。”除此之外,曼孚科技创始团队还发现,甲方的项目需求往往不是持续的,数据标注团队常常会有空档期,这一期间企业就要负担不菲的人力成本。

基于AI数据行业以上的种种问题,曼孚创始团队明确了在AI领域的创业方向,即通过开发一套完整的数据标注SaaS系统,改良人力密集型的AI数据标注行业,但是资本市场的表现与预想中的有些不同。

“AI数据服务行业处于发展的初期,资本市场对这个领域的研究并不深入,另外,由于SaaS系统的开发周期较长,导致投资回报周期比较长,国内资本市场对该行业处于持续观望的状态。”

虽然国内市场尚未意识到SaaS平台的价值,但在大洋另一端的美国,数据标注公司Scale于2019年融资1亿美元,跻身独角兽;数据标注巨头Appen花3亿美元收购了竞争对手Figure Eight,此外还有数十家同行获得了数千万美元的融资。赵剑认为,科技公司对AI标注数据集的要求越来越精细,场景越来越垂直,需求量越来越大,SaaS数据处理平台的重要性会凸显出来。

在创业的早期,曼孚创始团队见了十几位投资人,一次次地去复述自己的项目构想,终于遇到了伯乐——伽利略资本。当时赵剑对伽利略的创始合伙人说了一句“数据决定AI,AI改变世界“,让对方印象深刻。“ 当时我们的产品解决方案主要是用于无人驾驶的,我们认为无人驾驶是未来AI的核心应用领域,这和伽利略资本的判断是一致的。”

拿到了数百万元种子轮融资后,赵剑在2018年开始补强团队,来自google的产品合伙人蒋筱萌在这个阶段加入公司。

可以做项目管理的SaaS

可以做项目管理的SaaS

公司成立后,曼孚科技创始团队先做了一个多月的市场调研。和科技公司的算法团队聊了一圈后,他们发现甲方不仅需要标注效率工具,也需要更好的项目管理工具。根据客户的需求,曼孚科技创始团队开始研发公司的核心SaaS产品——SEED数据处理平台。

独家披露:VC数千万抢投1位北大学霸 让数据标注比PS简单 效率升10倍

SEED平台

2019年10月,SEED平台上线。它借鉴了PS的部分功能,但在交互体验上更友好,标注员更容易上手。标注员在使用SEED后,在部分场景下,单人标注效率可以提升近10倍。

SEED在项目管理上也更进一步。“乙方标注的过程对于甲方就是个黑盒子。他给你承诺一个月标完,但最后可能拖了两三个月才能交付。”为了改善拖延现象,团队在SEED中设置了可视化的管理与协同模块,并给参与项目的人员分出账号权限。

在提升效率的同时,SEED平台还能为企业用户降低90%的管理成本。

“ 国内无人机头部企业在看过我们的产品后,直接撤了自己的数据标注团队。他们觉得我们的项目管理做得很细,用我们的产品成本能降下来。”赵剑对自己的产品信心十足。

最开始,曼孚科技创始团队通过BPO的形式找到了第一批科技公司客户,包括阿里巴巴、百度、字节跳动、网易等。随着SEED的口碑逐渐树立,其他行业的客户也找到了曼孚科技,包括传统车企、高校等等。

随着客户的增多,客户需求也越来越多元。高校和研究院的经费不如科技公司充足,更倾向于把SaaS产品买下来,让学生去标注;一些AI科技公司对数据安全很敏感,会要求自己架设服务器。对于有数据安全要求的客户,曼孚科技可以提供SaaS平台的私有化部署,或者混合云的解决方案。

苏宁金融研究院指出,未来5-10年内,人工标注仍将是AI数据标注的主流,占比超过75%。人工标注的成本与规模很可能成为限制AI技术发展的关键因素。曼孚创始团队表示,“AI的成本需要降下来,才会有更多行业去做AI。我们做SaaS就是为了把数据这一块的成本降下来。”

目前,SEED平台可以处理计算机视觉、语音交互、自然语言处理等领域的数据,平台通过任务建立、执行标注、数据质检等环节搭建起了一套项目管理体系。SEED平台正在完善语音场景,目标是成为覆盖全场景的AI数据中台。

现如今,在自动驾驶领域,SEED平台在3D点云处理技术上已经积累了一定的业内知名度。曼孚科技的下一个目标是成为自动驾驶领域的头部服务商,并在未来两年拓展海外业务。

“美国同行的价格是我们的1.5-2倍,我们有很大的成本优势。”赵剑透露,国外科技巨头在开展中国业务时会带来很大的数据标注需求。“特斯拉的无人驾驶要在中国做本地化的适配,就需要对中国的路况数据做标注处理。”

与种子轮融资时的艰难状况相比,得到了用户认可的曼孚科技,在资本市场上也见到了曙光。近日,曼孚科技完成了数千万元的天使轮融资,本轮融资由立元创投领投,老股东伽利略资本持续加码,春泥资本担任独家财务顾问。

本文来自网络,不代表聚合资讯立场,转载请注明出处:http://vivalille.com/4709.html

作者: admin

为您推荐

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部