大数据在硅谷炙手可热,拿融资自然也不再话下,拿到千万级美元融资的也有不少,不久前大数据分析云服务GoodData就获得了Intel Capital领投的2750万美元。据华尔街日报消息,机器学习平台 GraphLab 刚刚改名Dato,并获得了 1850 万美元新融资,投资方为 Vulcan Capital 、Opus Capital 、New Enterprise Associates、Madrona Venture Group。此前他们曾获得680万美元融资。
GraphLab 提供了一个完整的平台,让客户能够使用可扩展的机器学习系统进行大数据分析。简单来说,就是从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。这么讲挺抽象,我们还是具体举几个例子吧。可能最好理解的就是民主国家政府的民意调查,可以通过社交网络、媒体等提取数据,分析出民众到底在关心什么,分析出哪些区域的哪些问题必须关注、解决。其实,生物医学研究团队也会使用 GraphLab,主要是来分析临床记录,从而预测病人的病情发展趋势。零售业可以做价格预测、用户推荐;金融服务业可以做诈骗预警;市场公司则可以通过情绪分析锁定关键客户。现在 GraphLab 的客户已经包括 Zillow、Adobe、Zynga、Pandora 等。
那为什么是 GraphLab(现在应该叫 Dato 了)会获得这么多客户的青睐呢? 其实,将原始数据转化为决策依据,并作出预测,这个过程还是很复杂的。往往需要大量的数据处理工具,收集、清洗数据,再建模分析,得出结论,进行展示;还需要大量的数据科学家或同样知识渊博的软件工程师来配合完成。既耗时费力,还投入不菲。所以 GraphLab 这样的平台,可以让毫无编程经验的数据科学家,快速地将理念转化为生产环境可以使用的产品,提高企业的生产效率,自然受欢迎。值得一提的是,Dato 现在能处理各种数据类型。
GraphLab 的创始人 Carlos Guestrin 是机器学习界国际公认的大牛,曾被 Popular Science 杂志评为 2008 年 “Brilliant 10”,还获得过美国青年科学家总统奖。2008 年在卡耐基梅隆大学带着两个学生研发了 GraphLab 的原型,2012 年被 Jeff Bezos 游说去了华盛顿大学。在 Madrona Ventures 和 NEA 的资金支持下,2014 年 3 月创办了 GraphLab,并以测试版的形式推出了第一个商业版。2013 年 10 月,增加了机器学习功能,推出了新版本。现在的 GraphLab 已经不仅仅是图谱分析了,更是一家基于 AI 的大数据公司,能够处理各种数据类型,所以公司也改名叫 Dato 了。
我司在美帝的妹子小苏曾写过文章,详细的介绍了硅谷的大数据行业发展。在美国现在的大数据公司主要有四类:
数据的拥有者、数据源:特点是业务优势能收集到大量数据,就像煤老板垄断一个地区的矿一样。其实大多数有能力产生或收集数据的公司都属于这类型,比如Vantage Sports和收集了PB级数据的包子铺。
大数据咨询:特点是非常技术,提供从基础设施规划建设维护到软件开发和数据分析等的服务,但不拥有数据,比如Cloudera这家不到500人的startup是最著名的Hadoop架构咨询公司。
做大数据工具的:比如AMPLab出来的Databricks和Yahoo人主导的Hortonworks。
整合应用型:特点是收集拥有或购买一些数据,然后结合AI来解决更多实际的痛点。
像 Dato 这种做整合应用型的大数据公司才有可能有希望。未来是 AI 的,而 AI 的食物是数据。就像很多产业链一样,最困难且最有价值的创新往往发生在接近最终用户的那端,比如 iPhone。大数据行业最有价值的部分在于如何利用机器去处理数据得到洞见,影响组织和个人的行为,从而改变世界。收集和整理数据在未来会变得标准化和自动化,而利用 AI 进行分析的能力会变得更为关键。