去年来到阿里云开发者大会AWDC时,RemarkMedia正在尝试搭建自己的云环境,但投入了大量的人力物力之后,这个大数据创业公司发现这样的模式太重了。之后,RemarkMedia决定放弃自行搭建基础设施环境,转移至阿里云,用公共云的弹性来支撑其大数据平台。
今年阿里云开发者大会已经升级为云栖大会,RemarkMedia也在这一年中颇有斩获。这家来自美国的数字媒体上市公司,已经在其社交大数据平台上存储和分析了10亿社交用户超过100亿条社交信息。在云栖大会上,RemarkMedia登上主论坛,在计算无国界环节中分享云计算和大数据的融合。
怎么在全社交媒体平台上锁定具体个体的行为、喜好和习惯?RemarkMedia对Twitter、Facebook、微博、QQ、Instagram、Yelp等全球社交网络进行大数据分析,通过某个社交用户过去在各大社交网络上发布的帖子、点赞、朋友圈以及地理位置等信息去了解用户。
你打开RemarkMedia的应用界面,它就能告诉你周围在发生什么热门话题,也可以跳脱现在的地理位置索罗全世界的热图,国际的、国内的、当地的和外地的,让世界的信息传播变得更平。
然而,这些并不是一个应用可以支持的。大数据和云计算的融合是必然的,因为在很多场景下需要云计算的弹性来支持大数据分析。
截止今年8月,RemarkMedia的大数据分析平台已经分析了10亿社交用户,超过100亿条社交信息。这些信息绝大部分是图片,机器对图片进行分类,准确率达到90%以上。此外,机器还能对图片中的商标、周边配饰进行分析。例如,一杯星巴克旁边是否放了蓝莓蛋糕,这可以帮助商家了解用户的消费习惯。
大量的数据存储和分析都发生在阿里云上,数据想象力的基础是公共云的弹性、安全、稳定和高性能。目前,RemarkMedia的社交大数据后台和应用服务全部搭建在阿里云上,阿里云遍布全球的数据中心也为RemarkMedia分析处理全球社交网络数据提供了便利。
同时,阿里云在云栖大会上正式发布的新产品DT PAI也成为大数据创业公司的热门话题。这款产品是国内首个可视化机器学习平台,开发者可以通过简单拖拽的方式即可完成对海量数据的分析挖掘,以及对用户行为、行业走势等预测。
“我们很关注阿里云逐步开放的自然语言、图像处理、机器学习、人工智能相关通用算法或服务。”RemarkMedia负责人表示,在阿里云平台上公司业务发展很快,也期待阿里内部使用的云计算大数据技术的进一步开放,“这些技术开放将会极大得提升国内大数据应用水平。”