Data-centric 还是 Model-centric?看格物钛等大咖热议MLOps
  • cici
  • 2021年09月03日 10:11
  • 0

人工智能 (AI) 正在吸引越来越多的企业投资。随着机器学习(Machine Learning, ML)技术的发展,MLOps和MLaaS(Machine Learning as a Service)开始产生更广泛的影响,可释放的潜在价值正在出现增长。

[MD:Title]

MLOps不再被狭义地定义为“将DevOps的原理应用于机器学习程序的能力”,因为这样会忽略MLOps对客户的价值。MLOps是机器学习时代的DevOps,它的主要作用就是连接模型构建团队和运维团队,建立起一套标准化的模型开发、部署与运维流程,使得企业组织能更好的利用机器学习的能力来促进业务增长。在MLOps的生命周期里,一些优秀的早期初创公司已经出现,海外如Scale AI、Aquarium,中国如格物钛、深度赋智等。

由耀途资本、全美华人数据科学与工程协会和工友记主办的MLOps & MLaaS-AI与数据科学技术发展及商业价值探讨活动即将来袭,AI新基建领域新秀格物钛受邀与海内外的数据科学家和投资人一起深入交流、探讨赛道热点。

本期AI与数据科学技术发展及商业价值探讨活动主题将围绕MLOps在数据工程部署中的Data-centric VS Model-centric的应用策略,及由此引发的MLOps未来发展趋势展开讨论。格物钛创始人兼CEO崔运凯将作为Data-centric开发理念的代表,与Model-centric开发理念的代表深度赋智创始人兼CEO吴承霖展开一场精彩辩论,共同与来自一线的创业者、VC、数据科学家们对这一千亿美元的技术市场做深度分析。

[MD:Title]

在机器学习领域一直存在Data-centric 和 Model-centric 策略之争。从以模型为中心的角度来看,工程师更加偏爱从模型出发,努力通过特征工程使数据适合其模型。当现有模型无法充分解决问题时,他们将开发足以解决问题的新模型。

从以数据为中心的角度来看,解决方案是调整数据。Data-centric的拥趸们认为模型虽然有用,但只是对数据的直接分析的补充。数据决定了模型的上限,如果数据质量较差,解决方案是找到一种方法来获取更高质量的数据,而不是找到更健壮的模型或更好的特征工程。他们试图了解数据的来源,生成方式以及数据集中可能缺少的内容并构建了复杂的可视化文件以全面了解数据。人工智能和机器学习领域国际最权威学者之一吴恩达,今年3月在MLOps的直播讲座强调数据质量比模型调优更为重要和有效,甚至举办了Data-centric的比赛,为了保证数据质量,吴恩达认为MLOps可以解决这个问题。

格物钛作为一家专注打造人工智能新型基础设施的初创企业,正在以数据为中心的开发方式,帮助AI开发者解决日益增长的非结构化数据难题。借助格物钛非结构化数据平台和公开数据集社区,机器学习团队和个人可进行数据管理、查询、协同、可视化和版本控制等高效操作,降低高质量数据获取、存储和处理成本,加速AI开发和产品创新,释放海量非结构化数据的商业价值。

[MD:Title]

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0