重磅!全球首款企业级AI操作系统发布,打造AI时代的Windows! 信创中国运营-张杰 • 2020年8月22日 pm5:07 • 信创中国观察, 技术培训学习 8月20日,第四范式召开以“万悟赋能商业生花”为主题的产品发布会,重磅推出了全球首款企业级AI操作系统——SageAIOS。此外,还陆续发布了自动化AI开发平台SageHyperCycle ML、软硬一体算力平台 SageOne等产品。这些产品覆盖了从算力、操作系统、生产平台到业务系统的全套AI产品,从而帮助企业快速实现智能数字化转型。 第四范式创始人兼CEO戴文渊表示,第四范式一直致力于AI使用场景落地的最前线,在摸爬滚打中,总结出数据治理难、科学家稀缺、业务价值不佳以及算力成本负担重,是企业AI转型中四个最常见的阻力。这些问题归根结底是因为缺少基于规范和标准的基础设施,所以,今天第四范式设计和构建了更标准化的AI产品。 01. 为企业量身定制的AI操作系统,打造AI时代的Windows 微软旗下的Windows在PC时代的地位无人可以撼动,在其通用强大的平台上,运行着各种各样的应用软件,如office、Photoshop、AfterEffects等。 Sage AIOS作为人工智能的标准化管理平台,同样封装了各类AI应用,包括给AI科学家和开发者使用的工具类应用,以及针对某个场景一键上线的业务类应用。 简单来说,Sage AIOS可以理解为一个AI版的Windows,AIOS封装的各种App就像Windows桌面上的各种应用软件,其中App可以分为两大类:一类是业务应用,直接提供某个场景的解决方案;另外一类是工具类应用,为数据科学家和开发者用来构建AI应用。 AIOS最为重要的设计是数据治理。第四范式在帮助企业实现AI场景落地的过程中发现,数据治理甚至占据高达95%的时间,即便花费了这么多的时间,数据质量问题仍然困扰着AI业务效果的提升,效率和效果成为企业数据治理的两大难题。 第四范式Sage AIOS平台对于“数据形式”的定义是创新性的。具体而言,AIOS平台上规定了数据的准备和使用方式,其中包括不同业务场景中的模型需要什么样的数据,对应的数据需要从什么IT系统上去调取,以及如何将这些数据处理为AI ready的数据。 针对不同场景AI数据形式不同的问题,Sage AIOS浓缩了第四范式在多个业务场景下数据治理的经验。 在AIOS平台上,企业想要构建某个AI应用场景,如审核、反欺诈、智能推送等,只需一键进入相应场景的数据形式、便可直接开始构建AI应用程序。 为了帮助企业有效的利用资源调度与管理,Sage AIOS采用HyperScheduler动态地对各个任务进行合理的资源分配,有效管理调度CPU、GPU、加速卡等各类异构设备资源,从而避免AI应用资源分配不均导致的任务响应慢、宕机等问题,将资源利用率提升50%,AI全流程耗时节约三分之二时间,从而实现AI技术人人可用。 02. 自动化AI构建平台HyperCycle ML,人人都可以开发AI应用 据调查数据显示,目前,每年新增100万个AI应用场景,而AI科学家却只增加1000名,这便导致了严重的供需不足,从而使得AI场景落地更加困难。 AI人才培养需要花费大量的时间和金钱,为了帮助企业尽快规模化应用AI,第四范式在AIOS平台上专为业务人员等非AI专业人士,准备了自动化AI开发工具“HyperCycle ML”。 基于第四范式AutoML技术和独创的“库伯学习圈”方法论,HyperCycle ML将AI过程简化为“行为、反馈、学习、应用”四步,自动完成从数据引入、数据定义、特征处理、模型训练、模型应用和自学习的AI全流程,操作简便易用,让用户像使用自动相机拍照一样建立AI应用。 HyperCycleML把AI繁琐重复和高难度的数百个模块工作全部交给机器,建模时间由原来的400小时缩短到10小时,自动化模型的精准度目前可以达到Top10%AI科学家的水准。 此外,HyperCycle ML是一个线上闭环,会自动收集线上的行为和反馈数据进行自学习,确保稳定、持续迭代的模型效果。 03. 软硬一体算力平台SageOne 很多AI供应商都提供软硬一体的优化方案。可是,很多企业的软件框架就是把开源的代码改一改;有的甚至连修改能力都没有。这主要是因为AI应用场景众多,特点各异,实现应用落地的开源软件无论功能还是性能,尤其在大规模方面与实际需求有较大的距离。 据Gartner预测,2022年平均每个企业在AI算力上的支出将是18年的4倍,总体市场支出将超过50亿美元。在算力高昂成本的背后,实际上是算力的巨大浪费——企业数据中心对AI负载进行针对性优化,算力平均使用率依然达不到60%。 第四范式的SageOne是为AI量身定做的软件定义算力平台,面向整个AI生命周期全局优化。 AI应用的不同步骤,对计算资源、存储网络有差异化的要求,第四范式深入了解每一个环节负载需求,将计算、存储、网路、调度全方面考虑,有针对性地进行优化,真正解决AI算力浪费的问题。 通过自动资源推测、容器动态调度等方式,让用户不感知资源细节;通过资源共享、虚拟化等方式,让集群算力利用率最大化。” GDBT、HS和实时内存数据库(RTiDB)在 AI 全生命周期中扮演着核心引擎的角色,其所支撑的能力,不管是面向行为数据与反馈数据的自动数据处理、自动特征组合,还是面向模型训练的算法自动探索、超参自动调节,这些工作,都在算力消耗中占到了极大比例。底层框架任何一个微小的技术实现,给全生命周期带来的影响都会成倍放大。 所以,越是底层的能力,越需要极致、入微的优化。第四范式的SageOne提供了软硬一体的解决方案:PWS任务调度系统,定制X86机器学习芯片,自研机器学习专用加速卡,数据压缩算法,FPGA异构加速芯片计算力调度。 在2019年的产品发布会上公布的数据显示,相比普通服务器,SageOne 软硬一体解决方案可实现高维模型构建过程的6-12倍加速,TCO 降低到1/2到1/3。在某连锁餐饮企业实际应用场景中,SageOne以一顶十,以8台替换了88台通用服务器集群。 04. 越来越多的企业开始注重技术自主可控 随着中美贸易战的升级,特朗普政府开始将制裁范围扩展至科技领域,华为、中兴等事件为中国企业敲响了警钟,只有技术自主可控才能不会受制于人。因此,越来越多的中国企业在选择技术时更偏向于国内供应商。 目前,第四范式的产品应用在金融行业保持着高速增长率,零售行业在线化业务突飞猛进,制造、民航、能源、政府等传统行业呈现快速增长趋势。 在过去5年多时间,第四范式帮助超过8000家合作伙伴实现智能化转型,与他们一起探索商业模式进化与重构,蝉联2018-2019年IDC中国机器学习平台市场份额第一,这背后是机器学习平台从底层能力走向业务端的突破,也验证了AI通用平台产品的可行性。 今年,在线化、数据增长的外部环境与第四范式AI规模化的内部战略一拍即合,给予第四范式在更多的行业和场景中利用机器发现规律,构建极致个人体验、提升经营决策价值的历史性机遇。 原创文章,作者:信创中国运营-张杰,如若转载,请注明出处:http://www.xc-cn.cn/1375.html 发表评论 取消回复请登录后评论...登录后才能评论