AutoML 2.0:数据科学家过时了吗?

发布时间:2020-04-09

在过去的几年中,AutoML快速增长。而现在,经济衰退是不可避免的,人工智能(AI)和自动化也将越来越有吸引力的机器学习发展的理念。现在业界推出了多款新平台(https://dotdata.com)有更多的自动化功能。 AI现在可以推动项目(功能工程)的所谓元素,允许用户自动发现和创造的科学数据处理功能。这种方法开辟了一个新的数据科学的方法似乎是数据科学家的角色构成威胁。


那么,数据科学家研究需要我们关注学生这些经济发展吗?数据科学家在自动化生产过程中的作用是什么呢?鉴于这种新发现的自动化控制技术,企业又将如何进行发展呢?



常规数据科学过程(图表;点数据公司)


AutoML 2.0将给予更多的科学数据的自动化


第一代AutoML平台的重点研究主要问题放在自动化系统数据信息科学发展过程中的机器可以学习以及部分。但在中国传统的数据管理科学社会工作业务流程里,最冗长和最具挑战性的部分学生则是被称之为是要素工程的部分,要素工程是高度手动的一步,主要内容涉及到连接数据源及构建宽大的“要素表”,需包含丰富多样的“要素”。与此同时,这些要素还需要针对多种机器通过学习算法模型进行风险评估。


目前,要素工程面临的挑战是,只有在该领域拥有更高水平的专门知识的情况下,才能“酝酿”新的要素,评估、拒绝或选择要素时,需要重复这一过程。 但最近,该行业出现了新的平台,以提供额外的功能和自动化,以应对这一挑战。 现在,一些具有“自动因子工程”功能的平台可以自动创建来自关系数据源和非结构化文件的元素列表。 这种在数据科学过程中“自动生成”元素的方法可以说是一种改变游戏的功能。


然后,突然之间,“公民”数据科学家开始成为组织发展和AI模式ML有价值的贡献者。在一般情况下,“公民科学家数据”指的是商业智能(BI)分析,数据工程师和其他组织有该领域的渊博的知识,技术娴熟的成员。通过机器学习的方法,BI项目团队使用的自动化组件可以开发在几天内复杂的预测分析算法,没有数据可以帮助科学家们极大地提高工作效率。


自动化系统数据进行科学:平民化


汽车ML2.0平台的主要优点之一是可以用于实际的数据科普。


数据科学自动化可以加快创建元素和功能,以及自动,这样一来,能够有助于科学数据的过程中多个用户组的发现过程。自动化元素创建,使“公民”数据科学家可以创造非常有用的,高度优化的使用情况。数据科学家和公民普遍具有高度的“专业领域知识”,所以他们不需要帮助的基础数据科学团队将重点放在使用情况可高价值的组织。


开启中国公民进行数据科学家的另一个好处在于,企业无需担心招不到数据科学家而一样都是可以通过开拓市场数据信息科学的使用。2018年 LinkedIn的一项技术研究结果表明,美国的组织在雇用数据科学家方面没有遇到一些困难。鉴于此,能够充分发掘新的数据环境科学贡献者就显得尤为重要。


在全球经济面临许多不确定性的时候,在这种情况下以最少的投资挖掘几类AI/ML开发人员的能力必然是改变游戏规则的一个价值主张,这对于保持或增加竞争优势是很重要的..


自动数据科学:生产力,而不是替代


但任何AutoML 2.0平台企业如果将定位的重点发展放在替换或更替数据科学家上就大错特错了。大多数研究数据科学家都将要素工程技术视为工作中的最大障碍问题之一。自动化控制可以通过帮助学生加快生产要素工程的流程,靠的就是中国自动化可以提高提供一些令人难以置信的生产率提升,这种能力提升若无自动化是不可能实现的。


对于数据的科学家,利用AutoML 2.0通常可以大大加快他们的工作,缩短工作时间从几天到数月。此外,科学家们利用上AutoML 2.0平台的数据是基于工程AI的元素也可能会发现,他们从来没有考虑的要素。建筑元件自动工作基于人工智能,评价和开口元件,并且可以基于从多个列(通常在不同的表和源)的数据进行结合。


此外,AutoML 2.0还具有自我发现的元素,数据科学家利用这个功能可以探索所谓的“未知的未知”,这个“未知的未知”是属于那些数据科学家缺乏时间或专业知识的缺乏场,从来没有过的元素考虑。


AutoML 2.0:创建更高效、更具文化包容性的AI / ML程序


因此,AutoML2.0平台并不威胁数据科学家的生计,而是有助于加速数据科学的进程,使其成为民用.. 同时,AutoML2.0还为数据科学家提供了必要的加速和自动化手段,以提高生产力,使数据科学家能够扩大他们的工作,并提供更大的商业效益。 汽车ML2.0平台具有促进数据科学普及和加速数据科学进程的双重优势,也是其最重要的卖点。 这种双重优势是现代组织中数据科学过程规模扩大的关键..


中安威士:保护核心数据,捍卫网络安全


来源:网络收集


上一条:新基建带来新机遇!大数据产业发展需“四驱”推动 下一条:大数据在企业中的4个主要竞争优势