【IT168 资讯】本文中所做的预测是通过“机器学习在企业中”的这个视角分享的。因此,可能涉及机器学习研究中令人兴奋的世界的曲折和变化比较少,这里更关心的是当期望利用技术达到其季度、年度或更长期的战略业务目标时,典型的企业的相关经验。
因此,让我们首先根据最近关于行业现状的市场研究结果来设定基调。这是一个众所周知的事实,科技巨头已经把他们的美元大举投入获取机器学习、AI的人才上。事实上,麦肯锡全球研究院(MGI)估计,2016年投入的390亿美元中,高达270亿美元的资金来自顶尖35家高科技和先进制造企业的研发和并购投资,这些投资来自风投或私募股权公司,他们对ML研究的集体影响是不可否认的:Google / DeepMind / Brain(210),Carnegie Mellon(108),麻省理工学院(93),斯坦福大学(81),伯克利大学(Berkeley) 81)和微软(70)。
MGI的报告还显示,风险投资、私募股权和并购活动中的大部分已经投向核心机器学习技术(70亿美元),其中计算机视觉(35亿美元)遥遥领先,其他小众AI领域如自然语言(0.9亿美元)、自动驾驶汽车(0.5亿美元)、智能机器人(0.5亿美元)和虚拟代理(0.2亿美元)等。
有了这样的投资水平,可以说未来机器学习融入经济的希望是很高的。但是,这里仍然有比较糟糕的地方:如,采用率仍然远低于潜力。 MGI报告:
“科技领域之外的人工智能采用还处于早期,往往是实验阶段,很少有企业大规模部署。在对全球10个国家和14个行业的3000名具有人工智能意识的C级管理人员的调查中,只有20%的人表示他们目前使用任何与人工智能有关的技术,或者是其业务的核心部分。许多公司表示,他们不确定商业案例或投资回报如何。对160多例使用案例的审查显示,人工智能在商业上的部署仅占12%。”
更为复杂的是,行业间的采用率非常不平衡,在软件/互联网、电信、金融科技等大型企业中出现了偏差。该研究还发现积极的人工智能采用者在公司和其他人之间的利润差异很大。这很可能很好的指出了没有因果关系的相关性,但经济学人智库的另一项调查已经发现,大多数具有战略头脑的管理人员不愿意等待,并冒着被更敏捷的新事物所吸引的风险。
在这个复杂的背景下,这里是对于2018年的预测的前10名的汇总。有些是为了实际目的,延续相关2017年预测,剩下的则全是关于AI的最新的预测:
预测#1
更多的企业机器学习涉足者将成熟为真正的“信徒”
2018年,ML(“机器学习”)成熟度将成为成千上万涉足有限的试点项目的公司的主题。根据麦肯锡的调查,超过一半的投资AI / ML的企业还没有看到他们的投资带来的回报。随着对技术的惊叹让位于消化利弊的更客观的观点,企业领导者将与技术对手更加密切地合作,以加倍现有的努力。
ML并不一定是“即插即用”的,大多数从业者都是通过第一手的经验来学习的,但在实体经济中,许多高管仍然不知道。尤其是,类型化的举措几乎总是比预期要花费更长的时间。无论企业高管是否耐心看到这些项目的实际回报,这都是人们猜测的结果。与此同时,针对更多更具体的方面的努力将会蓬勃发展。
预测#2
数据交换项目带来数据湖,以支持特征库
有经验的ML从业者都知道,ML / AI计划失败的很大一部分原因与昂贵的数据湖有关,首席信息官和首席数据官员将取而代之,加速数据工程的工作,创建特色工程知识库以支持高价值预测用例。一些公司甚至会进一步通过授权或外包给特定于领域的第三方功能存储库公司来加强内部工作。易于使用的共享特性库将会是非常成功的故事,因为它们不再需要重新创建每个定制应用程序的轮子,而是促进跨部门协作。在优异ML平台的基础上,提供更成熟的自助服务数据争用功能,并在组织中更广泛的分析受众将有权探索更新的使用案例。这种情况仍然意味着需要额外的投资,但是这样做足够经济,可以产生经过深思熟虑的机器学习,从而最终证明支出是合理的。
预测#3
机器学习人才需求的高峰将通过重新培训员工来平衡
近年来,各个企业都在花重金找寻各个领域的专家和人才。在许多情况下,这意味着深度学习专家,即机器人应用的强化学习会像深度学习一样吸引人,但使用起来还是很困难,在这方面的专家也很少。
因此,到2018年,大多数首席信息官和首席数据官都会考虑对现有员工重新进行技能培训,以达到更广泛的跨“文化”扫盲。数据科学家将难以证明复杂模型的合理性,因为易于使用的核心ML平台会以更少的努力提供更高质量的基线。数据科学家不会消失,但可能不会成为2018年年底最“性感”的工作。
预测#4
黑匣子机器学习方法将会使负担过度、产生不足
尽管进一步采用机器学习,人类将仍然是决策制定的核心。《Fortune》全球2000强技术专家不需要昂贵的咨询顾问,也不会引进顶尖的学术人才,而是通过详细了解其行业的商业环境和价值链动态来代替专业知识。机器学习的简单经济学指出,作为接近于零的预测值,人类判断的价值才会带来更多的需求。
通过限制专家可以干预ML过程的方法,通过尝试将每个问题都纳入基本分类或使用超参数调整的回归建模方法,从而实现完全的自动化端到端ML。有影响力的机器学习并不是将一堆相似的算法与基于普通的性能指标的算法相比较,但是一些公司会发现这是一种比较困难的方法。
预测#5
MLaaS平台将成为传统企业的“AI骨干”
MLaaS Uptake MLaaS平台的采用将加速从大型公司内部的“真正的私有云”和中型企业和初创公司的多租户公共云环境中。这些平台与昂贵的咨询和定制应用程序相结合的合理的成本结构与合适的抽象级别,将为开发人员和ML工程师提供良好的平台大规模设计和部署点应用,速度更快。云机器学习平台,将通过以下方式实现机器学习的民主化:
·通过消除复杂性或前置供应商合同显著降低成本。
·提供预配置的框架,打包最有效的算法。
·从最终用户中抽象出基础设施设置和管理的复杂性。
·通过REST API和绑定提供轻松集成、工作流自动化和部署选项。
预测#6
更多的开发人员将把机器学习引入他们的公司
开发人员将拥有丰富的工具来利用这些有用的基准,但却没有什么有意义的基准,这将造成一些混乱和互操作性问题,从而导致与ML专家的紧张关系(如果在组织中可用的话)。在这个论点中没有赢家,因为所需要的学习过程仍在继续。随着尘埃落定,机器学习和软件工程非常好的实践将开始融合在一起以避免技术债务,并导致更精确的设计和可预测的最终用户体验。
随着越来越多的针对垂直解决方案优化的专用工具包和SDK(即IoT满足ML,如异常检测和强化学习),这一趋势将进一步加速,这将使开发人员更接近一个端到端的智能应用程序。
预测#7
抛开一切,开源的方式,MLaaS可能会产生技术债务
过多的ML库可能的ML技术的数量加上商业ML管道的变化和长度一起带来了算法的可能组合的指数数量。即使拥有巨大的计算能力(即数以千计的服务器),人们也只能尝试使其中的一小部分工作。事实是,计算能力永远不会真正取代通过算法或专家在搜索这个空间的可能性。将许多完全不同的开源库和编码范式打包成一个松散集成的“机器学习套件”,由主要的云服务提供商推广,肯定会引起一些数据科学家的兴趣。在这些“复选框”中,他们会感到宾至如归,因为这是他们熟悉的本地工件。不幸的是,由于其固有的复杂性,这种短视立场将无法迎来真正的协作和包容性企业机器学习的时代。
预测#8
机器学习模式的“解释性”是新的“表演”
机器学习社区中的一些人将可解释性视为一种不错的尝试,以最大化与模型准确度相关的其他指标。然而,这种观点在业务环境中代表着严重的风险,因为可解释性是最好的调试工具。如果我们盲目地信任我们构建的黑盒子,算法偏差就会轻易蔓延。例如,最近有关亚马逊在美国当天的服务的新闻报道显示,即使看起来匿名的数据,也可以通过代理变量产生包含(在这种情况下是种族)偏差的预测。
2018年,随着欧盟的GDPR(欧洲通用数据保护条例)于2018年5月25日生效,我们预计更多的这些问题将成为头条新闻。GDPR预计将对当前的“数据科学”实践产生重大影响、严格的要求,包括解释权(即你的深度学习模式能否解释为什么这个客户被拒绝信用?)以及预防偏见和歧视。这只意味着模型透明度将变得越来越重要,无论是对于用户的维护,还是出于法律/伦理的原因。
预测#9
深度学习的研究将会持续推进,但由于成本和人才的缺乏,企业的大规模采用将会滞后
根据你使用的数据类型以及特定的预测用例,Deepnet可能是唯一的游戏,也可能是不必要的昂贵的环形交叉。在BigML,我们认为Deepnet模型应该是机器学习库的一部分,因此在平台上支持它。尽管如此,在2018年,DL研究的过多的宣传可能会使企业早期使用者受到伤害,将其注意力从更有效和更具成本效益的基准模型转移,并使他们将资源投入专用硬件和复杂和未经证实的神经网络结构难以实施,即使获得罕见的DL专家的保障,这些架构也很难操作且难以维护。
预测#10
机器学习将走向全球,但更多的人才将选择留在本地
美国,加拿大,澳大利亚,中国等国家都有显著的机器学习印记,这并不是什么秘密。但是我们预测,更多元化的集团的机器学习技术和服务提供商长时间盖过了硅谷等大型科技股神经中心,纽约、波士顿和中国特大城市将“加热”对IBM和埃森哲的全球竞争,并采用更简单的方法使其在各自的区域提供ROI更快。反过来,这将提高全球机器学习的觉醒,为亚洲、欧洲和拉丁美洲的所有类型的组织提供帮助。由此产生的影响将是减缓和部分地将人才流失的趋势转化为技术神经中枢的能力,这些神经中枢正承受着他们自己的负担能力危机。