> 文章列表 > 由麻省理工学院和功能实验室开发的自动化数据科学工具提供了他们的第一个AI产品

由麻省理工学院和功能实验室开发的自动化数据科学工具提供了他们的第一个AI产品

由麻省理工学院和功能实验室开发的自动化数据科学工具提供了他们的第一个AI产品

今天,当企业想要使用机器学习来解决问题时,他们必须召唤骑兵。即使是一个简单的问题,也需要多位数据科学家,机器学习专家和领域专家共同商定优先事项并交换数据和信息。

这个过程通常效率低下,并且需要数月才能获得结果。它也只能解决眼前的问题。下次出现问题时,企业必须重新做同样的事情。

麻省理工学院的一组研究人员想知道,“如果我们尝试了另一种策略会怎么样?如果我们创建自动化工具使主题专家能够使用ML,以便自己解决这些问题呢?”

在过去的五年里,格利扬Veeramachaneni,在麻省理工学院的实验室信息和决策系统的主要研究科学家马克斯·坎特和Ben Schreck的沿谁开始Veeramachaneni担任麻省理工学院的学生,后来共同创办了学习机启动功能实验室,一直为应用机器学习设计严格的范例。

该团队首先将流程划分为一组独立的步骤。例如,一步涉及搜索具有预测能力的埋藏模式,称为“ 特征工程”。另一步称为“模型选择”,其中从许多可用选项中选择最佳建模技术。然后,他们自动执行这些步骤,发布开源工具,帮助领域专家有效地完成它们。

在他们的新论文“机器学习2.0:工程数据驱动的AI产品”中,该团队汇集了这些自动化工具,在七个步骤中将原始数据转换为值得信赖的可部署模型。这一自动化链使主题专家 - 即使是那些没有数据科学经验的专家 - 能够使用机器学习来解决业务问题。

“通过自动化,ML 2.0使主题专家能够将更多时间花在真正需要他们领域专业知识的步骤上,比如决定首先解决哪些问题并评估预测如何影响业务成果,”Schreck说。

去年,埃森哲加入麻省理工学院和特色实验室团队,开展了一个雄心勃勃的项目 - 通过开发和部署机器学习模型来建立人工智能项目经理,该模型可以提前预测关键问题,并增加软件行业经验丰富的人力项目经理。

这是一个测试ML 2.0自动化工具的机会,Featuretools是一个由DARPA的数据驱动模型发现(D3M)计划资助的开源库,用于解决实际问题。

Veeramachaneni和他的同事们与埃森哲的领域专家密切合作,从解决要解决的最佳问题到运行强大的测试手段。团队构建的第一个模型是根据大量交付指标预测软件项目的性能。测试完成后,发现该模型能够正确预测80%以上的项目绩效结果。

使用Featuretools涉及一系列人机交互。在这种情况下,Featuretools首先向领域专家推荐了40,000个功能。接下来,人们利用他们的专业知识将这个列表缩小到100个最有希望的特征,然后他们将这些特征用于训练机器学习算法。

接下来,领域专家使用该软件来模拟使用该模型,并测试它在新的实时数据进入时的效果。该方法还扩展了当代机器学习中典型的“训练 - 测试 - 验证”协议。研究,使其更适用于现实世界的使用。然后部署该模型,每周对数百个项目进行预测。

“我们希望将机器学习(ML)应用于我们在技术服务业务中遇到的关键问题,”埃森哲技术全球技术官员Sanjeev Vohra说。“更具体地说,我们希望自己看看麻省理工学院的ML 2.0是否有助于预测软件交付中的潜在风险。我们对结果非常满意,并将广泛分享它们,以便其他人也能从中受益。”

在另一篇联合论文“人工智能项目经理”中,团队逐步介绍了他们如何使用ML 2.0范例来实现快速准确的预测。

Veeramachaneni说:“20年来,将机器学习应用于问题的任务已被作为一项研究或可行性项目,或者是一次发现的机会。” “使用这些新的自动化工具,现在可以在几周内从原始数据创建机器学习模型并将其投入使用,”Veeramachaneni说。

该团队打算继续珩磨ML 2.0,以使其与尽可能多的行业问题相关。“这是机器学习民主化的真正理念。我们想让ML对广大人民有用,“他补充道。

在接下来的五年中,我们可能会看到ML 2.0的采用率有所增加。“随着这种势头的增强,开发人员将能够像建立数据库一样建立ML设备,”Feature Labs首席执行官Max Kanter说。“就这么简单。”