关于人工智慧的七大误区和真相!走进Google AIY專案!

2018/08/15 16:56:28 網誌分類: 科技
15 Aug

我们必须消除主流媒体宣传的AI神话。只有消除这些误解,你才能对怎样应用AI到你的业务中有一个框架。

undefined

神话1:AI是魔术

AI是数据、数学、模型以及迭代。要想让AI为企业接受,我们需要更加透明,以下是3个有关AI的关键概念的解释:

训练数据(TD):训练数据是机器学习的初始数据集。训练数据包括输入和预回答输出,所以机器学习模型能够为任何给定输出寻找模式。例如,输入可以是带有客户和企业支持代表(CSR)间的电子邮件线程的客户支持ticket,输出可以是基于企业特定分类定义的从1到5的分类标签。

机器学习(ML):机器学习是能从训练数据中学习模式,并让这些模式应用于新的输入数据的软件。例如,接收到带有客户和CSR间的电子邮件线程的一个新的客户支持ticket时,机器学习模型能预测它的分类,并告诉你它对这个预测的置信度。机器学习的主要特点是它学习新的、而非适用固有的规则。因此,它能通过消化新的数据调整自己的规则。

Human-in-the-Loop(HITL):Human-in-the-Loop是AI的第三个核心要素。我们不能指望机器学习模型绝对可靠。一个好的机器学习模型可能只有70%的准确率。因此,当模型的置信度较低时,就需要人使用Human-in-the-Loop作业流程。

神话2:AI只为技术精英专属

媒体报道很容易让人产生一种错觉,就是AI只属于技术精英——大公司例如Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它们能够组建大型机器学习专家团队,并获得亿美元级的投资。这种观念是错的。

今天,不用10万美元就能着手应用AI到你的业务中。所以,如果你是美国收益大于5000万美元的26000家企业之一,你就可以把收益的0.2%投资于AI应用了。所以,AI不是技术精英专属。它属于每个企业。

神话3:AI只为解决十亿美元级别的问题

主流媒体的倾向于报道未来主义的事物,例如自动驾驶汽车或用于运送快递的无人飞机。像Google,Tesla,Uber这些公司由于“赢者通吃”的心态,为了抢占未来无人车市场的龙头老大地位,已经投资进去数百亿美元。这些给人的印象是AI只用于解决十亿美元级别的新问题。但这又是一个错误。

undefined

许多企业坐拥来自客户的非结构化数据宝藏,这些数据来自电子邮件线程或Twitter评论。AI能应用于这些分类支持ticket的挑战,或用于理解推文情绪。

所以,AI不仅能应用于十亿美元级别的令人兴奋的新问题,例如自动驾驶汽车。AI也用于现存的“无趣”的小问题,例如通过支持ticket分类或社交媒体情绪分析更好地理解客户。

神话4:算法比数据更重要

主流媒体中有关AI的报道倾向于认为机器学习算法是最重要的要素。它们似乎把算法等同于人类大脑。它们暗示正是算法让魔术发生作用,更精细复杂的算法能超越人类大脑。有关机器在国际围棋和象棋中战胜人类的报道就是例子。媒体关注的是“深度神经网络”、“深度学习”以及机器如何做决定。

这样的报道可能带给企业这样的印象:想要应用AI,他们得先聘请到机器学习专家来建一个完美的算法。但假如企业不考虑怎样获得更高质量、更大量的定制训练数据以让机器学习模型学习,就算有了完美的算法也可能得不到理想的效果(“我们有超棒的算法”和“我们的模型只有60%的准确率”间的落差)。

从Microsoft,Amazon和Google这些公司购买商用机器学习服务,却没有一个训练数据规划或预算,就好比买了一辆汽车,却没法到达加油站。你只是买了一大块很贵的金属而已。汽车和汽油的类比虽然不够恰当,因为如果你给机器学习模型补给越多的训练数据,模型就能变得越好。这就像汽车每用完一箱汽油,积累的里程数越大。所以训练数据甚至比汽油更重要。

所以,训练数据的质量和数量至少是与算法同等重要的。

神话5:机器>人

过去30年来,媒体一直喜欢把AI描述为比人类强大的机器,例如《终结者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒体这样做也可以理解,因为媒体想建立起机器和人类之间谁会赢的简单叙述结构。但是,这和实际情况不符。

例如,Google的DeepMind/AlphaGo战胜李世石的新闻被媒体简单描述成机器战胜了人类。这是不准确的,真实情况不是这样简单。更准确的描述应该是“机器联合许多人战胜了一个人”。

微信图片_20180522110639.jpg

因此,对企业来说正确的框架是实现机器和人的互补,AI是机器和人的共同工作。

神话6:AI就是机器取代人类

主流媒体喜欢描绘反乌托邦的未来,因为它们认为这能吸引眼球。这样或许确实能吸引读者眼球,但是,它对真正理解机器和人类如何共同工作没有一点帮助。

假设你在分类了10000个支持ticket之后得到了一个准确率为70%的模型。30%的时候结果错误,但这时Human-in-the-loop就可以介入了。你可以把可接受置信度设置为95%,只接受置信度是95%或高于95%的输出结果。那么机器学习模型最初就只能做一小部分工作,比如说5%-10%。但是当模型得到新的人工标记数据时,它就能学习、进步。

所以,机器和人联合可以增加工作量,同时保持质量,降低重要业务的单位经济效益。这就消灭了机器取代人类的AI神话。真相是,AI是机器强化人类。

神话7:AI=ML

主流媒体有关AI的最后一个神话是把人工智能和机器学习当做一回事了。这可能让企业管理层以为只要买下Microsoft,Amazon或Google的某个商用机器学习服务就能把AI转变为产品。

实现一个AI解决方案,除了机器学习,你还需要训练数据,需要human-in-the-loop。缺了训练数据的机器学习就像没汽油的汽车,虽然很贵,但去不到任何地方。缺了human-in-the-loop的机器学习也会导致不良后果。你需要人去推翻机器学习模型低置信度的预测。

24327083_314892459015202_6323866433100972032_n.jpg

所以,如果你是想把AI应用于你的业务的企业高管,那么你想在应该有一个框架了。你可以用AI的7个真相代替AI的7个神话:

真相1:AI=TD+ML+HITL

真相2:AI适用所有企业。

真相3:AI适用现存的小问题。

真相4:算法并不比训练数据的质量和数量更重要。

真相5:机器和人类互补

真相6:AI是机器强化人类

真相7:AI=TD+ML+HITL

ap_resize.png

目前,以微軟、谷歌、Facebook、IBM為代表的實力型科技企業都已經進軍人工智能行業,不少公司還建設了獨立的人工智能實驗室。2017 年上半年,Google 宣布了一個新的開源計劃--AIY Projects(AIY計劃),其目標是讓每個Maker(創客)都能DIY自己的 AI 人工智能產品,讓更多人能學習、探索并體驗人工智能。AIY Projects 全稱為 Artificial Intelligence Yourself,Google 先后在 5 月、12 月份分別推出該項目代表的兩組套件 Voice Kit 和 Vision Kit。機器學習正在進步,我們似乎正在不斷接近我們心中的人工智能目標。語音識別、圖像檢測、機器翻譯、風格遷移等技術已經在我們的實際生活中開始得到了應用,但機器學習的發展仍還在繼續,甚至被認為有可能徹底改變人類文明的發展方向乃至人類自身。

回應 (0)
我要發表
user