关于人工智慧的七大误区和真相！走进Google AIY專案！

2018/08/15 16:56:28 網誌分類: 科技

15 Aug

我们必须消除主流媒体宣传的AI神话。只有消除这些误解，你才能对怎样应用AI到你的业务中有一个框架。

神话1：AI是魔术

AI是数据、数学、模型以及迭代。要想让AI为企业接受，我们需要更加透明，以下是3个有关AI的关键概念的解释：

训练数据（TD）：训练数据是机器学习的初始数据集。训练数据包括输入和预回答输出，所以机器学习模型能够为任何给定输出寻找模式。例如，输入可以是带有客户和企业支持代表（CSR）间的电子邮件线程的客户支持ticket，输出可以是基于企业特定分类定义的从1到5的分类标签。

机器学习（ML）:机器学习是能从训练数据中学习模式，并让这些模式应用于新的输入数据的软件。例如，接收到带有客户和CSR间的电子邮件线程的一个新的客户支持ticket时，机器学习模型能预测它的分类，并告诉你它对这个预测的置信度。机器学习的主要特点是它学习新的、而非适用固有的规则。因此，它能通过消化新的数据调整自己的规则。

Human-in-the-Loop(HITL)：Human-in-the-Loop是AI的第三个核心要素。我们不能指望机器学习模型绝对可靠。一个好的机器学习模型可能只有70%的准确率。因此，当模型的置信度较低时，就需要人使用Human-in-the-Loop作业流程。

神话2：AI只为技术精英专属

媒体报道很容易让人产生一种错觉，就是AI只属于技术精英——大公司例如Amazon，Apple，Facebook，Google，IBM，Microsoft，Salesforce，Tesla，Uber——只有它们能够组建大型机器学习专家团队，并获得亿美元级的投资。这种观念是错的。

今天，不用10万美元就能着手应用AI到你的业务中。所以，如果你是美国收益大于5000万美元的26000家企业之一，你就可以把收益的0.2%投资于AI应用了。所以，AI不是技术精英专属。它属于每个企业。

神话3：AI只为解决十亿美元级别的问题

主流媒体的倾向于报道未来主义的事物，例如自动驾驶汽车或用于运送快递的无人飞机。像Google，Tesla，Uber这些公司由于“赢者通吃”的心态，为了抢占未来无人车市场的龙头老大地位，已经投资进去数百亿美元。这些给人的印象是AI只用于解决十亿美元级别的新问题。但这又是一个错误。

许多企业坐拥来自客户的非结构化数据宝藏，这些数据来自电子邮件线程或Twitter评论。AI能应用于这些分类支持ticket的挑战，或用于理解推文情绪。

所以，AI不仅能应用于十亿美元级别的令人兴奋的新问题，例如自动驾驶汽车。AI也用于现存的“无趣”的小问题，例如通过支持ticket分类或社交媒体情绪分析更好地理解客户。

神话4：算法比数据更重要

主流媒体中有关AI的报道倾向于认为机器学习算法是最重要的要素。它们似乎把算法等同于人类大脑。它们暗示正是算法让魔术发生作用，更精细复杂的算法能超越人类大脑。有关机器在国际围棋和象棋中战胜人类的报道就是例子。媒体关注的是“深度神经网络”、“深度学习”以及机器如何做决定。

这样的报道可能带给企业这样的印象：想要应用AI，他们得先聘请到机器学习专家来建一个完美的算法。但假如企业不考虑怎样获得更高质量、更大量的定制训练数据以让机器学习模型学习，就算有了完美的算法也可能得不到理想的效果（“我们有超棒的算法”和“我们的模型只有60%的准确率”间的落差）。

从Microsoft，Amazon和Google这些公司购买商用机器学习服务，却没有一个训练数据规划或预算，就好比买了一辆汽车，却没法到达加油站。你只是买了一大块很贵的金属而已。汽车和汽油的类比虽然不够恰当，因为如果你给机器学习模型补给越多的训练数据，模型就能变得越好。这就像汽车每用完一箱汽油，积累的里程数越大。所以训练数据甚至比汽油更重要。

所以，训练数据的质量和数量至少是与算法同等重要的。

神话5：机器＞人

过去30年来，媒体一直喜欢把AI描述为比人类强大的机器，例如《终结者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒体这样做也可以理解，因为媒体想建立起机器和人类之间谁会赢的简单叙述结构。但是，这和实际情况不符。

例如，Google的DeepMind/AlphaGo战胜李世石的新闻被媒体简单描述成机器战胜了人类。这是不准确的，真实情况不是这样简单。更准确的描述应该是“机器联合许多人战胜了一个人”。

因此，对企业来说正确的框架是实现机器和人的互补，AI是机器和人的共同工作。

神话6：AI就是机器取代人类

主流媒体喜欢描绘反乌托邦的未来，因为它们认为这能吸引眼球。这样或许确实能吸引读者眼球，但是，它对真正理解机器和人类如何共同工作没有一点帮助。

假设你在分类了10000个支持ticket之后得到了一个准确率为70%的模型。30%的时候结果错误，但这时Human-in-the-loop就可以介入了。你可以把可接受置信度设置为95%，只接受置信度是95%或高于95%的输出结果。那么机器学习模型最初就只能做一小部分工作，比如说5%-10%。但是当模型得到新的人工标记数据时，它就能学习、进步。

所以，机器和人联合可以增加工作量，同时保持质量，降低重要业务的单位经济效益。这就消灭了机器取代人类的AI神话。真相是，AI是机器强化人类。

神话7：AI=ML

主流媒体有关AI的最后一个神话是把人工智能和机器学习当做一回事了。这可能让企业管理层以为只要买下Microsoft，Amazon或Google的某个商用机器学习服务就能把AI转变为产品。

实现一个AI解决方案，除了机器学习，你还需要训练数据，需要human-in-the-loop。缺了训练数据的机器学习就像没汽油的汽车，虽然很贵，但去不到任何地方。缺了human-in-the-loop的机器学习也会导致不良后果。你需要人去推翻机器学习模型低置信度的预测。

所以，如果你是想把AI应用于你的业务的企业高管，那么你想在应该有一个框架了。你可以用AI的7个真相代替AI的7个神话：

真相1：AI=TD+ML+HITL

真相2：AI适用所有企业。

真相3：AI适用现存的小问题。

真相4：算法并不比训练数据的质量和数量更重要。

真相5：机器和人类互补

真相6：AI是机器强化人类

真相7：AI=TD+ML+HITL

目前，以微軟、谷歌、Facebook、IBM為代表的實力型科技企業都已經進軍人工智能行業，不少公司還建設了獨立的人工智能實驗室。2017 年上半年，Google 宣布了一個新的開源計劃--AIY Projects（AIY計劃），其目標是讓每個Maker（創客）都能DIY自己的 AI 人工智能產品，讓更多人能學習、探索并體驗人工智能。AIY Projects 全稱為 Artificial Intelligence Yourself，Google 先后在 5 月、12 月份分別推出該項目代表的兩組套件 Voice Kit 和 Vision Kit。機器學習正在進步，我們似乎正在不斷接近我們心中的人工智能目標。語音識別、圖像檢測、機器翻譯、風格遷移等技術已經在我們的實際生活中開始得到了應用，但機器學習的發展仍還在繼續，甚至被認為有可能徹底改變人類文明的發展方向乃至人類自身。

回應 (0)

我要發表

月曆