人工智能的十大经典应用

导读本文将使用“算法”一词,以高度简化的方式来描述单个算法、模型或者使用多种算法的软件。在每个类别中,逐一讨论数据输入的类型、作为黑箱的算法以及输出

本文将使用“算法”一词来描述一个单一的算法、模型或软件,并以一种高度简化的方式使用多个算法。 在每个类别中,对数据输入的类型,算法作为黑盒,输出进行逐一讨论(为了简单起见,即使真正的算法不是黑盒,也暂时视为黑盒)。

 人工智能的十大经典应用

因为这是一个高层次的概述,我鼓励您深入研究感兴趣的特定应用程序,并了解它们如何应用于行业或商业活动。 还有许多资源可用于学习所涉及的技术细节和具体算法。

 人工智能的十大经典应用

预测是预测分析或预测建模的同义词,它是基于标记的输出数据判断的过程,有时甚至是未标记的输入数据。 在机器学习和人工智能中,预测分析可以进一步细分为回归和分类。

 人工智能的十大经典应用

下面讨论使用标记数据(监督)进行预测的两个子类。

 人工智能的十大经典应用

1.回归

 人工智能的十大经典应用

图1-1显示了在回归方法中输入标记数据的过程,通过预测模型进行处理,然后从连续序列(如股票市场的封闭市场价格)生成值)。

 人工智能的十大经典应用

人工智能的十大经典应用

 人工智能的十大经典应用

▲图1-1:回归

 人工智能的十大经典应用

该应用包括客户的股票价值和净利润、收入及其增长预测、价格变化、信用违约风险和股票交易计算。

 人工智能的十大经典应用

2.分类

 人工智能的十大经典应用

分类是指将输入的数据经过分类模型处理后,分类成一个或多个类的过程,如图1-2所示。

 人工智能的十大经典应用

人工智能的十大经典应用

 人工智能的十大经典应用

▲图1-2:分类

 人工智能的十大经典应用

垃圾邮件过滤器是二进制分类应用程序的标准案例。 电子邮件是分类模型处理的输入数据,输出数据被确定为垃圾邮件或非垃圾邮件、非垃圾邮件邮件是指不包含垃圾邮件的好邮件。 垃圾邮件被发送到垃圾箱而不是收件箱。

 人工智能的十大经典应用

如果引入第三类“不确定性”,分类器现在可以将传入消息分为三类。 因为有两个以上的类别,这就是多元分类的一个例子。 在本例中,电子邮件客户端可能有“可疑垃圾邮件”文件夹,供用户查看每条邮件并训练分类器,以更好地区分垃圾邮件和非垃圾邮件。

 人工智能的十大经典应用

如果要将输入数据划分为三个或三个以上的类,则算法可以为输入数据选择单个类别,或者计算输入数据属于每个类别的概率。 在后一种情况下,您可以使用概率最大的类别作为选择的结果,或者使用所有类别的概率根据您自己的自定义规则进行处理。

在这种情况下,假设新收到的电子邮件被识别为85%可能是垃圾邮件,10%可能是非垃圾邮件和5%的不确定性。 因为垃圾邮件是最有可能的,所以可以判断为垃圾邮件,或者用其他方法来计算概率。

最后,一些算法可以将多个标签分配给同一个输入。 下面是一个与图像识别相关的例子。 假设输入数据是红苹果的图像,则该算法可以为图像分配多个不同的标签,如红色、苹果和水果。 将所有三个类别分配给图像的情况是适当的。

申请包括信用风险,贷款审批和客户周转。 分类可以与本文后面讨论的识别应用相结合。

推荐系统是一种基于现有信息的个性化推荐形式,其结果与每个用户都非常相关。可用于提高客户转化率,销售率,满意率和留存率。 事实上,亚马逊正在通过添加这些引擎来做生意收入增加35%,Netflix观看节目增加75%也来自这一建议。

推荐系统是一种特殊的信息过滤系统。 个性化也可以通过用户搜索、排名和评分来完成。 建议系统完成建议(例如。 产品、文章、音乐、电影)通过基于输入数据(如商品或用户)处理推荐模型或引擎,如图2所示。

人工智能的十大经典应用

▲图2:推荐系统

值得一提的是,推荐系统涉及“冷启动问题“。 冷启动意味着智能应用程序没有足够的信息为特定用户或群体提供高度个性化和相关的建议。 例如,用户尚未生成有关其偏好、兴趣或购买历史的信息。

另一个例子是当货物(例如。 衣服,产品,视频,歌曲)刚刚出来。一些技术帮助解决了这个问题,但由于空间限制,没有深入讨论。

推荐的系统应用程序包括推荐产品、视频、音乐、歌曲、书籍和电视节目(例如。 亚马逊,Netflix,Spotify)。 除了建议,它还包括个性化的内容,包括新闻、报告、电子邮件和有针对性的广告(例如。 推特)。

其他案例包括个性化的医疗计划、个性化的图像和图标(例如Youtube、Netflix、Yelp)、葡萄酒推荐、个性化购物(例如完美的夹克匹配),(例如。 缝合修复),以及全套自动化建议。

计算机视觉是一个广阔的领域,包括涉及图像和视频等视觉信息的模式识别(下一节将讨论另一种技术)。 计算机视觉中的照片,静止视频图像等一系列图像(视频)作为输入,输出由模型生成,如图3所示。

人工智能的十大经典应用

▲图3:计算机视觉

输出可以是目标、特征或活动的识别、检测和发现。 视觉相关应用意味着一定程度的自动化,特别是自动化视觉,通常需要人类参与应用程序(例如。 检查)。 机器视觉一词用于描述工业应用中类似或重叠的技术,如检查、过程控制、测量和机器人。

计算机视觉有许多有趣而强大的应用,应用场景正在迅速增加。 例如,计算机视觉可用于以下场景:

无人驾驶飞机(UAV)通常被称为无人机。通过应用计算机视觉,无人机能够进行检查(例如输油管道、无线信号塔)、完成建筑物和区域搜索、帮助绘制地图和交付货物。 计算机视觉现在被广泛应用于公共安全、安全和监视。 当然,这样的申请也应该注重伦理,保护人们的利益。

计算机视觉还有最后一件事要提。 通过看,闻,听,摸,闻五种感官,人类可以感知周围的环境和世界。 感官捕获信息,然后将其传递给神经系统进行转换,并确定应该采取什么行动或反应。 计算机视觉是对特定人工智能应用视觉的类比。

模式识别涉及到输入非结构化数据,对模型进行处理,然后检测特定模式的存在(检测),然后对识别的模式分配一个类别(分类),或者发现被识别模式的主体(识别),如图4-1所示。

人工智能的十大经典应用

▲图4-1:模式识别

这些应用程序的输入可以打包包括图像(包括视频——一系列静止图像)、音频(例如。 演讲,音乐和声音)和文本。 案文可进一步细分为电子文本、手写文本或印刷文本(例如。 纸,支票,车牌)。

图像输入的目的可能是检测、识别、发现或所有三种。 人脸识别就是一个很好的例子。 训练模型用于检测图像中的人脸,并对检测到的目标进行分类和标记。 这是一个目标检测的例子,其中目标是一个未识别的人脸。

“检测”用于指与背景不同的对象。 它还包括目标位置的测量和检测目标边缘框架周围的具体测量。 识别是指对检测到的目标(在这种情况下,人脸)进行分类或标记的过程,它进一步并为识别的人脸分配一个标识。 图4-2给出了图像识别的一些情况。

人工智能的十大经典应用

▲图4-2:图像识别和检测

像人脸识别这样的生物识别技术可以用来自动给图形中的人贴上标签。 另一种生物识别形式是基于指纹。

其他申请包括:

音频识别应用包括:

最后,手写或打印文本可以通过光学字符识别(OCR)和手写字符识别转换为电子文档。 文档也可以转换为语音,但这被认为比识别应用更有可能是人工智能的生成应用。 本文稍后将讨论生成应用程序。

图5所示的聚类和异常检测是两种最常见的无监督机器学习技术。 它们也被认为是模式识别技术。

人工智能的十大经典应用

图5▲:聚类和异常检测

两个进程都没有标签号根据输入,经过相应算法(聚类或异常检测)处理后,在聚类场景中完成分组,或者在异常检测场景中是否属于异常。 我们首先讨论聚类。

聚类将类似的数据从无标签的数据聚合成组。 具体组数由完成聚类任务的人员(通常是数据科学家)决定。 没有绝对正确或错误的组,但对于特定的应用程序,理想的组数通常可以通过试错来确定。

由于数据没有标签,聚类器必须为每个组指定一个特定的含义或标签来清楚地描述(例如,运动狂)。 然后,该模型用于将新数据分配给一个组,假设该组的标签或描述。 这个过程可以想象为某种形式的预测分类,即为每个新数据点分配一个类(通过分组标签)。

分配新的数据点(例如。 客户)到集群(细分市场)将为我们提供一个更好的方法来定位、个性化和战略性地定位产品,并能够以正确的方式在每个细分市场上营销客户。

聚类应用包括细分和关注市场和客户,3D医学图像分析,根据购物习惯对产品进行分类,社交媒体分析。

异常检测是一种用于检测异常数据(高度异常、偏离常规或畸形)模式的技术。 异常检测应用包括基于音频的缺陷和裂纹检测、网络安全、质量控制(例如。 制造缺陷检测),以及计算机和网络系统的健康(例如。 美国宇航局缺陷和错误检测)。

网络安全异常检测应用程序中的常见威胁包括恶意软件、勒索软件、计算机病毒、系统和内存攻击、拒绝服务(DoS)攻击、钓鱼、不必要的程序执行、证书盗窃、数据传输和盗窃。 不用说,这边面异常检测场景层出不穷。

自然语言是人工智能发展和应用中一个非常有趣和令人兴奋的领域。 通常分为三个子区域:自然语言处理(NLP),自然语言生成(NLG)和自然语言理解(NLU)。 让我们分开讨论。

1. nlp

自然语言处理(NLP)语言输入文本、语音或手写形式,经过NLP算法处理后,输出结构化数据,如图6-1所示。现在有很多潜在的NLP场景和输出。

人工智能的十大经典应用

▲图6-1:NLP

值得一提的是,有时NLP也被认为是NLG和NLU的超集,因此人工智能自然语言应用一般可以被认为是NLP的一种形式。 它也被认为是一组特定的自然语言应用程序,我们正在讨论的是它的一部分。

与NLP相关的具体任务和技术包括:

一个具体的NLP应用程序涉及公司会议的录音,文本转换,然后提供会议摘要,其中包括围绕不同主题和会议性能(https://www.chorus.ai)进行分析)。

另一个应用程序使用NLP分析工作面试,并根据性别中立、语调和措辞给出总体评分。 它还为改进评级和总体职务说明提供优化建议。

其他申请包括:

许多云服务提供商现在通过NLP服务和API接口提供了其中的一些功能。

2. nlg

以结构化数据形式生成NLG输入语言,经过NLG算法处理后,生成相应语言作为输出,如图6-2所示。 这种语言输出可以是文本或文本转换为语音的形式。 结构化输入数据例子可以是运动员的统计数据、广告效果或公司财务数据。

人工智能的十大经典应用

▲图6-2:NLG

申请包括:

由AndreKapasi创建的模型可以自动生成Wikipedia文章,婴儿姓名,数学论文,计算机代码和莎士比亚的模型。 其他应用包括生成手写文本,甚至创建笑话。

3. NLU

最后,NLU使用语言作为输入(文本、语音或手写)。 经过NLU算法的处理,可以理解的语言作为输出产生,如图6-3所示。 由此产生的可理解的语言可以用来采取行动,产生反应,回答问题,进行对话等。

人工智能的十大经典应用

▲图6-3:NLU

必须指出,“理解”一词可以是非常深刻和哲学的,涉及理解的概念。理解能力往往不仅是理解信息(与死记硬背相反),而且是将理解的信息与现有知识整合为一个不断增长的知识库。

缺乏与人类相似的语言理解和理解是当今基于自然语言的人工智能应用的一大缺陷。 其根源是机器很难获得与人类相似的语言理解。 还记得之前关于人工智能现状和人工智能问题的讨论吗? 这是一个明确的证据。

在没有全面的哲学讨论的情况下,让我们用“理解”一词来表示算法(重申,大大简化)可以在输入语言上做更多的工作,而不仅仅是解析和执行简单的任务,例如文本分析。 显然,NLU比NLP和NLG(常见的人工智能问题)更难解决,实施常见的人工智能是NLU GI)的主要基本组成。

目前,NLU已经得到了改进,包括个人虚拟助理、聊天机器人、客户成功(支持和服务)代理、销售代理等。 这些应用程序通常包括某种形式的手写内容或语音对话,通常围绕信息收集、问题解决或一些有用的工具。

个人助理包括亚马逊的Alexa、苹果的Siri、谷歌的助理和Nuance的具体应用,聊天机器人的应用案例包括润滑油专家、求职面试、学生贷款顾问和商业保险专家。 这是一个非常活跃的人工智能研究和潜在的发展空间,绝对值得关注。

在大多数情况下,数据是按顺序收集的,因此数据的顺序是极其重要的,由特定的指标决定。

最常见的数据序列指标是时间,称为时间序列数据。股票的价格波动、DNA序列、物联网传感器数据以及日常交易期间的风向等科学现象是时间序列的很好的例子。

时间序列分析和建模可以用来学习、判断和预测基于时间的事件,包括趋势、季节变化、周期和噪声。

对于某些应用程序,字母和单词序列也是有效的序列数据,它们被标记为不同的序列数据,例如n-gram、skip-gram、句子、段落,甚至是语言本身,其中语言以语音、文字或电子方式表达。 此外,音频和视频也是序列数据。

申请包括:

人工智能的十大经典应用

许多强大的AI应用程序围绕着信息的搜索、提取和排序(评分)。 这特别适用于非结构化和半结构化结构化数据,如文本文档,网页,图片和视频。

这些数据(有时由结构化数据补充)可用于提取信息,提供搜索或优化处理建议,并按相关性、重要性或优先级对条目进行排序或评分。 这组技术大多是个性化的,因为搜索结果和其他条目可以根据特定用户或组的相关性大小进行排序或排序。

目前,许多搜索任务都是通过键盘输入或语音提供给谷歌等搜索引擎,使用谷歌独特的人工智能搜索算法。 电子商务应用程序也使用自己的引擎来搜索产品,搜索过程可以通过文本、声音(语音)和视觉输入来驱动。

文本搜索包括谷歌搜索、微软Bing和分布式、透明和社区驱动的搜索。

基于声音和图像的搜索应用包括:

视频搜索是基于图像内容。购物应用程序早就采取了这种方法。 用户将拍摄的照片提交到视频搜索引擎。 然后,照片被用来生成类似的搜索结果,如服装。 一些图像引擎也可以直观地显示类似的其他产品和建议。

除分类技术外,排序和评分技术还包括以下应用:

增强学习(RL)与目前所描述的人工智能技术有很大的不同(简要回顾前面提到的人类学习方法)。 其基本思想是让一个代理在虚拟环境中为正回报行事。 每个动作都会引起环境状态的变化,每个动作都是由一个称为策略的模型决定的。 该政策试图确定在给定状态下应采取的最佳行动。

如果你暂时不明白,不要担心;我会举一个例子,希望能解释得更清楚。 图9生动地展示了强化学习。

人工智能十大经典应用和技术原理

▲图9:强化学习

你可以考虑使用游戏“豆豆吃”(为什么是吃豆人女士,而不是女士。 Pac-Woman?)。 2例如。 比恩女士的目标是吃屏幕上所有的点,但更大的目标是从可能吃的点中得到最多的点。 为什么得分是最真实的目标? 或者为什么玩这个游戏?

首先,分数越多,可以获得的自由寿命越长,自由寿命越长可以发挥的时间越长,可以继续积累更多的分数。 第二,如果你能完成游戏或创造世界纪录,你就可以获得正式的“吹嘘权“。 谁不想要?

在这种情况下,分数是奖励,吃豆的女士是代理,环境是屏幕,参与的人(玩家)是通过操纵游戏控制棒来决定采取行动的策略。

当然,环境是有状态的。有一种普通的无法察觉的情况,那就是,当你吃着屏幕上的圆点和水果时,你必须避免追逐她的鬼魂,而且有一种无敌的情况。 也就是说,当吃无敌药丸(我不知道它叫什么)时,她可以吃鬼,得到很多额外的分数。

环境状态的变化和代理人在环境中的能力的变化决定了不可胜性和不可胜性。

值得一提的是,在人们玩“吃豆夫人”游戏的过程中,有时被屏幕目标的完成所驱动,尽可能地打开更多的层次,而不是得到最多的分数。 在这种情况下,人们只会用无敌状态加速,吃尽可能多的不受阻碍的点,可能不会通过吃鬼得到最多的点。

假设你有强化学习应用,目标是得分最多。 在这种情况下,应用程序将尝试学习如何做到这一点,即吃尽可能多的鬼和水果。

也是有一件事要提到,得分是一个积极的回报。 遭遇鬼死是一种消极的奖励。 随着时间的推移,加固应用程序应该尽量扩大分数,尽量减少生命损失。 虽然这个例子是建立在游戏场景中的,但我们可以在许多其他方面使用强化学习。

申请包括:

人工智能的十大经典应用

实际应用程序的最后一节确定了一些被归类为混合或杂项的应用程序,因为它们涉及多种组合技术,或者不适合已经讨论过的任何类别。

应用实例包括:

人工智能开发的另一个真正有趣的领域是生成应用程序,它基本上是指人工智能,它可以从特定类型的输入为给定的应用程序生成一些东西。 包括以下例子:

其他应用程序包括样式转换(例如。普通形象转换,再现梵高或毕加索风格的“艺术)。 还有一种称为超分辨率成像的技术,它通过生成缺失的三维图像数据,将二维图像转换为三维图像。 最后,图像自动着色是另一个有趣的人工智能应用。

作者:AlexCastrounis,InnoAchiTech的前首席执行官兼首席顾问,也是一名商业、分析和产品管理专家,Alex拥有近20年的创新经验,并向数千人传授了数据科学和高级分析的价值。

摘要编写自人工智能战略:一个更好的人类经验和企业成功框架,出版的权威出版商。

人工智能的十大经典应用

扩展阅读AI策略

建议:本书将探讨人工智能项目推广中的风险,关键考虑,权衡和可能存在的问题。 你将学会如何使用成功的人工智能 解决方案和以人为中心的产品,创造更好的人类体验,帮助企业成功。

免责声明:本文章由会员“丁俊远”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系