Fork me on GitHub

1.1 机器学习概述——机器学习的发展

1.1 机器学习概述——机器学习的发展

目前人工智能的三大学派:

  1. 符号主义(symbolicism),又称为逻辑主义、心理学派或计算机学派,其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。
  2. 连接主义(connectionism),又称为仿生学派或生理学派,其主要原理为神经网络及神经网络间的连接机制与学习算法。
  3. 行为主义(actionism),又称为进化主义或控制论学派,其原理为控制论及感知-动作型控制系统。

人工智能诞生于20世纪50年代,英文为Artificial Intelligence,简称AI,旨在实现人脑部分思维的计算机模拟。人工智能的研究经历了从Symbolic AI(符号主义人工智能), 到Machine Learning(机器学习),再到Deep Learning(深度学习)的不同发展阶段。

1.1.1 Symbolic AI

20世纪50年代到80年代末,人工智能的主流范式的符号主义人工智能,即基于“一切都可规则化编码”的基本理念,通过预先编写好的代码(即指定的规则)进行处理相应的任务,以此实现人类智能水平相当的人工智能。

该范式的实现巅峰在Expert System(专家系统)及各类计算机博弈系统。

Expert System

专家系统是早期人工智能的一个重要分支,它可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。

一般来说,专家系统=知识库+推理机,因此专家系统也被称为基于知识的系统。一个专家系统必须具备三要素:

  1. 领域专家级知识
  2. 模拟专家思维
  3. 达到专家级的水平

专家系统适合于完成那些没有公认的理论和方法、数据不精确或信息不完整、人类专家短缺或专门知识十分昂贵的诊断、解释、监控、预测、规划和设计等任务。一般专家系统执行的求解任务是知识密集型的。

计算机博弈

1997年5月11日,IBM一台名为IBM深蓝的电脑在六场比赛后击败了世界国际象棋冠军:IBM两胜一负,冠军一胜三平。比赛持续了几天,得到了世界各地媒体的大量报道。这是人与机器的经典情节线。

然而,在竞赛的背后,是重要的计算机科学,它推动了计算机处理各种复杂计算的能力,以帮助发现新的医疗药物:做识别趋势和进行风险分析所需的广泛财务建模:处理大型数据库搜索;并在许多科学领域执行所需的大量计算。


深蓝的名字源自其雏型电脑“沉思”(Deep Thought)及IBM的昵称“巨蓝”(Big Blue)

由于符号主义人工智能很难解决诸如语言翻译、语音识别、图像分类等更加复杂和模糊的没有明确定义的逻辑问题,因此需要一种新的范式,这就是机器学习(Machine Learning,ML)

1.1.2 Machine Learning

机器学习的概念来自于“人工智能之父” Alan Turing 1950进行的图灵测试,该测试提出了机器思考的可能性。机器学习的出发点在于:与其编写规则使机器完成任务,不如让机器借助某些算法自主完成任务。

从计算机程序设计的角度来看,机器学习体现的是,将数据与答案交给计算机使其产生规则,并通过规则继续进行运作;而符号主义体现的是,将数据与规则较高计算机,使其产生答案。

image.png
如图,机器学习是一种新的范式

对于自然语言处理(英语:Natural Language Processing,缩写作 NLP),则可以细分出符号主义,机器学习,深度学习的不断演进。

1970年代,程序员开始设计“概念本体论”(conceptual ontologies)的程序,将现实世界的信息,架构成电脑能够理解的资料。实例有MARGIE、SAM、PAM、TaleSpin、QUALM、Politics以及Plot Unit。许多聊天机器人在这一时期写成,包括PARRY 、Racter 以及Jabberwacky 。

一直到1980年代,多数自然语言处理系统是以一套复杂、人工订定的规则为基础。不过从1980年代末期开始,语言处理引进了机器学习的算法,NLP产生革新。

许多早期的成功属于机器翻译领域,尤其归功IBM的研究,渐次发展出更复杂的统计模型。其他大部分系统必须特别打造自己的语料库,一直到现在这都是限制其成功的一个主要因素,于是大量的研究致力于从有限的数据更有效地学习。

近来的研究更加聚焦于非监督式学习和半监督学习的算法。这种算法,能够从没有人工注解理想答案的资料里学习。大体而言,这种学习比监督学习困难,并且在同量的数据下,通常产生的结果较不准确。不过没有注解的数据量极巨(包含了万维网),弥补了较不准确的缺点。

近年来,深度学习技巧纷纷出炉在自然语言处理方面获得最尖端的成果,例如语言模型、语法分析等等。

1.1.3 Deep Learning

深度学习(英语:deep learning)是机器学习的分支,是一种以人工神经网络为架构,对资料进行表征学习的算法。“深度学习”已成为时髦术语,或者说是人工神经网络的品牌重塑。

AI Timeline - What is Deep Learning - Edureka

深度学习在一下方面有所应用:

  • 语音识别

苹果 Siri - 什么是深度学习 - 埃都雷卡

在语音识别和语音控制智能助手(如 Siri)领域,人们可以使用深度神经网络开发更精确的声学模型,是目前最活跃的深度学习实施领域之一。

  • 自动机器翻译

文本翻译 - 什么是深度学习 - 埃都雷卡

谷歌翻译 背后的技术被称为机器翻译 ,对于因为口语不同而无法相互交流的人来说,它一直是救世主。现在,你会认为这个功能已经存在了很长一段时间,那么,有什么新的呢?让我告诉你,在过去两年里,在深入学习的帮助下,谷歌彻底改革了谷歌翻译中的机器翻译方法。

  • 自动自动驾驶汽车

image.png

深度学习是目前处理大多数感知任务以及许多低级控制任务的最佳方法。因此,现在,即使是那些不知道开车或残疾的人,也可以继续开车,而不用依赖其他人。

如有任何简介或疑问,欢迎各位进群讨论:977845247


本文地址:https://www.6aiq.com/article/1636290970123
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出