人工智能了解

2018-08-31

基础知识点整理、学习

1. 简介

AI(Artificial interlligence),即人工智能。人工智能领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大，可以设想，未来人工智能带来的科技产品，将会是人类智慧的“容器”。

2. 关于人工智能，机器学习，神经网络，深度学习

人工智能
人工智能应当归纳成了“逻辑/算法编程”，也就是通过编程将人类所知的知识和逻辑告诉机器，从而借助机器的高速计算和海量存储等能力实现一些人类才能做的“弱智能”工作，我理解上个世纪的深蓝计算机应该就是属于这一类的吧，就是将国际象棋中所有可能的结果都通过预先编好的程序计算出来从而选择最佳的下法(穷举法)。从程序的实现上来说恐怕就是无数的if…else…吧。
而另一类就是基于数据的自我学习，即机器学习，把大量的数据告诉机器由机器自己去分析这些数据从而总结得出某种规律/逻辑，然后利用这种逻辑来处理新的数据。
机器学习
不用写专门的业务逻辑代码而是通过输入大量的数据给机器，由机器通过一个通用的机制来建立它自己的业务逻辑，也就是机器“自我学习”了业务的逻辑，当然这种学习后的逻辑可以用来处理新的数据。这和人类的学习过程有些类似；

机器学习是不断的训练过程，其模型是在连续的优化调整中，随着训练数据越多其模型越准确；
机器学习是通过大量的数据来训练得到模型的，因此其模型考虑的是相关性逻辑，而不是因果性逻辑，这和大数据分析的概念是一致的。
ok，总结起来说，机器学习就是”利用已有数据，得出某种模型，并利用此模型预测未来的方法“。
有监督学习与无监督学习

有监督学习就是训练用历史数据是既有问题又有答案；
有监督学习，可以根据预测变量的类型再细分。如果预测变量是连续的，那这就属于回归问题。而如果预测变量是独立类别（定性或是定类的离散值），那这就属于分类问题了。因此有监督学习主要的分类包含：

回归算法 (线性回归，最小二乘回归，LOESS局部回归，神经网路，深度学习）
分类算法（决策树，支持向量机，贝叶斯，K-近邻算法，逻辑回归，随机森林）

无监督学习就是训练用历史数据是只有问题没有答案。
在无监督学习中，主要是发现数据中未知的结构或者是趋势。虽然原数据不含任何的标签，但我们希望可以对数据进行整合（分组或者聚类），或是简化数据（降维、移除不必要的变量或者检测异常值）。因此无监督算法主要的分类包含：

聚类算法 (代表：K均值聚类，系统聚类)
降维算法（代表：主成份分析PCA，线性判断分析LDA）

还有一种介于两者之间的混合学习方法，称为半监督学习

神经网络
神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助你理解深度学习技术。
神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。

更多知识了解：从神经元到深度学习

。。。