1. 绪论
智能识别系统的组成:
1.信息获取(数据采集):
- 对信号、图像、数值表(数据)的采集。
- 即:要用计算机可以运算的符号来表示所研究的对象。如图像:测量、采样、量化等。
2.预处理:
- 减小或消除模式获取过程中的噪声、干扰、提高SN;
- 加强有用信息,进行复原等,如减小数据图像模糊及几何失真,提高清晰度;
- 非线性模式转化成线性模式。
- 这个环节的内容及方法很多:如滤波、变换、编码、标准化等
3.特征选择和变换
- 以某种判决规则为准则,选取有效的特征,即为特征选择。
- 采用某种变换对特征空间的压缩,称为特征变换。
4.分类器设计
- 分类器设计就是所谓的学习训练过程。
- 用一定数量的样本确定某种判别准则,通过反复输入、修正,直到分类错误率不超过给定值为止(或错误率最小,或损失最小),完成学习过程。
- 训练学习方法:
- 监督学习、无监督学习(无先验知识,甚至类别数也未知),半监督学习。
- 性能评估:采用交叉验证等方法评估训练模型的性能
5.分类决策
- 按分类判别准则,将被识别模式进行分类判决,输出分类结果
归纳偏好
学习过程中对某种类型假设的偏好称作归纳偏好
- 归纳偏好可看作学习算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或“价值观”
- “奥卡姆剃刀”是一种常用的、自然科学研究中最基本的原则,即“若有多个假设与观察一致,选最简单的那个”
- 具体的现实问题中,学习算法本身所做的假设是否成立,也即算法的归纳偏好是否与问题本身匹配,大多数时候直接决定了算法能否取得好的性能
基本概念
- 模式:对象的组成成分或影响因素间存在的一条规律性关系。
- 模式类(模型):具有某些共同特征的模式的集合
- 模式识别:研究一种自动技术,依靠这种技术,机器将自动(或人尽量少的干涉)把待识别模式分配到各自的模式类中去
- 学习:从数据中学得模型的过程
- 样本(示例):一个具体的研究(客观)对象。如患者,某人写的一个汉字,一幅图片等。
- 特征(属性):能描述模式特性的量。通常用一个矢量
表示,称之为特征矢量,记为
随机矢量的描述
在模式识别过程中,要对许多具体对象进行测量,以获得许多次观测值。每次观测值不一定相同,所以对许多对象而言,各个特征分量都是随机变量,即许多对象的特征向量在n维空间中呈随机性分布,称为随机矢量。
(一)随机矢量的分布函数:
(二)随机矢量的数字特征:
⑵ 条件期望
⑶ 协方差矩阵
(4)自相关矩阵
- 相关系数
一维正态分布
1. 绪论
http://binbo-zappy.github.io/2024/12/07/PR-ML/1-绪论/