本文将从 马尔可夫链的本质 、 马尔可夫链的原理 、 马尔可夫链的 应用 三个方面, 带 您一文搞懂人工智能数学基础- 马尔可夫链 (Markov Chain) 。
一、 马尔可夫链的本质
核心逻辑: 未来只与现在有关,而与过去无关。
马尔可夫性质
一、核心定义
- 马尔可夫链: 一种特殊的随机过程,具有“马尔可夫性质”。
- 马尔可夫性质: 未来状态仅与当前状态相关,与过去状态无关。
二、分类
- 离散时间马尔可夫链 (DTMC)
- 状态变化:在离散的时间点上发生。
- 应用场景:例如,每日股市价格变动。
- 连续时间马尔可夫链 (CTMC)
- 状态变化:在连续的时间轴上发生。
- 应用场景:例如,放射性衰变过程。
三、关键特性
- 无记忆性: 当前状态确定后,过去信息不再对未来状态有影响。
- 简洁高效: 不需要考虑所有过去的状态和转移路径,只需关注当前状态及其可能转移。
隐马尔可夫模型(HMM) : 一种强大的统计工具,通过描述隐藏的马尔可夫链和观测序列之间的关系,其核心组成部分包括隐藏状态、观测序列以及相关的概率分布和矩阵。
HMM隐马尔可夫模型
一、概述
- 隐马尔可夫模型(Hidden Markov Model, HMM)是一种统计模型,用于描述隐藏的马尔可夫链产生的观测序列。
- 在HMM中, 系统的真实状态(隐藏状态)是不可见的 ,我们只能观察到与这些隐藏状态相关的输出。
二、核心组成部分
- 隐藏状态: 系统的真实状态,通常表示为一系列离散的随机变量。
- 观测序列: 与隐藏状态相关的输出序列,可以是一维或多维的。
- 初始状态概率分布: 模型开始时各个隐藏状态的概率分布。
- 状态转移概率矩阵: 描述隐藏状态之间转移的概率。
- 观测概率矩阵: 描述在给定隐藏状态下观测值出现的概率。
HMM隐马尔可夫架构图
三、基本假设
- 齐次马尔可夫假设: 任意时刻的隐藏状态只依赖于前一个隐藏状态,与其他时刻的状态无关。
- 观测独立性假设: 任意时刻的观测值只依赖于当前时刻的隐藏状态,与其他时刻的观测值和隐藏状态无关。
二、 马尔可夫链的原理
马尔可夫链的原理依赖于转移矩阵和转移图来描述状态间的变化。转移矩阵,作为一个二维数组,明确了从一个状态到另一个状态的转移概率。而转移图则直观地展示了这些状态间的转移关系,为理解和分析提供了便捷的可视化工具。
转移矩阵 : 是一个二维数组,其中每个元素表示从一个状态转移到另一个状态的概率。
转移矩阵
- 定义:转移矩阵是马尔可夫链中用于描述状态间转移概率的二维数组。
- 构成:矩阵中的每个元素表示从一个特定状态转移到另一个状态的概率。通常,转移矩阵的每一行之和都为1,因为从一个状态出发,转移到所有可能状态的概率之和必须为1。
- 表示:若马尔可夫链有n个状态,则转移矩阵通常表示为一个n x n的矩阵,其中矩阵的第i行第j列元素表示从状态i转移到状态j的概率。
转移图 : 是一种可视化工具,用于直观地展示状态之间的转移关系。
转移图
- 定义:转移图是马尔可夫链的可视化表示,用于直观地展示状态之间的转移关系。
- 构成:转移图由节点(表示状态)和有向边(表示状态间的转移)组成。边的权重通常表示转移概率。
- 特点:通过转移图,可以清晰地看出哪些状态之间可以直接转移,以及转移的概率是多少。这对于理解和分析马尔可夫链的行为非常有帮助。
三、 马尔可夫链的 应用
天气预测 :马尔可夫模型在天气预测中是一种有效的方法,它基于“当前状态仅与前一个状态有关”的假设来预测未来天气的变化趋势。
天气预测
一、概述
通过将天气状况划分为不同的状态(如晴天、雨天、多云等),并计算这些状态之间的转移概率,可以构建出一个马尔可夫链模型来进行天气预测。
二、核心步骤
- 状态定义:首先,需要明确天气预测中的不同状态。这些状态可以是晴天、雨天、多云、雪天等,具体取决于预测的需求和地区特点。
- 转移概率计算:接下来,通过历史天气数据来计算状态之间的转移概率。例如,可以计算在晴天之后出现雨天的概率,或者在多云之后转为晴天的概率。
- 模型构建:基于计算得到的转移概率,可以构建出一个马尔可夫链模型。这个模型描述了不同天气状态之间的转移关系和概率。
- 天气预测:最后,利用构建的马尔可夫链模型进行天气预测。给定当前的天气状态,可以根据模型的转移概率来预测未来一段时间内的天气变化趋势。
股市预测 :马尔可夫模型在股市预测中通过捕捉状态转移规律来预测短期股价变动。
股市预测
一、概述
通过分析历史股价数据的状态转移规律,来预测未来股价的变动趋势。这种模型将股市的涨跌看作是一个随机过程,通过计算状态转移概率来估计未来股价的可能变化。
二、核心步骤
- 状态划分:首先,需要将股市的涨跌情况划分为不同的状态,如上涨、下跌、盘整等。这些状态的划分可以根据历史数据的统计特征或者领域知识来确定。
- 转移概率计算:接下来,通过分析历史数据来计算状态之间的转移概率。例如,可以计算在上涨状态之后出现下跌状态的概率,或者在盘整状态之后转为上涨状态的概率。这些概率可以通过统计频率或者最大似然估计等方法来得到。
- 模型构建:基于计算得到的状态转移概率,可以构建出一个马尔可夫模型。这个模型描述了股市涨跌状态之间的转移规律和概率分布。
- 股市预测:最后,利用构建的马尔可夫模型进行股市预测。给定当前的股市状态,可以根据模型的转移概率来估计未来一段时间内股市的可能变化趋势。