HMM模型+维特比算法实现分词词性标注

基本信息

源码名称：HMM模型+维特比算法实现分词词性标注

源码大小：2.92KB

文件格式：.py

开发语言：Python

更新时间：2021-10-28

友情提示：（无需注册或充值，赞助后即可获取资源下载链接）

嘿，亲！知识可是无价之宝呢，但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下，绝对物超所值哦！如有下载和支付问题，请联系我们QQ(微信同号)：78630559

本次赞助数额为： 2 元　

源码介绍

HMM模型维特比算法实现分词词性标注

def viterbi(init_p, ep, tp, obs_len):
    max_p=np.zeros([obs_len, 6], dtype=float)#最大概率矩阵，列为分词，行为词性
    # path=np.zeros([obs_len, 6], dtype=float)#路径矩阵
    for i in range(6):
        max_p[0][i]=1.0*init_p[i]*ep[0][i]#初始化第一个观测点
    for obs_id in range(1, obs_len):#遍历计算
        for hidden_id in range(6):#当前节点的词性
            max_prob=-1
            # pre_state_id=0
            for i in range(6):#上一节点的词性
                each_p=max_p[obs_id-1][i]*tp[i][hidden_id]
                if each_p>max_prob:
                    max_prob=each_p#记录当前累积概率最大值
                    # pre_state_id=i#记录使累积概率最大的上一节点的词性

            #记录当前节点的最大累积概率
            max_p[obs_id][hidden_id]=max_prob*ep[obs_id][hidden_id]
            # path[obs_id][hidden_id]=pre_state_id
    #返回最大概率的路径
    output=np.empty([obs_len],dtype=int)
    for i in range(obs_len):
        max_prob=-1
        last_id=0
        for j in range(6):
            if max_p[i][j]>max_prob:
                max_prob=max_p[i][j]
                last_id=j
        output[i]=last_id
    return output