基本信息
源码名称:HMM模型+维特比算法实现分词词性标注
源码大小:2.92KB
文件格式:.py
开发语言:Python
更新时间:2021-10-28
友情提示:(无需注册或充值,赞助后即可获取资源下载链接)
嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 2 元×
微信扫码支付:2 元
×
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
源码介绍
HMM模型 维特比算法实现分词词性标注
def viterbi(init_p, ep, tp, obs_len):
max_p=np.zeros([obs_len, 6], dtype=float)#最大概率矩阵,列为分词,行为词性
# path=np.zeros([obs_len, 6], dtype=float)#路径矩阵
for i in range(6):
max_p[0][i]=1.0*init_p[i]*ep[0][i]#初始化第一个观测点
for obs_id in range(1, obs_len):#遍历计算
for hidden_id in range(6):#当前节点的词性
max_prob=-1
# pre_state_id=0
for i in range(6):#上一节点的词性
each_p=max_p[obs_id-1][i]*tp[i][hidden_id]
if each_p>max_prob:
max_prob=each_p#记录当前累积概率最大值
# pre_state_id=i#记录使累积概率最大的上一节点的词性
#记录当前节点的最大累积概率
max_p[obs_id][hidden_id]=max_prob*ep[obs_id][hidden_id]
# path[obs_id][hidden_id]=pre_state_id
#返回最大概率的路径
output=np.empty([obs_len],dtype=int)
for i in range(obs_len):
max_prob=-1
last_id=0
for j in range(6):
if max_p[i][j]>max_prob:
max_prob=max_p[i][j]
last_id=j
output[i]=last_id
return output