基本信息
源码名称:中文分词SharpICTCLAS带例子(可自定义插入关键词)
源码大小:5.33M
文件格式:.zip
开发语言:C#
更新时间:2018-04-03
友情提示:(无需注册或充值,赞助后即可获取资源下载链接)
嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 5 元×
微信扫码支付:5 元
×
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
源码介绍
ICTCLAS的C#版,用于中文分词解析,bin里面有例子
using System;
using System.IO;
using SharpICTCLAS;
class Program
{
static void Main(string[] args)
{
string DictPath = Path.Combine(Environment.CurrentDirectory, "Data") Path.DirectorySeparatorChar;
Console.WriteLine("正在读入字典,请稍候...");
WordDictionary dict = new WordDictionary();
dict.Load(DictPath "coreDict.dct");
ShowWordsInfo(dict, '设');
Console.WriteLine("\r\n向字典库插入“设计模式”一词...");
dict.AddItem("设计模式", Utility.GetPOSValue("n"), 10);
Console.WriteLine("\r\n修改完成,将字典写入磁盘文件coreDictNew.dct,请稍候...");
dict.Save(DictPath "coreDictNew.dct");
Console.WriteLine("\r\n打开已写入的字典,请稍候...");
dict.Load(DictPath "coreDictNew.dct");
ShowWordsInfo(dict, '设');
Console.Write("按下回车键退出......");
Console.ReadLine();
}
public static void ShowWordsInfo(WordDictionary dict, char c)
{
int ccid = Utility.CC_ID(c);
Console.WriteLine("====================================\r\n汉字:{0}, ID :{1}\r\n", Utility.CC_ID2Char(ccid), ccid);
Console.WriteLine(" 词长 频率 词性 词");
for (int i = 0; i < dict.indexTable[ccid].nCount; i )
Console.WriteLine("{0,5} {1,6} {2,5} ({3}){4}",
dict.indexTable[ccid].WordItems[i].nWordLen,
dict.indexTable[ccid].WordItems[i].nFrequency,
Utility.GetPOSString(dict.indexTable[ccid].WordItems[i].nPOS),
Utility.CC_ID2Char(ccid),
dict.indexTable[ccid].WordItems[i].sWord);
}
}