文件名称:Chinese-Word-Segment-And-POS-Tagger
介绍说明--下载内容来自于网络,使用问题请自行百度
实现了中文分词和词性标注程序。分词方法采用“三词正向最长匹配”。词性标注使用HMM方法,用Viterbi算法实现。“三词正向最长匹配”保持了“正向最长匹配算法”快速的特点,同时提高了分词的准确性。-Chinese word segmentation and implemented procedures for POS tagging. Segmentation Methods, " the longest three-match positive words." POS tagging using HMM method, the Viterbi algorithm. " Three words maximum positive match" to maintain a " positive maximum matching algorithm," Fast features, while improving the accuracy of segmentation.
(系统自动生成,下载前可以参看下载内容)
下载文件列表
SegAndTag/chnsegtager_segtag_200828016029024.py
SegAndTag/CovertToUTF-8.py
SegAndTag/dict.py
SegAndTag/dict.pyc
SegAndTag/diction.py
SegAndTag/diction.py.bak
SegAndTag/seg.py
SegAndTag/seg.pyc
SegAndTag/selecttool.py
SegAndTag/selecttool.pyc
SegAndTag/viterbi.py
SegAndTag/viterbi.pyc
SegAndTag/word.py
SegAndTag/word.pyc
SegAndTag/__init__.py
data/dict.dat
data/diction.txt
data/segoutput.txt
data/tagoutput.txt
data/testinput.txt
data/utf8train.txt
SegAndTag
data
SegAndTag/CovertToUTF-8.py
SegAndTag/dict.py
SegAndTag/dict.pyc
SegAndTag/diction.py
SegAndTag/diction.py.bak
SegAndTag/seg.py
SegAndTag/seg.pyc
SegAndTag/selecttool.py
SegAndTag/selecttool.pyc
SegAndTag/viterbi.py
SegAndTag/viterbi.pyc
SegAndTag/word.py
SegAndTag/word.pyc
SegAndTag/__init__.py
data/dict.dat
data/diction.txt
data/segoutput.txt
data/tagoutput.txt
data/testinput.txt
data/utf8train.txt
SegAndTag
data
本网站为编程资源及源代码搜集、介绍的搜索网站,版权归原作者所有! 粤ICP备11031372号
1999-2046 搜珍网 All Rights Reserved.