搜索资源列表
P0801
- 索书号文字图像分割 索书号文字图像分割-Call text image segmentation Call text image segmentation
siuying_segment
- 「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
shixi
- 首先提取印刷品的数字图像,对图像进行预处理,然后用模板匹配将图像中的文字部分分割出来,在提取文字图像的特征参数,最后对照标准样张图像的特征参数分析该印刷品的印刷质量,得到质量数据。-First extract the print of digital image, the image preprocessing, and then the text part of the image segmentation with template matching, text image feature