Chinese NLP
- chinese-poetry/chinese-poetry
- 中华古诗词数据库
 
 - InsaneLife/ChineseNLPCorpus
 - fighting41love/funNLP
- 中文 NLP 资源库
 
 - crownpku/Awesome-Chinese-NLP
 - brightmart/nlp_chinese_corpus
 - cobaltdisco/Google-Chinese-Results-Blocklist
 - ymcui/Chinese-BERT-wwm
 - hankcs/HanLP
- 中文 NLP
 
 - baidu/lac
- LAC - Lexical Analysis of Chinese
 - 百度 NLP:分词,词性标注,命名实体识别,词重要性
 
 - blmoistawinde/HarvestText
- 文本挖掘和预处理工具
 
 - NLPchina/ansj_seg
 - 中文分词
 - https://github.com/PaddlePaddle/PaddleClas
 
公司机构名称
- verarong/CompanyNameMatch
- 公司、企业名称模糊匹配,基于词频的公司名主体提取,基于编辑距离的匹配度
 - 基于 jieba 分词、数百万家企业名称分词后词频统计,提取公司名称中的各类型信息,并依据业务需求计算匹配分值
 - weight.csv
- 110 万行
 
 
 - wainshine/Company-Names-Corpus
- 公司名语料库 - 机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。
 
 - hujunxianligong/abbrs
- 公司名简称生成