Chinese NLP
- chinese-poetry/chinese-poetry
- 中华古诗词数据库
- InsaneLife/ChineseNLPCorpus
- fighting41love/funNLP
- 中文 NLP 资源库
- crownpku/Awesome-Chinese-NLP
- brightmart/nlp_chinese_corpus
- cobaltdisco/Google-Chinese-Results-Blocklist
- ymcui/Chinese-BERT-wwm
- hankcs/HanLP
- 中文 NLP
- baidu/lac
- LAC - Lexical Analysis of Chinese
- 百度 NLP:分词,词性标注,命名实体识别,词重要性
- blmoistawinde/HarvestText
- 文本挖掘和预处理工具
- NLPchina/ansj_seg
- 中文分词
- https://github.com/PaddlePaddle/PaddleClas
公司机构名称
- verarong/CompanyNameMatch
- 公司、企业名称模糊匹配,基于词频的公司名 主体提取,基于编辑距离的匹配度
- 基于 jieba 分词、数百万家企业名称分词后词频统计,提取公司名称中的各类型信息,并依据业务需求计算匹配分值
- weight.csv
- 110 万行
- wainshine/Company-Names-Corpus
- 公司名语料库 - 机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。
- hujunxianligong/abbrs
- 公司名简称生成