gluon-nlp 有基于中文数据的pretrian model么

gluon-nlp的pretrain model 貌似都是基于wikitext-2数据,没有基于中文数据的pretrain model 么

目前还没有
对于语料有什么建议吗?

@hankcs 有没有什么建议 :grin:

抱歉好久没登陆了,比较大的中文语料库有百度百科,还有这个:https://github.com/brightmart/nlp_chinese_corpus。