求近义词和类比词 讨论区


#1

http://zh.diveintodeeplearning.org/chapter_natural-language-processing/similarity-analogy.html


#3

跑个demo跑了一下午,太慢了,跑到这里就卡住了:

glove_6b50d = text.embedding.create('glove', 
                                    pretrained_file_name='glove.6B.50d.txt')

一直在下载

Downloading /Users/Echo/.mxnet/embeddings/glove/glove.6B.zip from https://apache-mxnet.s3-accelerate.dualstack.amazonaws.com/gluon/embeddings/glove/glove.6B.zip


#4

这个只有第一次使用需要下载。fasttext wiki.simple.vec加载多久


#5

开始也以为卡住了,可能跑了几分钟吧


#6
my_vocab = text.vocab.Vocabulary(counter)
my_embedding = text.embedding.create(
    'fasttext', pretrained_file_name='wiki.simple.vec', vocabulary=my_vocab)
my_embedding

请问报这个警告是bug吗?

/Users/Echo/miniconda3/envs/gluon/lib/python3.6/site-packages/mxnet/contrib/text/embedding.py:278: UserWarning: At line 1 of the pre-trained text embedding file: token 111051 with 1-dimensional vector [300.0] is likely a header and is skipped.
‘skipped.’ % (line_num, token, elems))


#7

在国内可以把MXNET_GLUON_REPO变量设成https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/,方法参考 http://zh.gluon.ai/chapter_prerequisite/install.html#conda


#8

这是个友好的警告,可以忽略


#9

我跑程序的时候下载的也非常慢,然后我打开链接在浏览器中下载了,很快,然后拷贝到相应的文件夹下,程序也能运行,速度还挺快。


#10

请问对应的文件位置是?


#11

我用的是windows。两个文件分别拷贝在了C:\Users\wenxue.mxnet\embeddings\fasttext和C:\Users\wenxue.mxnet\embeddings\glove下。


#12

谢谢了,已经解决。


#13

请问下怎么使用这个呢?


#14

更新了吗?
pip install mxnet --pre --upgrade


#16

更新失败,但是已经是管理员权限了·~····


#17

应该是mxnet吧


#18

什么意思?


#19

如果卸载了重新安装呢
pip uninstall mxnet
pip install mxnet --pre


#20

fasttext里并没有wiki.zh.vec,报错?想问中文预训练的词向量是什么?


#21
from mxnet.contrib import text
zh = text.embedding.create('fasttext', pretrained_file_name='wiki.zh.vec')

#22

教程中my_embedding = text.embedding.create(
‘fasttext’, pretrained_file_name=‘wiki.simple.vec’, vocabulary=my_vocab)怎样导入下载在本地的词向量?

下载了glove.6B.zip词向量到本地,怎样指定访问路径,让mxnet去读放在本地特定路径下的预训练词向量文件