循环神经网络的从零开始实现 讨论区


#102

你好 这个问题解决了吗? 我也碰到这个问题


#103


这里的label 不需要转换成one-hot形式嘛,还是在softmax中直接能将索引转换呢?


#104

不需要,
你可以参考最近修订的这一节:
https://zh.gluon.ai/chapter_supervised-learning/softmax-regression-scratch.html#定义损失函数


#105

改成open(’…/data/jaychou_lyrics.txt’,encoding=‘utf-8’)


#106

也遇到了这个问题
6.3.4 歌词数据集章节
对于代码

with zipfile.ZipFile(’…/data/jaychou_lyrics.txt.zip’, ‘r’) as zin:
zin.extractall(’…/data/’)
with open(’…/data/jaychou_lyrics.txt’) as f:
corpus_chars = f.read()
corpus_chars[0:50]

执行时产生错误

UnicodeDecodeError Traceback (most recent call last)
in ()
3
4 with open(’…/data/jaychou_lyrics.txt’) as f:
----> 5 corpus_chars = f.read()
6
7 corpus_chars[0:50]
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa6 in position 4: illegal multibyte sequence

修改代码(增加:,encoding=‘utf-8’)为

with zipfile.ZipFile(’…/data/jaychou_lyrics.txt.zip’, ‘r’) as zin:
zin.extractall(’…/data/’)
with open(’…/data/jaychou_lyrics.txt’,encoding=‘utf-8’) as f:
corpus_chars = f.read()
corpus_chars[0:50]

得到结果为:

‘想要有直升机\n想要和你飞到宇宙去\n想要和你融化在一起\n融化在宇宙里\n我每天每天每天在想想想想著你\n这’

@astonzhang 请问aston, 这个地方是不是可以直接在教程里面加上这个参数呢? 会影响到其他平台吗? 谢谢


#107

已修改,多谢!

p.s.: 你是按顺序学的吗?学得好快 :grinning:


#108

谢谢, :slight_smile:
是的呢, 新手一枚, 要请多指教啊,
我的习题部分做的不充分, 可能题目还要重新来一遍,
谢谢啊


#110

问一个小白问题啊,图中的这个逗号作用是什么
image
用了这个逗号之后,就可以通过state_new[0].shape来获取shape了,为什么会这样


#112

想问为什么改成tanh改成relu之后perplexity都是nan啊?


#113

您好,想问一下。问什么在使用to_onehot()时,总是出现segment fault


#114

现在已经确认是nd.arange.reshape那里出了问题。但还是不知道为什么


update

  • nd.arange(10).reshape(2,5)会出错,segment fault
  • nd.reshape(nd.arange(10), shape = (2,5))就不会出错

#115

mxnet 是什么版本?
nd.arange(10).reshape((2,5))呢


#116
  • 将相邻采样改为不从计算图分离隐藏状态,运行时间有没有变化? 有没有人回答下detach()这个函数干嘛的?

#117
  • 将相邻采样改为不从计算图分离隐藏状态,运行时间有没有变化? 有没有人回答下detach()这个函数干嘛的?
    同问!!!
    @astonzhang

#118

@wangyangVIP234

第十五课52分钟开始讲解了一下


#119

我也是不知道 但是后来自己推理推理 一下懂了好多


#120

歌词生成有没有必要用 seq-to-seq 来做呢?我看有同学用 transformer 这种 seq-to-seq 模型来做。


#121

训练歌词的时候模型输出值可能是小数或者负数,这样导致没法做 index to word 了,没法把 index 转成对应的 word 了,请问这里怎么处理的?谢谢!


#122

到了RNN这部分,不看视频就完全看不懂了。很多知识都没有写在notebook中,建议看看B站上的课程视频。


#124

请教个问题,视频课件里老师说输入nx n是批量,x是输入字符的向量,为什么输出的Y变成ny了 y是下一个字符可能的个数,没明白,按照常规理解,y应该也是最有可能的出现的字的向量.