这里面的机器学习最简要素之
结构数据:Jupyter notebook(里面有文本,图片和代码)、网页、租车单和电费表
这里的结构数据指的是结构化数据吧?如果是的话,那么像网页这种应该属于非结构化信息,是否是表述有纰漏呢?
一个常见语法分析的例子是,给定一个本文序列,如何找出其中的命名实体,例如人物姓名、城市名称等。以下是一个这样的例子。其中Tom、Washington和Sally都是命名实体。
发现了一处笔误。。
其实网页也是有结构的数据
网页应该属于半结构化数据
之前始终想要琢磨机器学习, 总会因为突入起来的数学概念弄得云里雾里, 这一次仍然选择继续前行
笔者之一曾经做GRE真题时次次拿高分,高兴之下背了一遍红宝书就真上阵考试了,结果最终拿了一个刚刚够用的低分。后来意识到这是因为红宝书里包含了大量的真题。
这句话的意思是说,由于错误得选择了复习材料,导致训练误差很低,误判了测试误差吗?
看了很多机器学习的入门,感觉这里的确写的不错,有一些自己独到的思路,比如谈到,是数据编程等等。我感觉很不错,我尽量把这个正儿八经的学完。加油!
使用hybrid_forward 的时候报了: hybrid_forward() got an unexpected keyword argument ‘weight’
的错误,求大神指教。
可以静下心来学习这么好的课程,也是幸福。
对于过拟合的解释
因为验证集选取不当,加上过拟合
为什么应该让深度网络模仿人脑结构?为什么不该让深度网络模仿人脑结构?
这个问题的理解:人脑结构是一个启示方向,但是不能完全模仿,容易造成过拟合而无法完全实现导致停滞不前,可以采用相近可实现简化的方案来实现。
煤炭和数据的区别:煤炭不可再生,数据可再生。从这个角度来说,人工智能是不是更可持续发展哈哈。
这个角度很有意思
great example it is!
中英文版本内容差别貌似很大呢
有意思!