问题 在只考虑重力的作用的情况下,一质点从点A沿某条曲线到点B,问怎样的曲线能使所需时间最短? 这一问题被称为最速降线问题(Brachistochrone),由约翰·伯努利在1696年提出来挑战欧 ...
问题 在只考虑重力的作用的情况下,一质点从点A沿某条曲线到点B,问怎样的曲线能使所需时间最短? 这一问题被称为最速降线问题(Brachistochrone),由约翰·伯努利在1696年提出来挑战欧 ...
神经元 3B1B先讨论最简单的MLP(多层感知器),只是经典的原版,就已经能识别手写数字。 这里一开始我们把神经元看作装有数字的容器,装着一个0~1之间的数字。但是最后更准确一些,我们把神经元 ...
问题 对于任意的闭合环路,是否总能在其上找到四个点形成一个矩形? 该问题也被称为内接矩形问题,而内接正方形问题至今没有解答方案。 首先我们不再关注单个而是成对的点,并利用矩形的性质:对于平 ...
问题 在圆上任取$n$个点,将每对点用直线连接起来,并规定任意三条线不能交于同一点,这些直线会将圆分割成多少份? 首先我们列出简单情况来寻找规律: 2个点将圆分成2份 3个点将圆 ...
代价函数 在一开始,我们会完全随机地初始化所有的权重和偏置值。可想而知,这个网络对于给定的训练示例,会表现得非常糟糕。例如输入一个3的图像,理想状态应该是输出层3这个点最亮。 可是实际情况并不是这 ...
直观理解反向传播 反向传播算法是用来求那个复杂到爆的梯度的。 上一集中提到一点,13000维的梯度向量是难以想象的。换个思路,梯度向量每一项的大小,是在说代价函数对每个参数有多敏感。 如上图 ...