准确是两个概念。准是 bias 小,确是 variance 小。准确是相对概念,因为 bias-variance tradeoff。
——Liam Huang

在机器学习领域,人们总是希望使自己的模型尽可能准确地描述数据背后的真是规律。通俗所言的「准确」,其实就是误差小。在领域中,排除人为失误,人们一般会遇到三种误差来源:随机误差、偏差和方差。偏差和方差又与「欠拟合」及「过拟合」紧紧联系在一起。由于随机误差是不可消除的,所以此篇我们讨论在偏差和方差之间的权衡(Bias-Variance Tradeoff)。

阅读全文 »

前文说了,浮动体主要是处理高度比较大,又不方便分割的内容:比如图片和表格。实际上,此类内容除了在高度上可能很高,它们也可能很宽。LaTeX 在水平方向,会贴着版芯的左边边界,开始排列内容。因此,如果一张图片或者表格的宽度超过了版芯的宽度,那么看起来就像是没有居中,而是偏右。

此篇我们讲一下如何处理此类情况。

阅读全文 »

此篇介绍一下 LaTeX 中的浮动体基本概念,以及最常见的几个问题。

浮动体是什么

在实际撰写文稿的过程中,我们可能会碰到一些占据篇幅较大,但同时又不方便分页的内容。(比如图片和表格,通常属于这样的类型)此时,我们通常会希望将它们放在别的地方,避免页面空间不够而强行置入这些内容导致 overfull vbox 或者大片的空白。此外,因为被放在别的地方,所以,我们通常需要对这些内容做一个简单的描述,确保读者在看到这些大块的内容时,不至于无从下手去理解。同时,因为此类内容被放在别的地方,所以在文中引述它们时,我们无法用「下图」、「上表」之类的相对位置来引述他们。于是,我们需要对它们进行编号,方便在文中引用。

阅读全文 »


悲剧!

如题图,GitHub 在北京时间 2017 年 2 月 23 日晚在中国大陆地区大部无法正常访问。那么,你挂在 GitHub 上的仓库们还好吗?

此篇介绍如何为 Git 仓库重新设置远程仓库。

阅读全文 »

这是一篇简单的记录。

git

  • 使用 git diff 命令可以查看工作区与暂存区之间的差异。
  • 使用 git diff <gitreversion> 命令可以查看工作区与指定版本之间的差异。
  • 使用 git diff --cached 命令可以查看暂存区与当前 HEAD 指针指向版本之间的差异。
  • 使用 git diff --cached <gitreversion> 命令可以查看暂存区与指定版本之间的差异。
  • 使用 git diff -- <file> 可以查看特定文件在工作区与暂存区之间的差异。
  • 使用 git diff <gitreversion> -- <file> 可以查看特定文件在工作区与指定版本之间的差异。
  • 使用 git diff --cached -- <file> 可以查看特定文件在暂存区与当前 HEAD 指针指向版本之间的差异。
  • 使用 git diff --cached <gitreversion> -- <file> 可以查看特定文件在暂存区与指定版本之间的差异。
阅读全文 »

模板是一个 C++ 的高级特性,它使得程序员可以编写一个类或者函数,以相同的方式处理不同类型的数据。

前段时间在网上看到,有人认为类模板的成员函数必须实现在类模板的定义当中。这与我一直以来的认知是冲突的——我认为类模板和普通的类其实没有什么差别,除了它需要做额外的实例化之外。于是,我翻看了 C++ Primer,并检索了一些资料,就有了这篇文章。

阅读全文 »