智障四人组的表情包很快在计算机学院流传开来。
其中一张流传最广的表情包,是四人对着小白板上的一个“S”字母冥思苦想。然后不知哪位好事者正好路过给拍了下来,然后在小白板上“S”字母旁边,P上了一个“B”。
信息年代,传播飞快。
这个表情包很快就传遍了整个金陵大学。
好事者们给它取了个名字--名画:智慧的凝视。
然后,在金陵高校圈子里也传开了。最后,上了金陵晚报的头条,成为了金陵城一连几日街头巷尾的谈资。
这主要是金陵大学的四位天之骄子,对着“S”和“B”两個字母如此深思,给人视觉反差太大。
以至于金陵日报的记者都向校方约稿想采访,结果自然是被主管行政的副校长给婉拒了。
但是风波已经起来了。为此,王教授在计算机学院发飙了。
“哪个龟儿子拍的这张照片,以后还想不想毕业了。”
可即便如此,也架不住学生们恶搞的热情。
于是,那张表情包的小白板上的内容被换成了各种事物。
比如:“元芳,你怎么看。”
再比如:国足对着空门一脚打了飞机。
但其实,那一天四人是在深思算法。
由于数字只有10个,但如今即便只是识别英文和标点,就已经是好几十个不同符号。这其中的复杂度一下子上升了很多。
如果无脑套用原来的SVM多分类方法,先不说准确率,光是计算量就会成倍增加。就实验楼的这些破电脑,跑这种级别的运算,绝对是不可能的。
所以,齐凡等人很头疼。他们需要在保证准确率的同时,又得精简算法,以便降低运算量。
在经过多次的失败尝试之后,齐凡大胆提出设想--不再将符号识别当成分类任务,而是应该当成回归任务。
所谓的回归,其与分类的本质在于:分类是预测结果集合中的一个值,而回归则是输出一个预测数值。
回归适合的是类似波士顿房价预测那种,预测一个变化的值,而不是数字识别这种,预测一个数字。因为数值是变化的,但是数字再怎么变,也跳不出0~9的范畴。
于是齐凡转换思路。他提出不再输出一个预测的符号,而是输出每个符号对应的概率。这样一来,就把分类任务变成了回归任务。
就好比,原先模型预测的结果是:0~9这几个数字。现在模型预测的结果是0~9各自对应的概率。最终的结果可取概率最大的那个数字。
在几人连着熬了几晚后,模型确实可行,无论是复杂度还是计算量都大大降低了。可错误率却是一言难尽,达到了可怕的80%。