月之影面_第四十三章牛刀小试

回到酒店，王一男打开随身携带的笔记本电脑，启动  Free  Mind，开始整理自己的思路。

    人工智能是当前的热点，而神经网络又是热点中的热点，但是除了极少数领域，比如说车牌识别，或者极少数个例，比如说米歌的围棋狗以外，在实践中很少看到具体的应用案例。

    造成这种情况的原因很简单，那就是神经网络对硬件的依赖性，在普通的x86电脑或者基于ARM芯片的手机上不是不能运行神经网络，但是运行的效率绝对会让你发狂。

    还有神经网络那庞大的数据量，全部装到手机里面几乎是不可能的。

    所以，目前的神经网络应用是极度依赖硬件的，这也就限制了它的应用范围，反正你记住，在普通的手机上几乎跑不起来一个实用的神经网络就对了。

    但是有了王一男的新发现和新技术就完全不一样了，对样本的整理和训练这一步没有捷径可言，老老实实的在专用硬件上花很长时间进行就好了，这也不是问题的焦点所在。

    但是一旦训练完成，神经网络稳定之后，王一男就可以利用一系列的数学工具，以及形式化技巧，根据神经网络的类型，对庞大的神经网络数据进行分块的指令化。

    简单的理解，可以认为将神经网络这种多层迭代的运行方式，映射成普通冯诺依曼机器的运行方式。

    具体而言，比如说对于其中1/8的神经网络分块，映射为一种通用的冯诺依曼机器指令，比如说，JAVA或者LLVM的字节码吧。

    你可以认为王一男找到一种编译方法，可以将神经网络的数据，编译成一种通用的字节码，再利用现成的JIT（即时编译）技术，或者LLVM的编译技术，得到可执行的PC或者手机程序。

    最后，再将所有的分块组合起来，就能得到任何训练后的神经网络，在PC或者手机上的编译版本。

    也就是说，制约人工智能发展的最大的障碍，硬件的限制现在完全不存在了，只要在专用的硬件上用足够的样本训练出符合要求的神经网络，然后利用王一男的技术，就能够将这个训练好的神经网络编译到普通的PC甚至手机上，从而得到一个可以完成同样任务的手机APP。

    我再举一个具体的例子，大家就明白了，目前哥鲲鹏2.0通过训练，学会了如何最高效率的飞行，但是它没办法直接教给人类怎么飞行，而且又不能将哥鲲鹏带上天，直接让它指挥飞机怎么飞。

    所以现在王一男和杨总师采用的方法是，自己编写飞控软件，然后让哥鲲鹏来找到里面的缺陷，经过多次迭代来改进人类编写的飞控软件，从而获得质量不错的飞控软件。

    有了王一男的新技术，现在可以直接将哥鲲鹏的神经网络，编译到飞控计算机的指令集，比如说Alpha体系，编译后的程序，实际上就是最好的飞控软件了！

    不能理解、无法描述都没关系，能执行就行！

    就算给新型号战绩加上矢量发动机，那也不过是多训练两天，重新编译一下的功夫，立马就能得到最牛的飞控软件了。

    “这把玩大了”，王一男在电脑上敲完上面的几句话，搓着手，不知道该说啥。

    说真的，要是CIA、FBI之流知道王一男现在做的事情，估计就算把他们在整个华国的特工都派过来，也要把他绑架走。

    当然，具体要完成这个构想，还需要大量的时间和工作，需要整理所有的神经网络的类型，以及对应的数学工具，还要针对不同的数据生成抽象的指令序列。

    仅仅使用数学工具形式化的神经网络数据，一定是冗长的，为了达到实用化的程度，需要对代码进行精简和优化，当然这方面可以发挥哥德尔系统的特长。

    最好能够将整个过程自动化和程序化，不过这个倒不是很着急，人的智慧配合机器来工作，一向是最快速最有效率的方案。

    王一男打消了找116所第一个吃螃蟹的想法，虽然这样一定会很爽的，但是116所的最新隐身战斗机不要说华国了，整个蓝星多少双眼睛盯着，要是一不小心弄出一个惊天动地的飞控出来，王一男用脚趾头都能想到动静有多大，显然这绝对违背了他低调的初衷。

    还是闷声发大财的好，王一男把注意力集中在大卫计划上，或者准确的来说，大卫计划的一个点上，要知道，现在大卫计划最大的问题，是缺乏一个杀手级别的应用，要那种远远超过别人的功能和效果。

    基本的聊天功能，再怎么样也很难玩出花来，只有在现在并不是很成熟的一些领域上做文章了，比如说多人视频聊天。

    目前视频聊天技术的主流是Ｈ264，这也是大部分手机硬件都支持的视频编解码技术，对于一对一的视频聊天来说，只要对分辨率的要求不太高，效果还过得去。

    当然，要想效果好，还需要更新的技术比如说H265，或者米歌搞的VP10，啊不对，因为H265的专利问题，一堆业界大拿凑在一起开了一个新的项目，叫做开放媒体联盟，他们搞了一个成人影片一号格式，不对，是音频视频一号格式（AV1），号称比Ｈ265效率还要高。

    不管H264还是H265还是AV1，都是按照传统的方法对视频，或者说连续的图像流进行压缩的，也就是将视频在频谱上进行处理，减少人眼不太关注的部分，然后通过对时间域的分析，去掉相邻图像帧之间的重复部分等等。

    当然在这中间，利用分块技术减少运算复杂度，或者自适应分块技术，在编码效率和编码质量之间进行自动的权衡。

    王一男决定独辟蹊径，完全按照神经网络的方式来处理问题，就像米歌的狗狗Zero版本一样，他抛弃了所有预先的知识，甚至包括频率的概念。

    神经网络唯一的输入来源是图像的序列，评价算法的质量标准是解码之后图像序列跟原始图像之间的偏差，这是有一个人眼视觉方差评估办法的。

    采用这样的方法对神经网络进行训练，王一男将算法时间也作为训练的一个基本参数，也就是说，最小的大小，最快的时间，最小的人眼视觉方差，用所有能获得的样本进行训练。

    王一男回到帝都之后，简单跟大卫计划的团队碰了碰，看了看他们的原型，然后要求团队开始针对原型系统的问题，开发2.0版本，重点是可扩展的架构，以及服务的稳定性。

    而他自己又开始闭关了，学校显然不是一个很好的闭关地点，周慧家就更不是了，王一男把自己关在容与公司的大本营，这样也好，离哥德尔系统更近一些。

    闭关时候的王一男，就像完全变了个人，六亲不认，目光呆滞，和平常那个平民模样的年轻人完全对不上号，整个就是一个疯狂科学家的形象，不过呢，效率确实高的惊人。

    周慧忍不住去容与公司看了他两次，结果每次呆不了多一会就狼狈逃窜了，用她的话来说，太瘆人了，王一男大部分时间坐在键盘前面疯狂的打字，有时候像一个目光没有焦距的幽灵一样在办公室里面飘来飘去，嘴里还念念有词，真是吓死人不赔命。

    哥德尔系统开始利用无数的视频样本开始训练，什么youtobe，什么爱艺，什么又酷，反正王一男给哥德尔系统买了无数个VIP账号，疯狂的让它看视频，至于会不会走火入魔，那就不是王一男考虑的范畴了。

    但是这些视频样本的数量貌似不太够啊，关键是基本上所有的素材都经过了各种后期处理，或者美颜啊，或者剪接啊，反正对于神经网络学习来说，不是原生态的，噪声有点多。

    这个时候，王一男不禁要感谢王校长引发的直播风潮了，除了为风投找到一个疯狂砸钱的红海，为部分二次元屌丝男女提供致富的渠道以外，无数直播软件，还给哥德尔系统提供了无数真实的视频样本。

    于是在容与公司总部，无数直播的视频流被接了进来，然后转换成哥德尔系统一个视频压缩的专用神经网络权重。

    这可是一个抛弃了所有先验知识的神经网络，没有傅里叶分析，没有小波分析，没有运动预测，没有分块，更没有离散余弦变换。

    神经网络的目标也很明确，压缩原始的视频数据，或者说时间域上的离散图像帧，用尽可能小的尺寸、尽可能快的速度、还有尽可能小的人眼视觉方差，至于原理是什么，谁关心呢？

    王一男的任务很简单，也很繁重，他要找到一系列的数学工具，形式化技巧，并且把这些程序化，这样哥德尔系统就能将训练完成的神经网络编译成LLVM的字节码，

    再经过多次迭代，优化之后，最终得到一个精简版本的LLVM字节码，

    这些字节码，就可以定位到特定的CPU架构中，比如说X86或者ARM，得到可以实际工作的压缩、解压缩程序。

    不知道哥德尔系统看多了直播，会不会学会东北话，想来是不会的，不过王一男坚决没让哥德尔系统用那个发抖短视频来训练，科学家也是有洁癖的，“那么Low的东西，就污染我好了，别污染哥德尔系统了”，王一男想。

    时光荏苒，这期间，王一男还去上了两堂课，陪周慧看了两次电影，毕竟，疯狂的科学家还是个正常人不是。

    哥德尔系统的视频压缩神经网络也逐步的稳定下来了，编译到LLVM指令的工作还没完成，王一男迫不及待的要先看看直接用神经网络进行视频压缩的效果，毕竟，要是还没有H265强，那还不如洗洗睡了呢。

    他选中了一个蓝光的4K分辨率片源，就是那种电视机厂商用来做广告的几分钟的短视频，使用H265标准压缩后，大小大概是700M。

    将H265视频输入到FFMPEG，解压出JPEG格式的每一帧图像数据，再送往哥德尔系统，这中间当然会有画质损失，不过王一男已经顾不得那么多了，

    他屏住呼吸，两眼紧盯着屏幕。

(https://www.duoduoxs.cc/biquge/42_42373/c16072326.html)

1秒记住笔趣阁网：www.duoduoxs.cc。手机版阅读网址：wap.duoduoxs.cc

第四十三章 牛刀小试

第四十三章牛刀小试