随着AlphaGo战胜了围棋世界冠军李世石,大数据和人工智能已经离我们越来越近了。微软根据人们在必应上搜索票价的行为,可以预测未来机票的价格走势;谷歌利用用户的搜索记录来判断美国流感疫情的现状,会比疾控中心快一到两周的时间;美国有一些对冲基金通过剖析社交网络推特的数据信息来预测股市,也取得了不错的成绩;亚马逊更是根据用户在其网站上的历史查询来进行产品的实时推荐......
大数据带给大家一种全新、多维的思维方式。如果我们用大数据来分析《红楼梦》,又会有什么样的结果呢?我们用大数据分析《红楼梦》,能否超越研究了几十年红学的红学专家如刘心武呢?
答案是肯定的。刘心武研究《红楼梦》主要采用的是草蛇灰线的方法。一条蛇从草丛穿过,不会留下脚印,但是因为蛇有体重,还是会留下一些不明显却仍存在的痕迹,即灰线。草蛇灰线这个成语比喻事物留下隐约可寻的线索和迹象。《红楼梦》里面有很多草蛇灰线的写法,曹雪芹用草蛇灰线暗示了书中人物的结局。如在《红楼梦》中第三十回中金钏跟宝玉说过一句:“金簪子掉在井里头”,结果金钏的结局确实是跳井而亡的!
刘心武不仅通过草蛇灰线针对《红楼梦》给出了很多有趣的分析结论,而且还根据此方法续写了《红楼梦》。草蛇灰线这种一个线索一个结论的方法,有点像盲人摸象,你摸到大象的耳朵就说大象像蒲扇,你摸到大象的脚就说大象像树桩。虽然盲人摸来摸去能摸到一些东西,但是盲人却无法知道大象的全貌。
很多人认为大数据的核心是算法,其实对于大数据来说,更重要的是模型。为什么AlphaGo能战胜围棋冠军,而很多围棋程序却连围棋初学者都下不过?核心还是AlphaGo底层的模型可以涵盖各种围棋的变化,包括局势判断、打劫、对杀等。蒙特卡洛之类的算法只是帮助AlphaGo找到最优解,但是如果模型设计的太复杂,每一种情况都需要不断创新新的模型或者对模型进行修改来应对,你即使有最好的算法,因为模型和系统的复杂性,也很难找到最优解的。在大数据中,可以通过建立统一数据模型解决了盲人摸象局限性的问题,我们在一开始就构建了大象的统一数据模型。随着数据的不断输入,我们就能逐渐判断出大象的耳朵,大象的腿,最终能判断出一头大象。统一数据模型打破了传统的关系型数据库,关系越多,系统越复杂的痛点,让数据越多,模型越清晰。
刘心武根据草蛇灰线续写《红楼梦》的人物结局如下:
贾宝玉:与宝钗结为连理,后因不愿入仕而出家,经甄宝玉提点还俗,历经贾家彻抄、牢狱等大惊大险后,大彻大悟,悬崖撒手,回归天界,恢复神瑛侍者身份。
林黛玉:绛珠仙草黛玉夙愿已还,泪尽血现,遁水仙去,沉湖而死。
薛宝钗:与宝玉成婚后,想尽一切办法引导丈夫走仕途经济之路,不想反而逼走了宝玉,宝钗心力交瘁,染病而亡。
王熙凤:被贾琏贬为侍妾,且于贾家被抄后沦为阶下囚,在押回金陵老家途中,不堪凌辱,投江自尽。
在第六十八回里凤姐大闹宁国府的章节中,有以下的文字:“再者咱们只过去见了老太太,太太和众族人,大家公议了,我既不贤良,又不容丈夫娶亲买妾,只给我一纸休书,我即刻就走。”这种草蛇灰线的写法预示了王熙凤最终被贾琏所休。所以刘心武通过草蛇灰线预测对了王熙凤被休,但是王熙凤是否是投江死的呢?我在这里先卖个关子,刘心武虽然潜心研究红学几十年,但是由于其没有有大数据这样的武器,最终还是落得个盲人摸象只知其一不知其二的结局。而且,刘心武关于林黛玉的死的预测也是错误的。林黛玉是所有人中间死的最惨的,刘心武想到葬花,想到林黛玉楚楚怜人的身体,为其设计出沉湖而死的结局。然而根据大数据的演算,这个结局也是完全错误的。
有红学家说《红楼梦》是曹雪芹的半自传的小说,还有红学家考证出曹雪芹小时候也喜欢吃胭脂,是贾宝玉的化身。在《红楼梦》的第一回中,焦大骂到:你们扒灰的扒灰,养小叔的养小叔。谁会如此这般地写自己家的家事呢?俗话说:家丑不可外扬,莫非唯独曹雪芹是个特例?其实是这些红学家进入了不研究全局,只研究局部的误区。如果不建统一数据模型,只
本文编辑:佚名
转载请注明出地址 http://www.wugentenga.com/wgtyy/8001.html