原创新闻

首页 原创 宏观

期货金融

国际 股票 基金

独家观察

要闻 外汇

当前位置:首页 > 要闻

看了《长安十二时辰》,你还相信大数据吗?

2019-08-05 01:13:33

  作者 |江湖豆腐

  数据撑持 | 勾股年夜数据

  比来《长安十二时辰》热播,很多不雅众不断悬心于张小敬和小李必的存亡,一边看一边发弹幕刷屏,但实践上这两团体有配角光环护体,可以被折腾得很惨,但相对不会死。

  假如要猜想一下存亡,却是可以猜猜靖安司主事徐宾的终局。这厮原本曾经死两回了,但终究都活了过去。作为一个龙套,他是一个生命力固执的龙套,最初死不死还真有点难说。(我晓得谜底,看过原著的,请不要在留言区剧透。)

  明天我就想跟年夜家聊一下这位徐主事,和他的年夜文案术。

  1

  奇异的年夜文案术

  明眼人一看就晓得,所谓的“年夜文案术”这个词是马亲王诬捏的,这玩艺儿实际上是年夜数据在剧中的实践使用。

  年夜文案术分两局部组成,一个是由靖安司从遍地调来的各类明档、密档组成的数据库,一个是以徐宾为中心的信息处置小组。

  这个套路和今世的年夜数据剖析实质上是一样的。

  今世年夜数据的根底是各类数据的信息汇集,和顺序对这些数据信息的回类、归纳。靖安司主事徐宾,在靖安司这个零碎里,充任的是地方处置器的脚色。

  那末,有些人能够就会奇异了,“年夜数据”是一个很新的概念,为何前人也会呢?

  实在,“年夜数据”作为新辞汇,的确是比来几年才呈现,但这事儿自身其实不别致。今世的年夜数据财产胜在手艺手腕上,但这事自身而言,自古以来全球人类都曾经在做了。

  考古发现,早在公元前18000年的旧石器时期,就有很多部落领袖在骨头、石器上刻下印记,来记载部落仓库里的各类物料,并以此推算将来,比方仓库里的食粮还够全数落吃几天之类。

  公元前300年摆布,古埃及托勒密王朝树立了亚历山年夜藏书楼。这不是人类第一座藏书楼,但它的躲书简直涵盖了事先人类常识的一切范畴,可以以为,它就是事先最齐备的数据存储中间。不外,它后来毁于烽火了。

  中国人自古以来就有存储数据的习气,比方年夜家看到的各类史乘,实践上在前人眼里,那就是存储起来的数据。经过对汗青数据的剖析,在朝团队可以对时下的政策作出响应的调剂,以失掉或许防止某种后果。

  为了包管推演的进程中发生的偏向尽量地小,人们关于根底数据的真实性要求长短常讲究的。比方,当局对史官的要求是“秉蜿蜒书”,东汉以来的“起居注”,更是以法令方式来保证根底数据的真实性。国度法令规则,帝王不克不及看起居注,更不克不及窜改它,假如他必然要看,史官必需写下“某年代日,上阅起居注”;假如他必然要改,史官必需对窜改前的原文回档,并对窜改之事做记载。

  但是伶俐的你,必然会大白,这类束缚帝王的法令实在一点屁用都没用,地道是个花架子。

  根底数据库的树立乃至可以追溯到史前文明期间,但真正迷信意义上的数据剖析则是另外一回事了。

  1663年,一名叫约翰·葛兰特的英国人,用他记载上去的黑死病灭亡人数信息,树立起了晚期的卫生防疫预警零碎实际。这是人类史上第一次有记载的统计数据剖析尝试。

  特地一提,这位英国人实在其实不是严厉意义上的迷信家,他是做布疋生意的商人,专业有点这方面的小喜好,成名以后才被人视为迷信家的。

  所以,年夜家也能够如许对待年夜唐天宝年间的徐宾。他实际上是一名造纸商人,专业有个弄数据剖析的小喜好,后来兼职在靖安司做了数据中间主管。

  这也能够诠释为何每次靖安司年夜难临头的时分,徐宾都溜号回家往造纸。很明显,他可不肯意为了一份兼职把命搭上,忒不值当的,仍是造纸更主要一些。

  良多年后,人类创造了无线电波,创造了计较机,创造了互联网,还创造了5G,这些新的迷信成绩都被不时地被使用到数据存储和剖析处置范畴。

  年夜数据时期降临。

  2

  年夜文案术可托吗?

  《长安十二时辰》里,徐宾刚进场的时分,是一个装神弄鬼的脚色。

  固然,他装得挺有典礼感,每次都把靖安司的人唬得一愣一愣的。

  徐主事阅卷之前肯定先净手,阅卷以后再慎重其事地封好档案,然后整肃衣冠,一边闭着眼睛想台词,一边用双手捻动脖子上挂着的珠子,暗示他人他并没睡着。要过上那末一会儿,他才会展开眼睛跟旁边的人说,工作本来是这么这么回事儿。

  原本徐宾的忽悠不断挺顺遂的,可是他的下属小李必固然少不经事,却究竟结果不是一个智障。有那末一回,小李必终究开端疑心徐宾,后果一查,工作果真有猫腻。

  可想而知,小李必事先的心里一定是有一万只草泥马飞跃而过:“我信你个鬼!你个糟老头子坏得很!”

  从那一刻起,靖安司的书吏们都不跟徐宾握手了,年夜家都懒得理睬他。

  那末成绩来了,年夜文案术,靠谱吗?

  在李必掩饰徐宾捣乱之前,靖安司上上下下都置信年夜文案术,可以说,年夜文案术是靖安司的根底地点。靖安司推导一切案件都以年夜文案术为根据,从司丞李必到门口的卫兵,年夜家都置信,年夜文案术是最公道、最客不雅的研判体例,由于数据没有豪情,它不会像人类那样遭到客观认识的摆布。

  可是,物联网是表象,真正催动年夜文案术的中心仍然是人。

  当李必认识到这个本相时,心中崇奉的年夜厦轰然倾圮,全部靖安司都面对着崇奉重建的成绩。既然年夜文案术都靠不住,那末还有甚么玩艺儿靠得住呢?

  李必收走了徐宾的钥匙,从那一刻开端,徐宾就在靖安司成了人憎狗嫌的存在。

  为了在李必心里重建年夜文案术的崇奉,徐宾玩了一手欲擒故纵,他在造纸工坊给李必上了一课。他通知李必,因为纸价下跌,而朝廷又不愿添加预算,招致下层的书吏们任务积极性缺掉,因而书吏们在记载第一手数据的时分,愈来愈不仔细。

  徐宾的言下之意是,年夜文案术的最底层数据就曾经不靠谱了,所以场面弄成这个模样不克不及怪我忽悠你,我不忽悠你也改动不了年夜趋向啊!

  徐宾的一番话又把年幼无知的小李必给压服了,可是,小李必心中再度重建起来的年夜文案术崇奉远不如畴前那帮坚决了。李必持续坐在靖安司办公室里装淡定毫有意义,倒不如学张都尉在长安城里钻来窜往的,好歹也锤炼了身体。

  因而,李必就被各路大盗打得头破血流。

  这个故事通知我们,年夜数据,也是有bug的。

  起首,在这个世界里存在海量的信息,这些根底信息自身也是真真假假,真伪难辨。

  其次,处置信息的顺序自身也能够存在逻辑bug,它如果成心骗你怎样办?

  别的,即使是这两项都没有成绩,终究得出的结论仍然是见仁见智。一千个不雅众就有一千个哈姆雷特,从异样的数据里,年夜家得出的结论也不尽相反,乃至有能够是截然相反的结论。

  以上这些还只是客不雅上难以根绝的成绩,假如算上自动性的数据造假,那这事儿更是一团乱麻了。

  在今世,理想中的年夜数据使用带来的改动也是一言难尽。比方前不久的周杰伦打榜事情,蔡徐坤占有超话榜首60周时,看起来威风八面,几乎一代音乐教主的风采,但这其实不意味着他真的就比排名低一年夜截的周杰伦强。

  “刷数据这类没有半点手艺含量的工作,谁不会啊?”

  果真80后的年夜妈和90后的阿姨们一联手,00后的小坤粉们就滚一边哭往了。

  3

  我们该当在何种水平上信赖年夜文案术?

  《长安十二时辰》是一部虚拟的电视剧,年夜唐代并没有靖安司,天然更没有徐宾如许的人存在。

  可是,年夜文案术是存在的。

  自古以来,的确有很多很凶猛的汗青人物可以洞悉命运,可以预感将来。可是这不是甚么神迹,这些都是一些稀有的高人在把握了数据剖析办法以后,依据少量的数据,剖析得出的后果。

  不外,在99%的人都是文盲的时期里,往讲这些事理没有效,像徐宾那样装神弄鬼弄得典礼感满满再来讲结论,这才是高效力的下策。所以,戏剧里的诸葛亮都穿上了八卦仙衣,手拿白羽扇,时不时闭目掐指一算,就晓得“今夜曹贼必来劫营!”

  没方法,良多人就吃这一套。

  因而在现代,年夜文案术酿成了一种奇异的存在,但凡把握了年夜文案术的人城市被文盲们奉若神明。

  可是真正把握了年夜文案术的人,本人心里是清晰的:“这工具很有效,但它不是全能的。”

  现代的念书人以为,他们进修的是圣贤治国之学,可以造福全国苍生;是六合间的小道,可以洞悉过来将来。实践上,前者进修的是数据库里的贮存数据,后者进修的是剖析数据的办法,只要同时把握了二者,才干翻开聪明之门。

  但是,四库之书,经史子集,汗牛充栋,浩如烟海。一团体即使天纵英才,皓首穷经,终其终身,亦不成尽读。数据库就曾经没法穷尽,数据剖析办法异样也很难应用熟练。

  所以真正把握了年夜文案术的人,既置信它,又疑心它。徐宾就是这类人。

  今世的状况实在也差未几,真懂年夜数据的人知其有所不克不及,只要那些内行才把年夜数据视为无所不克不及的神器。

  4

  结语

  年夜唐天宝三年,距今曾经过来1275年,时期早已发作了天翻地覆的转变,但惟有兽性,简直没有甚么转变。

  在今世,很多人关于迷信的认知,仍然和天宝三年的年夜唐子平易近们相往不远,要末视其为祸不单行,要末视其为尽世神迹。互联网没有改动这一点,年夜数据也没有改动这一点。

  我迩来经常碰到一些对数占有着谜之沉沦的人,言必称数据,以为人间只要数据不哄人。

  比方某券商剖析师罗列了一年夜堆数据以阐明某只股票是何等的有价值,却不知这个坑就是一帮管帐师专为数据党所挖下的。

  比方某社交APP揄扬平台上有几多美男进驻,你如果真注册了就会发现,每个账号的面前都是抠脚年夜汉在陪你聊天。

  这是一个迷信拜物教的时期,之前是互联网拜物教,如今是年夜数据拜物教。

  数据是有价值的,但它并不是价值自身,读万卷书还要行万里路,不然就被书坑了。

  李必没有被徐宾坑究竟,他毕竟仍是觉悟了,贰心中重建起来的年夜文案术崇奉会和之前有极年夜分歧。

  前人云,尽信书不如无书。在当下,爆雷的白马股愈来愈多,尽信数据的投资人都快亏光了。

  亏光了也好,不破不立嘛!

本文首发于微信大众号:港股那点事。文章内容属作者团体观念,不代表和讯网态度。投资者据此操纵,风险请自担。

 
拍档财经