区块链?
张非虽然管科技口但也无法面面俱到,这个名词还是头一次听说。
原世界的区块链源于比特币,这个世界的算力币还不火,所以知道的人并不多,张非不知道也不奇怪。
区块链不过是一个加了时间戳的数据记录方式,是比特币整套技术中的一环,完整的来说这是一套去中心化分布式系统。
区块链这个名字,其实片面了。
但大家都这么称谓,曹深也只能入乡随俗。
原世界到曹深死的时候整个“区块链”技术仍然非常不成熟,因为这项技术有一个天生无法逾越的障碍,既“不可能三角”。
不可能三角指去中心化,可扩展性和安全性,这三项要求无法同时满足,必须有所取舍。
这一点其实很好理解,去中心化,比如比特币,每一份交易记录都需要所有节点复制,全网广播。
有n个节点就要重复劳动搞n次,如果是用中心化的网络就只用记录一次,最多再来两三个信息备份足以。
又要去中心化又要安全,那么整个系统功能上就必须非常简单,不会有什么扩展性。
否则,它必然被设计得庞大臃肿,大就漏洞多,安全性也就无法实现了。
如果选了高扩展性和安全性,那就必须设计丰富的接口,还要严格控制才能保障安全性,这样又很难做到去中心化。
原世界的比特币去中心化程度与安全性很高,但性能就很拉垮,网络经常堵得一批,用户不得不支付更多的交易手续费让矿工们优先“打包”交易信息。
后来出了一个eos,号称百万tps,性能远高于比特币。
但eos为了达到性能牺牲了去中心化程度,它并不是像比特币一样所有节点对等,而是搞了21个超级节点。
所以这个项目也被人质疑权利过于集中,既不够去中心化也不利于网络安全性。
而之所以区块链这个东西对安全性要求极高,有两个原因。
第一,它和普通的信息网络,也就是我们所说的互联网不同。
区块链上除了跑信息数据之外,大量跑的是资产数据。
互联网如果安全性出了问题,最多是数据多丢失,数据泄露之类的。
而区块链如果安全性出了问题,那是非常直接的经济损失。
如果说互联网是信息网络,那区块链就是资产网络。
也是因为区块链上面跑的都是钱,所以这个行业一热起来之后,黑客和白帽子都去区块链上恰饭了。
在过去区块链没有起来之前,国内的网络安全创业其实很苦逼。因为安全业务的业态很像医院,没病不会找医生。
一般如果没有官方硬性要求,或者是没有遭遇到黑客攻击,普通企业对网络安全都不重视,毕竟买安全产品是个成本,不能创造收益,而且一般也没啥事儿。
这个事情一直到国家推行了等级保护2.0的强制性要求后,情况才开始好转,安全公司才能奉旨恰饭。
当然,顶级的互联网公司对安全问题还是很重视的,比如两个马爸爸。国内几个顶级白帽子都被这两家公司招揽了。
而另一帮顶级的白帽子杀进了区块链做安全审计,一改往日的颓势,赚得盆满钵盈。
当然,厉害的黑客也转战在区块链上,大大小小搞了很多骚操作,情节跌宕起伏,比电影更来劲。
区块链强调安全性的第二个原因,在于保障它上面数据的不可篡改性。
因为不可篡改是运行智能合约的先决条件,甚至可以说区块链的所有共识算法都是在保障数据不可篡改。
所谓智能合约,简单理解就是基于不可篡改的数据在区块链上跑的合约应用,比如自动买卖交易。
举个简单的例子,手机话费自动扣缴。
如果是中心化的系统,数据是很容易篡改的,黑客入侵后把用户的电话套餐改成价格更高的,然后就能自动多扣钱。
所以这种自动扣费系统不能称为智能合约。
网络彩票之所以被取缔了,也是因为这是中心化的系统,爆过雷。如果用区块链来做,数据不可篡改就没这档子风险了。
系统给了曹深云计算系统,曹深仔细研究过,这玩意能把分布式计算做到极致,由此自己琢磨了一套解决不可能三角问题的方法。
虽然曹深现在做的系深科技是个中心化的公司,但曹深内心是去中心化的拥护者,自然也是分布式系统的铁杆。
他想用这套东西,但现在条件还不成熟,至少硬件的算力和通信网络都还跟不上,所以只能等。
但也并不代表什么都不能做,至少这套技术和分布式理念,曹深希望能有更多的人掌握。
所以,曹深打算先拿一部分技术出来,跟国家合作,做“联盟链”。
联盟链的节点数是有限的,所以其实算不得真正的去中心化,但路得一步一走嘛,先用可实践的方式让大家感受去中心化的好处。
张非一听是新技术,将来能做到信息的可追溯,不可篡改就觉得很有价值,当即就打包票一定配合曹深的这项研究。
当然,区块链还有三个特性去中心化、开放性、自治性,曹深没说。
既然是“联盟链”,那就得有“联盟”,于是张非牵头联合六家部委和科学院一起跟曹深组队。
具体操作是,七家每家出一个数据中心来跑数据。
整套系统都是曹深亲自部署的,七家就是七个节点,共同维护这个“数据账本”。
因为是实验性的东西,大家都不敢把真实的业务数据往上跑,但若是单纯的实验数据可能数据量不够大,任务处理复杂度也很低,无法测试性能和安全性。
结果还是曹总一拍胸脯:
“跑我的业务数据吧,我拿一部分出来做实验。”
曹总愿意为国家科研做贡献,其他家当然是欣然同意。
接着,曹总又花了三天时间给大家科普区块链和分布式系统。
有的听得是云里雾里,毕竟这年头云计算都还很新。
有的是觉得听起来好像没啥,挺简单的,但过后回味起来觉得这里面深不可测,会涉及到的知识面非常的广。
有的直接就不明觉厉,干脆放弃,权当个任务,曹总怎么说就怎么执行好了。
总之,不管别人怎么想。事情是落实下去了,并且一切进行得顺利。
张非也是很高兴,这次他可是出圈了,联合好几家部委和科研院所很是长脸。
于是,皆大欢喜。
搜索引擎系统做了一周,主要是系统先需要用nlp引擎把全网的信息做一遍阅读理解,然后再选择相应的搜索方案。
解决一个问题通常都有很多技术方案可选,所谓技术选型。
真正的技术架构师高手,做的就是选型的工作。
如果一个人技术很扎实,我们赞扬他技术好。
如果一个人选型很有牛逼,那这是一个有品位的大师。
百度近年来虽然新东西善法可陈,但百度贴吧当年的技术选型还是挺有意思的。用户看到的贴吧页面实际上是搜索后按照论坛形式重排的结果。
互联网发展到现在,网络上的信息量是相当巨大的,即便是系统的超强数据处理能力,也是二十四小时不歇息疯狂处理一星期才扫荡了一遍。
如果系统有脸的话,应该看到它处理得脸都要绿了。
当然,系统没脸,但在冷气全开的房间还是能看见系统头顶上冒热气。
【曹贼,好热啊!】
“空调已经开到最低了,你头上还顶了冰袋,身边都是冰盆,还拿电风扇给你吹着呢。”曹深裹着被子陪系统一起战斗。
虽然曹深并无卵用,但曹总觉得自己是在“并肩作战”,具体的加油方式就是,曹深不断的问:
“系统好了没!”
“还差多少数据!”
“今天能出来么!”
【曹贼,你再催,再催死机!】
系统说着脑袋又冒出一缕“仙气”。
“要不我帮你把头发剃了散热?光头多凉快,还不用洗,多方便!”
【曹贼!我整个脑袋就头发像人类了,你做个人吧!】
“行行行!要不我给你扎起来?披着我看着都热,而且怪吓人的。”
【好,扎好看点】
“你脸都没有,要什么好看!”
于是,曹深给系统扎了两个啾啾歪在头顶,大小还不对称。
【好丑啊!曹贼你也太手残了吧,你是不是故意的!】
“不不不,我已经尽力了。”曹深拿着镜子对着系统:
“其实挺好看的,像不像咱们平时吃的包子。左边这个是小笼包,右边的是大肉包!”
【咦,好像是有点像啊。看,还冒烟呢,刚出炉的!】
“嗯嗯,你好好表现,明天我给你扎三个,再来个灌汤包!”
【好呀!】
【到点了,我该中场休息了!】
“行行行,你去吧。”
系统的中场休息就是,做家务……
也不知道为什么,系统自从第一次全面清洁了房间以后就开始沉迷做家务。
在清洁整理这件事上,系统还是很有专业素养的。
当初接了家务活的任务后就用她的“钛合金”眼进行扫描。
这一看,简直觉得曹深住在细菌垃圾堆里面!
曹深能忍,系统不能忍!
于是,曹深见识到了人生最严格的大扫除。
所有犄角旮旯,各种消毒用品,家里的全部物件,系统一处一件都不放过,全部清洁了一遍。
曹深觉得,要不是自己严重抗议,系统能把他用福尔马林泡一遍!
等打扫完,曹深觉得连桌面都锃亮可鉴。
甚至在系统的影响下,曹深人生头一次自我怀疑了,我是不是脏!
看到家里各种摆放得整整齐齐的物件,曹深简直怀疑系统是不是有强迫症!
而且关键是,这么整齐,感觉哪哪都没法下手啊。
家里一点温馨感都没有了!
曹深在自己家里面竟然有些手足无措起来。
“我桌上右手边那张纸去哪里了?”
【你桌上乱七八糟的一大堆纸,你说的是哪张?】
“画了仓库结构图的那张。”
【你一共有十二张仓库结构图,具体一点】
“用红色还有蓝色笔标注的,立式货架的……”
【在你书桌右手边抽屉里那一摞纸的第二十七张】
“我那件白色胸口有个篮球图案的t恤在哪?”
【在你衣柜东面拉门,上面第二层的叠好的第五件】
“你给我拿来。”
【好的!】
曹深松了一口气,幸好系统整理好以后东西在哪它都还记得。
最怕的是,东西是整理了,但整理去哪儿了给忘了。
系统每次把曹深弄得乱七八糟的家整理好后都有一种幸福的成就感,这种成就感让系统简直爱上了做家务。
成天盯着曹深:你倒是乱摆乱放啊,你不乱扔我拿什么整理!
噢,对了,中午吃了外卖。去把餐盒也洗一下,即便是要扔,也要干干净净的扔出去。
一会儿宿主洗好的衣服晾干了,我去熨一下,就是要平平整整像新的一样才有成就感……
这些天除了做“阅读理解”,系统满脑子在盘算,还有什么家务能做的。
曹深甚至为了防止系统沉迷家务不好好干正经事,严格规定了,只有休息时间才能用做家务来放松。
一天休息两次,每次一个小时……
终于,一星期后见证奇迹的时刻到了。
曹深是设想过的,基于一个好的nlp技术做出来的搜索引擎是什么样。
因为在原世界,曹深见过国内一家nlp技术很强的团队做出了这样的东西。
非常强大的搜索引擎,导致无法商用,只服务于内部。
曹深知道,原世界的nlp技术跟系统拿出来的这个还是有很大差距,但没有想到,系统这套搜索引擎效果如此恐怖。
换句话说,当机器充分理解人类的语言时,结果令人震惊。
曹深随便输入了公司一个普通员工的名字,李大刚。
如果是度度,基本上就是在白名单网站中以这个人名为关键字进行搜索,并返回结果。
你需要根据这个人的其他信息去判断,哪一个链接内容指向的是你要找的这“李大刚”。
如果这个人曾经在网上以这个姓名出现过,那么你能搜索到一些相关的资料。如果没有,那可能度度也搜不到什么信息。
当然,随着技术的发展,度度也用上了nlp技术。
不过也就限于,当你输入“李大月工”的时候,度度会提示:
已显示“李大刚”的搜索结果。仍然搜索:李大月工
但系统做出来的搜索引擎不同。
第一步,输入姓名。
第二步,返回搜索结果。
这个结果表面上和度度的差不多,因为输入的姓名可能有很多重名的,此时的搜索引擎还不知道,你要找的究竟是哪一个人。
第三步,用户根据返回的搜索信息,判断出哪一个链接是你要找的人,点击进去。
这个时候,搜索引擎开始真正工作了。因为通过你的点击,搜索引擎定位了你要找的究竟是哪一个李大刚。
等你再次回到搜索页面的时候,整个搜索内容都变了,全部显示的是跟这个“李大刚”相关的内容。
而这些内容并不是靠“李大刚”这个关键词在网上进行比对后的直接抓取呈现。
系统是阅读并理解了全网的信息,了解了“李大刚”的特征,根据这些特征再关联进行搜索,并返回结果。
换句话说,并不是靠“李大刚”这个名字,而是通过李大刚的行为,他的社交关系,他的关联信息,甚至他语页的信息是李大刚留下来的或者是跟李大刚相关的!
无论他是不是用了李大刚的名字,无论他用的是什么id,无论他是不是匿名!无论别人在讨论李大刚的时候有没有提到他的名字!
依靠nlp技术,机器理解了全网的内容,理解了李大刚,并把李大刚“揪”了出来。
于是,曹深在搜索页面看到了李大刚的“一生”,而且是搜索引擎自动整理过的,就像百度百科一样!当然,还贴心的附上了相关链接。
李大刚身份证号码,手机号码,家庭情况,高考分数,大学里各科分数,有几个女朋友叫什么,跟女朋友之间发生过什么事儿,都有哪些社交关系,别人对他的议论,微博上关注评论点赞过的人,对什么事儿感兴趣,过往的购物记录,看过什么电影小说,喜欢什么球队,骂过什么脏话,甚至浏览过什么网页有什么癖好……
并且还按照社交关系亲密程度排序,列了一大帮李大刚的同学,同事,朋友,老师等等。
而且都是有链接可以点击的,点进去就出现这个人的完整资料。
毫无隐私!
曹深又试了一遍,这次没有输入李大刚的名字,而是输入几个李大刚的特征,年龄、毕业的学校、工作单位。
搜索引擎同样定位到了李大刚,并返回了详尽的资料。
曹深又输入“tt科技”,同样出现一个整理出来的页面。
里面从产品、技术、财务、运营到公司新闻,八卦等等都有。
另外还有所有的客户信息,以及完整的员工列表。
客户信息和员工列表也是全网信息理解后,通过对比“抓”出来的。
点进去客户信息,还能看到具体是什么业务,接头的双方都是哪些人员,以及关于这个客户业务的相关新闻及八卦。
如果点进去产品或者技术,能看到包括官方文档在内的所有信息。
虽然这不是内部文档而是公开文档,但资料也非常齐全,甚至包括内部的客户培训材料!
这才是我想要的搜索!
曹深一拍桌子,但,这玩意不能拿出来用啊!
打算再试一试,于是曹深在搜索框内输入了“徐冰倩”的名字。