运河文学

手机浏览器扫描二维码访问

第199章 0200 红人计划助力MySpace(第3页)

&esp;&esp;“大数据划时代计划?”赛普疑惑地沉吟着,末了他抬起头向宁子默问到,“听起来是一个很庞大的工程。”

&esp;&esp;“是的,是一个很庞大的工程。因为目前对于不了解搜索价值的人而言,搜索引擎只是给人们带来结果的窗口。但真正去讨论搜索引擎的价值,最能体现他价值的地方一定是大数据划时代的搜索引擎时代。

&esp;&esp;想一想,曾经我们在进行数据分析与统计时仅仅局限于数据库,在数据库中对数据表进行统计分析。并且受数据量和计算能力的限制,我们只能对最重要的数据进行统计和分析。

&esp;&esp;搜索引擎跳出了这个限制,它可以成为存储着全世界几乎所有可访问的网页,数目可能超过万亿规模,全部存储起来大约需要数万块磁盘的大型数据库。

&esp;&esp;虽然这件事看起来峰语已经在做了,但峰语对于未来的规划,并没有我想象中那么清晰。

&esp;&esp;因为再往下发展下去,我想让bg可以把科技、文化、知识、资讯、新闻对应的文字、图片、视频等林林总总的东西进行统一存储管理,形成整个人类的大型数据库。

&esp;&esp;它记录人类文明过往的所有资料,为向未来的发展提供各种各样的支撑条件。把它打造成为人类的诺亚方舟那样,去造福全人类。

&esp;&esp;我可以简单举几个阶段性的例子,例如大数据的某一个先期阶段-大数据应用的数据仓库时代。

&esp;&esp;而bg可以跳出数据库的概念去进行sql操作,实现数据统计与分析。也就是说,人们将在bg上用更低廉的价格获得比以往多得多的数据存储与计算能力。

&esp;&esp;我们可以把运行日志、应用采集数据、数据库数据放到一起进行计算分析,获得以前无法得到的数据结果,而企业的数据仓库也随之呈指数级膨胀。

&esp;&esp;你们想想,在数据仓库时代只要有数据几乎就一定要进行统计分析。如果数据规模比较大,我们就会想到要用大数据技术。而技术的发展同时又促进了技术应用,这也为接下来大数据应用走进数据挖掘时代埋下伏笔。

&esp;&esp;而在大数据应用的数据挖掘时代必定凌驾于大数据应用的数据仓库时代基础之上。举个例子,很早以前商家就通过数据发现,买尿不湿的人通常也会买啤酒,于是精明的商家就把这两样商品放在一起,以促进销售。

&esp;&esp;啤酒和尿不湿的关系,你们可以有各种解读,但是如果不是通过数据挖掘,可能打破脑袋也想不出它们之间会有关系。

&esp;&esp;在商业环境中,如何解读这种关系并不重要,重要的是它们之间只要存在关联,就可以进行关联分析,最终目的是让用户尽可能看到想购买的商品。

&esp;&esp;除了商品和商品有关系,还可以利用人和人之间的关系推荐商品。如果两个人购买的商品有很多都是类似甚至相同的,不管这两个人天南海北相隔多远,他们一定有某种关系。

&esp;&esp;比如可能有差不多的教育背景、经济收入、兴趣爱好。根据这种关系,可以进行关联推荐,让他们看到自己感兴趣的商品。

&esp;&esp;除了商品销售,数据挖掘还可以用于人际关系挖掘。六度分隔理论认为世界上两个互不认识的人,只需要很少的中间人就能把他们联系起来。这个理论在米国的实验结果是,通过六步就能联系上两个不认识的米国人。

&esp;&esp;未来像我们的【领赢】甚至【yspace】,各种各样的社交软件记录着我们的好友关系,通过关系图谱挖掘,几乎可以把世界上所有的人际关系网都描绘出来。

&esp;&esp;现代生活几乎离不开互联网,各种各样的应用无时不刻不在收集数据,这些数据在后台的大数据集群中一刻不停地在被进行各种分析与挖掘。

&esp;&esp;当然我们也可以举个高大上的例子,来说说理查德·宾这位传奇相关的行业-医疗。

&esp;&esp;例如人类目前难以攻克的白血病和红斑狼疮,我们可以通过对病人的生活习惯、生长环境、dna、病情发展等信息的收集,将数据采集聚集在一起,把小特殊病理变成可供参考的大数据。

&esp;&esp;而后透过不断的数据挖掘,去分析这些病例的因由。那么科研人员对于这些不治之症,将拥有更多可参考性的依据,把原本很小的可能变成大概率可以突破的可能。

&esp;&esp;或许是让患有这些病情的人有了被治愈的可能,或许是让基因里包含潜在基因缺陷的胚胎在孕育的过程中避免来到人世后的痛苦。

&esp;&esp;这些分析和挖掘带给我们的是美好还是恐惧,完全要依赖大数据从业人员的努力。但是可以肯定不管最后结果如何,这个进程只会加速不会停止,而你我只能投入其中。

&esp;&esp;但无论如何这件事值得去做,甚至为了提高效率,我们可以将一些繁琐规律的工作交给人工智能去做,这又会让大数据时代发展到大数据应用的机器学习时代。

&esp;&esp;像刚刚的例子里,数据中蕴藏着规律,这个规律是所有数据都遵循的。过去发生的事情遵循这个规律,将来要发生的事情也遵循这个规律。一旦找到了这个规律,对于正在发生的事情,就可以按照这个规律进行预测。

&esp;&esp;在过去,我们受数据采集、存储、计算能力的限制,只能通过抽样的方式获取小部分数据,无法得到完整的、全局的、细节的规律。而未来有了大数据,就可以把全部的历史数据都收集起来,统计其规律,进而预测正在发生的事情。

&esp;&esp;这就是机器学习。

&esp;&esp;例如,我再举个例子,把历史上人类围棋对弈的棋谱数据都存储起来,针对每一种盘面记录何种落子可以得到更高的赢面。得到这个统计规律以后,就可以利用这个规律和人下棋。

&esp;&esp;每一步都计算落在何处将得到更大的赢面,于是我们就得到了一个会下棋的机器人,说不定哪一天这个机器人就会以几年的时间学习上千年的棋局后,通过共性和局部战略的学习,通过分析人类落子的意图分析以压倒性优势下赢了人类的顶尖棋手。”

&esp;&esp;也不管身边目瞪狗呆的四人,宁子默喝了口咖啡润了润喉咙,借着继续说到:

&esp;&esp;“在我讲完刚刚这些事例的时候,相信你们对于我脑中的搜索引擎已经有了一个更远期的看法。没错,它很庞大,它不止是一个可以向人们提供搜索结果的窗口,而是一个大数据时代的窗口。

&esp;&esp;bg要做的事情就是要把人类文明从诞生到发展至今说保留的所有信息都进行存储,让它成为一个庞大的数据库,让它为各行各业的人们提供可供查证的大量数据,让人类在行进的过程中少犯错误、少点痛苦。

&esp;&esp;但亦或许,那也只是我的痴心妄想。因为人性的贪婪,会让我们及时拥有这么先进的科技,仍旧避免不了那么多问题的存在。

&esp;&esp;但科技并没有错,完全要看我们应用的方法,以及我们这些从业者是否能拥有一把衡量公正的尺子。

&esp;&esp;我做不了那么多去衡量公正的事情,但我的有生之年,只想让科技更进一步,让我身边的团队为了人类文明去出一份力。

&esp;&esp;至于未来那个大时代到来后会成为什么样,我相信就算我老了,也依旧有无数有识之士能作出比我还杰出的事情。

&esp;&esp;让人类在前行的路上,依旧走着一条正确的路。”

重返九零:娇妻有点狠  古武高手在校园  文豪文原配不干了  灵气复苏后我成了监狱主  梦境食用守则  遥月入怀(仙侠)  六零采药女  以貌取人  神算的娱乐人生  私人助理  逃离破解游戏  九星杀神  首辅的农家娇妻  公主移情后前夫后悔了  星际真少爷又在PUA统帅了  你是我的白日梦  大道修真录  史上最强修仙者  帝台艳宦  重生末世之收魂  

热门小说推荐
大豪门

大豪门

馅饼,说好的豪门风云世家恩怨呢?有。自己看书!馅饼,说好的江湖快意儿女情仇呢?有。自己看书!馅饼,说好的纨绔嚣张衙内跋扈呢?有。自己看书!馅饼,说好的狗血装逼扮猪吃虎呢?有。自己看书!馅饼,说好的医卜星象天机莫测呢?嚓,你有完没完?有,都有!不会自己看书啊?好,我看书去了,看得不爽,削你!那看得爽了呢?要不要给票?...

左手白无常右手黄泉路,都是瓜!

左手白无常右手黄泉路,都是瓜!

闻家真千金被找回来了,还是个从山里出来,满嘴胡言的小神棍,整个圈内都等着看她笑话。短短几日,宋家那小霸王追着要当她小弟萧氏一族奉她若上宾特管局一处求她加入,玄门世家想要拜她为师闻曦小手一挥,直播赚功德水友大师,最近我总觉得被鬼压床了,还梦见诡异的婚礼现场。闻曦出门在外不要乱捡东西,你那是被人配冥婚了。水...

抗战之血肉丛林

抗战之血肉丛林

关于抗战之血肉丛林岛寇荼毒,痛及滇西,谁无血气,忍弃边陲,桓桓将士,不顾艰危,十荡十决,甘死如饴,座中有圹,名勒丰碑,檩檩大义,昭示来兹。谨以此文献给曾经为了保卫国家出国在缅甸与倭寇决一死战的远征军将士们!历史不会忘记,中国人不会忘记,虽然你们曾经被记忆尘封,但是时间也绝不会让你们永远蒙尘!...

开局虐哭极品:我在大院风生水起

开局虐哭极品:我在大院风生水起

刚存够首付,中了五百万实现财务自由的白婉清一口卡嗝屁。一睁眼,穿到刷过几页的爆款年代文里,成了个炮灰路人甲,还带了个恶毒女配。地狱般的开局,没关系,抛开剧情杀穿满地。只要我没道德,谁也别想绑架我,干尽缺德事,功德999。继妹白莲,脏水泼她和老癞子滚苞米地,撕毁大学通知书,让她去大西北喂猪。后娘恶毒,举报投诉铁窗泪...

超神宠兽店

超神宠兽店

万订爆款,火爆爽文有一刀斩杀黄金巨龙的低等骷髅种有身怀十大宠兽秘技的看门土狗更有自称为神的打工妹这是一个得到系统开店,在破碎远古培育宠兽的故事。当荣光覆灭,血脉逆流,昔日的存在将再度回归,一切都是毁灭!...

每日热搜小说推荐