手机浏览器扫描二维码访问
&esp;&esp;宁子默明白,有一些人,仅仅只靠画饼是不能完全说服的。
&esp;&esp;自己必须拿出完全体来对付这帮同样有梦想的年轻人!
&esp;&esp;宁子默自信地笑笑,乘着抿一口咖啡的时间在脑子里将峰语搜索的关键技术汇集成册。
&esp;&esp;把杯子从嘴边拿开的时候,宁子默脑子里有关峰语搜索关键技术的封印,
&esp;&esp;已然打开!
&esp;&esp;“说到搜索,人们往往会简单地认为搜索只是抓取爬虫从网络上抓取的结果。但实际上,搜索并没有人们想象的那么简单。”
&esp;&esp;宁子默将杯子轻轻地放在桌上,笑着扫了三人一眼,细细地解释到:
&esp;&esp;“我们谈到大数据搜索,其核心一定是体量极大的数据量。这种体量的数据存储、索引和检索,已经不单单是数据库结构能去实现并解决的。
&esp;&esp;大数据量的数据存储和搜索一定要有对应的文件存储检索系统,它必定是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。
&esp;&esp;我们【bg】除了在搜索和爬虫上用心外,最核心的部分还是背后那套围绕在bfs(bgfilesyste)文件系统的核心技术体。这套系统的设计目标,与许多传统的分布式文件系统有很多相同之处。比如,性能、可伸缩性、可靠性以及可用性。
&esp;&esp;但bfs的还是以应用负载情况和技术环境的分析为基础着重考虑,不管现在还是将来,bfs和早期的分布式文件系统的设想都有明显的不同。所以我们重新审视了传统文件系统在设计上的折衷选择,衍生出了完全不同的设计思路。
&esp;&esp;首先,组件失效被认为是常态而不是意外。bfs需要管理成百上千存储机器,同时被相当数量的用户终端机访问。bfs组件的数量和质量导致在事实上,任何给定时间内都有可能发生某些组件无法工作,某些组件无法从它们目前的失效状态中恢复。
&esp;&esp;当我们遇到过各种各样的问题,比如应用程序bug、操作系统的bug、人为失误,甚至还有硬盘、内存、连接器、网络以及电源失效等造成的问题。所以,持续的监控、错误侦测、灾难冗余以及自动恢复的机制必须集成在gfs中。
&esp;&esp;其次,以通常的标准衡量,我们的文件非常巨大。数gb文件都可能非常普遍。每个文件通常都包含许多应用程序对象,比如web文档。
&esp;&esp;当我们未来需要处理快速增长并由数亿个对象构成的、数以tb的数据集时,采用管理数亿个kb大小的小文件的方式是非常不明智的,尽管有些文件系统支持这样的管理方式。因此,设计的假设条件和参数,比如io操作和block的尺寸都需要重新考虑。
&esp;&esp;第三,绝大部分文件的修改是采用在文件尾部追加数据,而不是覆盖原有数据的方式。对文件的随机写入操作在实际中几乎不存在。一旦写完之后,对文件的操作就只有读,而且通常是按顺序读。
&esp;&esp;大量的数据符合这些特性,比如:数据分析程序扫描的超大的数据集;正在运行的应用程序生成的连续的数据流;存档的数据;由一台机器生成、另外一台机器处理的中间数据,这些中间数据的处理可能是同时进行的、也可能是后续才处理的。
&esp;&esp;对于这种针对海量文件的访问模式,客户端对数据块缓存是没有意义的,数据的追加操作是性能优化和原子性保证的主要考量因素。
&esp;&esp;第四,应用程序和文件系统api的协同设计提高了整个系统的灵活性。比如,我们放松了对bfs一致性模型的要求,这样就减轻了文件系统对应用程序的苛刻要求,大大简化了bfs的设计。
&esp;&esp;bfs还引入了原子性的记录追加操作,从而保证多个客户端能够同时进行追加操作,不需要额外的同步操作来保证数据的一致性。”
&esp;&esp;端起咖啡又喝了一口,宁子默已经习惯了身边这四人目瞪狗呆的状态。
&esp;&esp;放下杯子,宁子默再也懒得去解释那些技术细节,但还是提点到:
&esp;&esp;“bfs一早就规划了四大核心技术体,其中涵盖了第一个部分的分布式基础设施,包含的模块有文件系统(file),分布式锁服务(chubby)和数据化序列协议(protolbuffer)。
&esp;&esp;而第二部分是分布式大规模数据处理模块,其中包含分布式运算程序的编程框架和对应的数据查询语言。他们或许和sql和类似,但实际上它应该被称之为dsl(doa-specificngua)。
&esp;&esp;第三部分则是分布式数据库技术,它包含的模块就有分布式数据存储系统(bigtable)和数据库分区系统(shardg)。
&esp;&esp;最后一部分当然包含数据中心优化技术,这些技术中包括综合考虑的数据中心高温化,还有电池与服务器相应整合技术等。”
&esp;&esp;撇了撇嘴,宁子默皱着眉头说,“搜索引擎是一个全盘技术的考虑,但我仅仅只举了一个很简单的例子,并且其应用范围还只是在网页搜索结果当中,并没有提及一整个生态的整体考虑。
&esp;&esp;但我所说技术方面的内容,远比我现在讲给你们听的内容要复杂的多。每一个单项里都会包含大量工作人员相应的工作成果,确实不是短期内可以去实现的。
&esp;&esp;但好在我们【bg】团队的目标明确啊。”
&esp;&esp;“梦想还是要有的,万一实现了呢?”宁子默撇着嘴挑了挑眉毛。
&esp;&esp;这个轻挑的动作,在kaltix三人组的眼里却郑重如斯。
史上最强修仙者 文豪文原配不干了 重生末世之收魂 帝台艳宦 以貌取人 逃离破解游戏 公主移情后前夫后悔了 神算的娱乐人生 首辅的农家娇妻 私人助理 星际真少爷又在PUA统帅了 六零采药女 重返九零:娇妻有点狠 灵气复苏后我成了监狱主 古武高手在校园 遥月入怀(仙侠) 梦境食用守则 大道修真录 你是我的白日梦 九星杀神
前世,真千金盛敏敏刚出生被恶意调包,过了12年牲口般的农女生活。12岁被接回盛府,亲生父母,3个嫡亲的哥哥无条件地偏宠假千金,最后盛敏敏跟自己刚出生的孩子被假千金活活烧死。今生,盛敏敏与亲生母亲互换身体,她决定以母亲的身份整死假千金,3个哥哥跟所有仇人盛敏敏心情不爽逆子,逆女,跪下!扑通几...
脆皮大学生李友仁玩着一款生存游戏时,一道绿光在头顶浮现,刺眼的绿光让李友仁闭紧双眼,感受到刺眼的光芒消失,李友仁已经来到了1958年。李友仁在这红火的年代面对历史的浪潮,他会如何过好自己的小日子呢。...
嘿嘿,我就吃个瓜,没想到把自己搭进去了!Σ°△°︴秦泽一朝得金手指,以为是末世降临却不成想穿越到盗墓世界,熟知剧情的他本想当一个吃瓜路人甲,却被人揪住命运的脖颈,被迫无奈他只好选择入局。同时,他也有了一帮过命交情的好兄弟,但他没想到的是他以为的兄弟情,慢慢地变质了而本人却傻乎乎的,不自觉落入灰狼们...
你知道冰和一根香蕉融合在一起会变成什么吗?我面前这个一口一个小冰球的蜥蜴会告诉你答案。但如果把电池和苹果以及苦瓜融合在一起,不仅变的难吃,还能让人拥有放电的时候身体会变绿的超能力!而当叶问拿着用牛粪,兔子毛,蝾螈,水熊虫,魔鬼辣椒和伟哥制成的动物系果实询问眼前这个被前女友戴绿帽,被现女友出轨他老爸,并且生下了他...
九叠琴音震寰宇,谁敢闻言不识君?七色魔法代等级,雄雄揭大幕。琴之帝王,给这片大陆带来翻天覆地的改革。伴随着旷古绝今的赤子琴心的出现,一代琴魔法师,在碧空海之中悄然诞生。这将是一个单纯的少年,逐渐成为琴中帝王的故事,开创音乐魔法的先河,颠覆以往的设定,赤橙黄绿青蓝紫,彩虹等级将成为所有武技和魔法衡量的标准。原本仅仅是...
并指青云,气吞幽冥。大道交错,剑者独尊。这是一个人和一把剑的故事!红尘三千丈,琉璃染天香。群雄共逐鹿,剑尊掌苍黄。剑的真谛,万年之秘,以血海无涯重铸登天之路,以亿万枯骨再炼剑道经书。一切尽在太古剑尊。...