科技论文心得,学习谷歌三篇重要论文有感

作者:在线查重系统     发表时间:2023-02-07 22:26:08   浏览次数:83


      一、掀开窗帘,探了一眼 我是会计专业的学生。由于专业知识的限制,很难理解三篇论文。第一次看完这三篇论文,真实的感受是云里雾里,无法理解。但在老师的带领下不断深入学习,幸运的是,我还是有所收获。 正如老师所说,学习这门选修课的目的并不要求我们每个人都能完全掌握和掌握大数据和人工智能。一方面,你不需要给自己施加这么大的压力,另一方面,这是不现实的。毕竟大学四年后可能只算入门专业,显然需要扎实深厚的知识基础作为积累。对我们来说,专业知识不在掌握范围内。因此,对我来说,这门课程最大的意义不仅在于知识,而且在于拓宽视野和视野,拓展思维的宽度和深度,进一步了解引领当今乃至未来发展趋势的技术。学习这门课程相当于为我们打开一扇窗户(虽然门可能没有机会进去),或者给老师一扇窗帘,让我们有机会看一眼。 以下是我学习谷歌三篇论文后的收获记录和一点分享。可能有专业知识上的错误,希望能得到纠正,也希望多理解。

      二、大数据-大数据 谷歌三篇论文中的三个主角Google File System”“Google MapReduce”“Google Bigtable它们都是处理大规模数据的三个重要工具。因此,首先要分享对大数据的理解。 什么是大数据?这里主要是指在常规运行时间内收集、管理和处理数据能力超过常用软件工具的数据集。 我们可以通过拆分词来理解它的意思。 大数据的特点首先在于大:这种大的程度不仅仅是一般的大、大、大,还可以用浩如烟海、海量两个字来形容。如果用数学表是数十TB~十几PB等级数据规模。当然,除了数据量大,大数据还包括多样性、真实性(包括可审计性)、价值密度低、速度快。 所以数据是指事实或观察的结果,是对客观事物的逻辑归纳,是表示客观事物未经处理的原始材料。可以说,数据是信息的表达形式和载体。一方面,它是所有可定量分析信息的记录,不仅指狭义上的数字,还包括有意义的数字符、文本、图像、音频等;另一方面,数据可以成为信息,挖掘信息成为知识,合理应用知识可以产生价值,最终造福人类。总的来说,我认为量化思维被用来处理信息,进行统计分析,从而得出结论。数据量越大,结果的准确性越高,结论的普遍性和科学性越强。 在《新人类简史》中也提到,数据是一个老东西,从早期的绳记事,月亮缺乏计算岁月,后来部落猎物,采摘数量计算贡献,到每一代土地农田、人口粮食、马军等,涉及大量数据,但人们从来没有大,但实际上已经出现了很久。随着互联网和物联网伟大技术革命的开始,事物之间的联系越来越密切。即使是几天内感知到的动态数据也可以达到古代国王一年内收集的数据量。显然,物联网上成千上万的物品涉及的数据量不能用海量来形容吗?因此,大数据诞生了。云计算和人工智能XX”……随之而来。 近年来,大数据一词似乎被提及的频率相对较高,但事实上,它已经在我们的生活中得到了广泛的应用。例如,超市货架上的的展示规则,服装店根据购买数据和浏览页面的频率,通过安装在模特身上的传感器,将衣服取下放回来的次数统计,在淘宝、JD.COM等购物平台的后台准确定位和推送消费者广告,通过电量推断该地区的经济发展水平,天气预报等。,几乎无处不在,离不开我们的生活。这些应用背后的规律是通过分析大数据获得的。数据本身只是一个结果,意义不大,往往是人们赋予的。只有处理、分析和判断数据,得出结论并应用数据,才能产生价值。因此,挖掘数据背后的价值和拓宽其应用领域尤为重要。人才与各行业的合作需求量很大。

      三、实现大数据处理的三种工具——Google File System”“Google MapReduce”“Google Bigtable” Google File System(GFS),主要用于文件存储的大规模数据分布式文件系统。GFS背景是为了满足Google 数据处理需求的快速增长。当时的Google一方面,公司对数据处理需求巨大,需要一个支持大量存储的文件系统。另一方面,市场上只有IBM该公司可以提供可靠的分布式文件系统和硬件,但价格非常昂贵。冷与残酷的碰撞,Google技术人员没有向现实低头。他们开始思考:能否在一堆廉价不可靠的硬件上建立可靠的分布式文件系统?令人兴奋的是,他们做到了,他们成功了!GFS诞生是最好的见证。GFS虽然运行在廉价的普通硬件设备上,但它可以为大量客户提供高性能的服务,这很好地解决了阻碍他们前进的问题。了解这背后的故事,我不禁感动:即使现实条件不好,也有可能创造奇迹! 并行式:当我们使用计算机时,我们经常接触C盘D盘、E盘、F盘子属于单机物理存储形式,称为并行式。 关于可靠性:对于我们熟悉的电话,它的可靠性是由线路完成的,属于物理连接,可靠性相对较高。以前电话联通离不开接线员。拨号的一端通过摇动手柄发电,接线处的信号灯亮起后,接线员接线到拨号地,从而实现电话联通。现在我们使用的网络由终端负责,可靠性由协议和软件完成。 Google MapReduce,它是一种处理大量数据的并行编程模式,主要包括映射和简化两种方法,以及反映为零的思维方式。为什么会出现?MapReduce呢?这是因为Google全球网页数据、邮件数据、地图数据、卫星图片等大量数据需要处理……计算问题简单,但难以解决,数据量巨大(PB等级),只有分布在数百个节点上并行计算,才能在可接受的时间内完成。如何并行分布式计算?如何分发待处理数据?如何处理分布式计算中的错误?这就需要并行包装处理、负载平衡、容错处理、本地化计算等。 开发者需要编写两个函数-key和value。其中,我们可以生动地将整个模型的运行过程与采茶工采茶过程进行比较。在这里编写两个函数,相当于对采茶师进行技能培训:key就像每个采茶人的茶篮一样,只允许这种茶放在指定的茶篮里;value类比每个采茶人采摘的茶叶数量,如张三采集的茶叶数量value 一、王五采集量为value 2。 MapReduce 在操作执行过程中,有两个主体:Master和Worker。与领导类似,前者会定期监督后者的情况,确定是否仍在运行。每个worker不相干扰,分别完成分配的任务。 处理文件时,master 和worker两者交流。若一个worker完成任务后,它会走向master报告,等待接收。master接受后继续工作。任务完成,master也会向worker下发指令:任务完成,收工!来回指令与现实中人们的交流非常相似。 再来说一下MapReduce容错机制分为两部分,一部分worker,另一个是master。worker就像采茶工在采茶过程中遇到紧急情况一样,比如被蛇攻击,采茶工中暑晕倒。master如何知道发生了什么?它是通过master周期性地向worker下发指令,通过worker判断回应worker是否正常运行。一旦遇到这种情况,master将重新部署新的worker顶替。 如果是master情况,原来的master崩溃,那么worker它将重新选择新的master,开始新一轮的工作。使工作有序进行,不中断。 编程模型:处理问题的步骤应用于分布思想。 并行:多个CPU同时,类似于多个采茶工同时采茶。 “并发”:CPU在高速运行状态下,从微观层面来看,是单一的CPU交替进行多个任务。就像360卫士暴风影音QQ三个软件同时运行,所以微观上可能是先运行360卫士一段时间,下一段时间运行风暴视频,下一段时间运行360卫士,继续QQ运行一段时间……这样交替下去。 我还想谈谈我的对MapReduce一个想法。我认为MapReduce设计主要体现了化为零再化为零的思想。例如,论文中提到用户程序首先被调用MapReduce库输入文件分为M个数据片度。基本上,采用分割和分割的方法来处理大量的数据,将问题分解成大量的小任务,很好地发挥简化复杂性的作用,可以简单地解决许多复杂的问题。 Google Bigtable,它是一个分布式的结构化数据存储系统,也被设计用来处理海量数据(通常是PB级)。它与Chubby、Paxos算法有更多的联系。 “Chubby被称为强制锁,它是一对一串行并发的,具有一致性。广泛应用于购票系统和银行系统。 Google三篇技术论文意味着世界进入大数据时代,数据计算速度大大提高,为各个领域提供了新的思路。 四、走在当下,未来可期 让我们谈谈学习的收获。虽然我不能完全理解专业知识,但我不仅对大数据和人工智能有了进一步的理解和理解,而且学习了一些分析数据的方法,定量分析处理的思维方式,也对日常生活中经常出现的现象有了更深入的了解,从几个角度看问题,处理问题。与此同时,我也不禁被人类的智慧所折服,被技术人员不轻易放弃的态度和严谨的工作作风所感动。 我想分享一个我最近看到的大数据在调查大学生心理应用的例子,这与心理问题的预防和管理有关:一所大学发现,在5000名新生中,近100名学生有严重的自杀倾向,比例达到惊人的2%。因此,他们通过学生的社会状态来分析学生的心理状态。每个学生都有一张卡通,记录了学生在学校的生活状况,如在食堂刷卡、进出图书馆等。前后脚刷卡的可能性很大。我们做了一个数据调查,两个陌生学生一个月内前后脚刷卡的概率只有3%,两次以上的概率是12万,三次以上的概率是3000万。2017年,通过对一卡通数据的调查,校园里发现了800多名最孤独的人,一年半内没有亲密的朋友。在这800多人中,有170多人在一年内进行了心理咨询或治疗。通过这类分析,尽可能发现学生中潜在的心理问题,并给予相应的帮助。 这个例子震惊了我。通过这些我们平时不太注意的数据,我们可以有这么大的用处,甚至可以挽救生命。真令人震惊! 2016年,十三五规划建议实施国家大数据战略,旨在全面推进我国大数据的发展和应用。到目前为止,大数据战略已经上升到国家战略。国家大数据战略在中国经济社会发展中的重要地位和意义。可见,大数据对一个国家乃至世界的发展都具有重要意义。一方面,大数据是人工智能的前提、基础和支持,另一方面,它与云计算、物联网、数据挖掘和智能相结合XX区块链有着密不可分的联系,或者说是蚱蜢绑在一条线上。它们在各个行业和领域的应用,大大提高了全社会的生产效率,促进了各行各业的发展,造福了千家万户。 在我所学的会计领域,成本控制、财务状况统计分析、企业客户数据分析、大数据已慢慢渗透,大大提高了会计人员的工作效率,也方便了企业或部门的领导和管理和企业战略部署。我认为这不仅是会计从业者的机会,也是会计从业者的挑战。从整个社会的角度来看,我们希望大数据能更多地与各行业合作,加快整个社会的发展。未来可期!这也要求我们每个人脚踏实地,为未来打下最坚实的基础!

热搜词: 掀起门帘 最新文章 论文检测查重率太高怎么办? 2023-02-07 16:54:47 ?51论文查重论文查重结果不超过多少才能过学校知网查重? 2023-02-07 16:54:46 如何快速完成毕业论文排版 2023-02-07 16:54:44 抄袭的论文能通过查重系统的检测吗 2023-02-07 16:54:42 国贸专业的毕业论文选题都有哪些呢? 2023-02-07 16:54:40 市面上那些论文查重系统安全保密性怎么样呢? 2023-02-07 16:54:38 免费下载学术论文资料的网站(下) 2023-02-07 16:54:37 如何在一周之内完成毕业论文 2023-02-07 16:32:49 如何利用聚焦要素法给论文起标题 2023-02-07 16:31:59 强烈声援饶毅,必须肃清学术不端,还我们一片净土! 2023-02-07 16:31:57

本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时删除处理。

学术新闻相关资讯

学术不端查重入口


检查语种:中文,英文,小语种 预计时间:2小时-6小时
系统说明硕博初稿检测(一般习惯叫做硕博预审版),论文查重检测上千万篇中文文献,超百万篇各类独家文献,超百万港澳台地区学术文献过千万篇英文文献资源,数亿个中英文互联网资源是全国高校用来检测硕博论文的系统,检测范围广,数据来源真实,检测算法合理!本系统含有(学术库与源码库)。(限制字符数30万)
检查范围硕士、博士论文初稿【误差一般在3%左右,不支持真伪验证】
498.00元/篇
立即检测
检查语种:中文,英文 预计时间:60分钟
系统说明论文查重软件,维普论文检测系统:高校,杂志社指定系统,可检测期刊发表,大学生,硕博等论文。检测报告支持PDF、网页格式,性价比高!
检查范围本/专科毕业论文
4.00元/千字
立即检测
检查语种:中文,英文,小语种 预计时间:2小时-6小时
系统说明比定稿版少大学生联合比对库,其他数据库一致。出结果快,价格相对低廉,不支持验证,适合在修改中期使用,定稿推荐PMLC。——不支持验证!!!
检查范围本/专科毕业论文
288.00元/篇
立即检测
检查语种:中文 预计时间:60分钟
系统说明论文检测网站,万方数据平台推出的万方查重系统是目前较为热门的检测系统。究其原因,万方数据通过近年的发展,在高校中也确立了自己的相应地位,特别是部分高校直接将其视为毕业检测系统,其真实性和权威性无可厚非。其次,相对于知网而言,万方检测费用少,上手容易,是学生初次论文查重的推荐系统。
检查范围毕业论文、期刊发表
4.00元/千字
立即检测
检查语种:中文/英文 预计时间:60分钟
系统说明学位论文查重,维普查重系统是国内知名数据公司。本系统含有硕博库、期刊库和互联网资源等。支持中文、英文、繁体、小语种论文检测,最多支持1万字符。--不支持指定院校!!!
检查范围毕业论文、期刊发表
35.00元/篇
立即检测
检查语种:中文,英文,小语种 预计时间:24小时-72小时
系统说明本科定稿查重版(一般习惯叫本科终评版),论文抄袭检测系统,专用于大学生专、本科等论文检测的系统,大多数专、本科院校使用此检测系统。(限制字符数6万)
检查范围专科/本科大学生论文
388.00元/篇
立即检测
检查语种:中文 预计时间:60分钟
系统说明PaperPass检测系统是北京智齿数汇科技有限公司旗下产品,网站诞生于2007年,运营多年来,已经发展成为国内可信赖的中文原创性检查和预防剽窃的在线网站。 系统采用自主研发的动态指纹越级扫描检测技术,该项技术检测速度快、精度高,市场反映良好。
检查范围专科/本科大学生论文
3.00元/千字
立即检测
检查语种:中文,英文,小语种 预计时间:3小时-72小时
系统说明amlc职称论文检测,期刊职称查重系统是期刊、杂志社专用,是针对投稿发表、已发表文献、学校、事业单位业务报告、职称评审论文的重复率检测系统。
检查范围投稿/发表/职称评审
3.00元/千字
立即检测
检查语种:中文 预计时间:60分钟
系统说明格子达依托学术期刊库收录了海量对比资源,其中包括中国论文库、中文学术期刊库、中国学位论文库等国内齐全的论文库以及数亿级网络资源,同时本地资源库以每月100万篇的速度增加,是目前中文文献资源涵盖全面的论文检测系统,可检测中文、英文两种语言的论文文本。
检查范围毕业论文、期刊发表
5.00元/千字
立即检测
检查语种:简体中文、英文 预计时间:60分钟
系统说明PaperTime论文查重系统,拥有海量的对比数据库,总收录超过9000万的学术期刊和学位论文以及一个超过10亿数量的互联网网页数据库组成,保证了比对源的专业性和广泛性。采用多级指纹对比技术结合深度语义发掘识别比对,利用指纹索引快速而精准地在云检测服务部署的论文数据资源库中找到所有相似的片段,该项技术检测速度快、准确率高,市场反映良好。
检查范围毕业论文、期刊发表
2.00元/千字
立即检测
在线客服 返回顶部