大数据考试题库与答案简答题(大数据试题答案与解析)家里有两个人却有四个生物在呼吸剩下两个是什么家里有两个人却有四个生物在呼吸剩下两个是微生物。试着吸口气,深呼吸。随着我们每一次呼吸,氧气被送到肺泡深处,同时被吸入的还有几百上千个微生物。请你坐下。你坐下的位置周围会有几千种飘浮、弹跳、爬行着的小生物。 云联网产品国内业务所有节点发起审核落地什么的结算比例让学习考试更高效 登录 搜索试题答案、题库名称 搜索 单选 云联网产品如客户接入节点是数据中心节点,发起省结算该节点费的(),落地省结算该节点费的()。 A、 90%,10% B、 80%,20% C、 70%,30% D、 60%,40% 登录后查看答案 相关试题 单选 根据《中国联通全成本管理核算体系业务规范(V3.0)》,铁塔租赁成本直接归集至()。 A、 移网核心 B、 移网无线接入 C、 固网核心 D、 传输 查看答案 单选 ()负责地市关键用户、省分和地市复核用户、省分和地市查询用户的权限管理。 A、 集团关键用户 B、 省分关键用户 C、 地市关键用户 D、 软研院 查看答案 单选 国际物联网业务是国际物联网应用服务主要采取省分公司和国际公司协同运营,国际公司和境外运营商业务合作的方式,引入境外合作资源,支撑全球物联网客户的需求。由省公司开户的用户到中国境外地区使用,使用国际公司或通过国际公司登陆到其他境外运营商的网络,业务销售省公司按照一定规则向集团公司(),集团公司将这部分结算给国际公司;境外运营商的客户由国际公司负责开户,在中国境内使用,则由国际公司向集团(),集团将这部分分摊给业务支撑省。 A、 结出成本、结出成本 B、 结出成本、结算收入 C、 结算收入、结出成本 D、 结算收入、结算收入 查看答案 单选 根据集团下发的差旅管理办法,出差人员的交通补助应为(),伙食补助应为()。 A、 50;100 B、 80;100 C、 100;80 D、 100;100 查看答案 单选 集团一点收费业务是通过( )系统分摊给业务归属省分 A、 CBSS系统 B、 合同系统 C、 收管系统 D、 汇聚系统 查看答案 单选 集团公司总部人员在系统内单位出差以及省公司本部人员在省内单位出差期间,由接待单位在规定标准内统一安排工作餐(原则上在内部食堂就餐)及市内交通工具,不再报销()费用。 A、 差旅费、伙食补助费、市内交通费 B、 住宿费、伙食补助费、市内交通费 C、 伙食补助费、市内交通费 D、 差旅费、市内交通费 查看答案 单选 总部直签新兴ICT项目在收管系统哪个报表里? A、 JQ63 B、 JQ65 C、 JQ103 D、 JQ109 查看答案 单选 出差人员全程乘坐本单位公务车出差的,可报销()费用。 A、 伙食补助 B、 交通补助费用 C、 市内交通费 D、 交通费 查看答案 单选 某外省员工到联通北京技术培训中心参加技能培训,主办单位统一安排食宿并统一开支,下列哪个项目可以在差旅中报销 A、 培训期间的市内交通费 B、 每日100元标准的伙食补助费 C、 乘坐飞机购买的交通意外保险一份 D、 从北京回广州省亲所发生的机票 查看答案 单选 部分受地理、气候等自然条件限制和季节性热点影响较大的城市和地区实行差旅住宿费淡旺季标准,旺季期间住宿费限额标准在其原有基础上浮( ) A、 10% B、 15% C、 20% D、 25% 查看答案 单选 新兴ICT业务中,集成服务、软件服务、工程服务等:确认收入的时点为()。 A、 设备交付时 B、 履约进度确认收入 C、 按服务期限分期确认 D、 项目终验后确认 查看答案 单选 新兴ICT项目类业务收入、成本入账时均须匹配项目段,以下成本入账时必须匹配项目段的是: A、 主营业务成本-移动大数据业务-数据类 B、 主营业务成本-移动大数据业务-应用类 C、 主营业务成本-移动物联网业务-方案集成 D、 主营业务成本-云计算-云应用 查看答案 单选 JQ89报表“主营业务收入”列中新增PLUS会员减收金额列,新增PLUS会员减收分摊至省分的科目为() A、 主营业务收入-SP等合作分成收入-增值业务-创新业务-内部结算摊分 B、 主营业务收入-SP等合作分成支出-内部结算摊分 C、 主营业务收入-SP等合作分成支出-增值业务-创新业务-内部结算摊分 D、 主营业务收入-SP等合作分成收入-内部结算摊分 查看答案 单选 国内差旅费,住宿天数原则按( )计算 A、 “出差自然(日历)天数” B、 “出差自然(日历)天数+1” C、 “出差自然(日历)天数-1” D、 “出差自然(日历)天数-2” 查看答案 单选 家庭账户资金划转业务是:为落实公司“经营模式转型”的战略部署,充分发挥中国联通独有的cBSS全国集中运营系统资源优势,实现融合业务由产品经营向价值经营转变,总部市场部提出面向家庭客户群的“账户经营”新模式。其中的省间划转业务,总部、省分、地市的账务处理分别为()。 A、 借:内部往来-内部结算-其他-往来段:省分公司(家庭账户划转汇总统计表)(E列为正数的省分公司) 贷:内部往来-内部结算-其他-往来段:省分公司(家庭账户划转汇总统计表)(E列为负数的省分公司) B、 借:内部往来-内部结算-其他-往来段:地市分公司(家庭账户划转汇总统计表)(E列为正数的地市分公司) 贷:内部往来-内部结算-其他-往来段:集团公司(家庭账户划转汇总统计表)(E列为正数的省分公司小计) 借:内部往来-内部结算-其他-往来段:集团公司(家庭账户划转汇总统计表)(E列为负数的省分公司小计) 贷:内部往来-内部结算-其他-往来段:地市分公司(家庭账户划转汇总统计表)(E列为负数的地市分公司) C、 借:营业款结算(家庭账户划转汇总统计表)(C列地市分公司) 贷:内部往来-内部结算-其他-往来段:省分公司(家庭账户划转汇总统计表)(C列地市分公司) 借:内部往来-内部结算-其他-往来段:省分公司(家庭账户划转汇总统计表)(D列地市分公司) 贷:营业款结算(家庭账户划转汇总统计表)(D列地市分公司) D、 以上均包含 查看答案 单选 不属于个人借款自动审核规则集团必选配置的是() A、 R-001符合上传业务证明材料要求/ B、 R-034 当前业务需经过业务审批/ C、 R-011符合报账金额自动审批规范/ D、 R-010支付方式符合自动审批条件/ 查看答案 单选 以下哪项规则不是本地交通费的必选配置 A、 R-001符合上传业务证明材料要求 B、 R-007会计科目与发票项目信息符合业务规范 C、 R-010支付方式符合自动审批条件 D、 R-031供应商、合同签约方、开票单位、收款单位符合业务规范要求 查看答案 单选 集团一点结算SP业务的数据来源于哪个系统 A、 渠道集中管理系统 B、 合同系统 C、 CBSS系统 D、 PRM系统 查看答案 单选 除“内部往来—待认证进项税—一点付费业务”、"内部往来 — 待认证进项税 — 全网结算业务"科目外,其他内部往来科目不允许有差异,如有差异需尽快处理,未核对事项不得超过()个账期。 A、 1 B、 2 C、 3 D、 4 查看答案 单选 双线(数字电路、互联网专线等)一般跨越多地市,双线业务的销售地市出账按账单计收,该笔收入占用了其他地市的资源,需要按结算规则将一定收入结算给其他地市,省内跨地市结算走收管()阶段,跨省时涉及到省间结算,走收管()阶段。 A、 二、一 B、 一、二 C、 一、一 D、 二、二 查看答案 上海巨闲网络科技有限公司 沪ICP备19045477号-3 微信客服:kaoshibaovip 考试宝 一站式搜题、刷题的学习平台 立即下载 华为认证HCNA-Big Data模拟试题及答案1.(多选)基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有? A. MR B. Spark C. HDFS D. HBase 2.(单选)FusionInsight HD系统中HDFS 默认 Block Size是多少? A. 32MB B. 64MB C. 128MB D. 256MB 3. (单选) Hadoop系统中YARN资源的抽象是用什么表示? A. 内存 B. CPU C. Container D. 磁盘空间 4.(单选)Spark是用以下哪种编程语言实现的? A. C B. C++ C. JAVA D. Scala 5.(判断题) RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。 A. True B. False 6.(判断题)Spark on YARN模式下,没有NodeManager的节点不能启动executor执行task。 A. True B. False 7.(单选)关于Kerberos的TGT以下说法错误的是? A.TGT全称为票据授权服务票据,主要由KDC服务器生成 。 B. TGT一次生成之后,可以无限期使用。 C. TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储。 D. TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称。 8. (单选)FusionInsight HD系统中,用户登录到客户端,请求服务端的某个应用,客户端需要先向认证服务器请求消息获取如下哪一项? A. TGT B. ST C. PT D. TOKEN 9. FusionInsight HD 的HBase服务包含哪些进程? A. HMaster B. Slave C. RegionServer D. DataNode 10.(单选) Hadoop平台中 HBase的Region是由哪个服务进程来管理? A. HMaster B. DataNode C. RegionServer D.ZooKeeper 11.(单选) FusionInsight HD 系统中HBase的最小处理单元是Region,User Region和RegionServer之间的路由信息是保存在哪里? A. ZooKeeper B.HDFS C.Master D. meta表 12.(单选) 以下哪类数据不属于半结构化数据? A. HTML B. XML C.二维表 D.JSON 13.(单选) FusionInsight HD 中,如果需要查看当前登录HBase的.用户和权限组,可以在HBase shell中执行什么命令? A.user_permission B.whoami C.who D.get_user 14.(多选)Loader提供了哪些方式或接口实现作业管理? A.Web UI B.Linux命令行 C.Rest接口 D. Java API 15.(多选) Flume进程级联时,以下哪些sink类型用于接收上一跳Flume发送过来的数据? A.avro sink B.thrift sink C. HDFS sink D.Null Sink 16.(多选)在SolrCloud模式下,以下关于Solr相关概念描述正确的有? A. Collection是在SolrCloud集群中逻辑意义上完整的索引,可以被划分为一个或者多个Shard,这些Shard使用相同的Config Set。 B. Config Set是Solr Core提供服务必须的一组配置文件,包括solrconfig.xml和schema.xml等。 C. Shard是Collection的逻辑分片,每个Shard都包含一个或者多个replicas,通过选举确定哪个replica是Leader,只有Leader replica才能进行处理索引和查询请求。 D. Replica只有处于active状态时才会接受索引和查询请求。 17.(判断)FusionInsight HD系统中,在创建Kafka的Topic时必须设置Partition个数和副本个数,设置多副本可以增强Kafka服务的容灾能力。 A. True B. False 18.(判断)FusionInsight HD 的Streaming对于Zookeeper弱依赖,即使Zookeeper故障Streaming也可以正常提供服务。 A. True B. False 19.(单选)FusionInsightHD系统中,哪个不属于集群节点的磁盘分区? A. OS分区 B.数据分区 C.元数据分区 D.管理分区 20. (单选)FusionInsight Manager对服务的配置功能说法不正确的是? A.服务级别的配置可对所有实例生效 B.实例级别的配置只针对本实例生效 C.实例级别的配置对其他实例也生效 D.配置保存后需要重启服务才能生效 答案: 1. CD 2.C 3.C 4.D 5.A 6.A 7. B 8.A 9.AC 10.C 11.D 12. C 13. B 14.ABCD 15.BC 16.ABD 17.A 18.B 19.D 20.C 大数据面试题以及答案整理(一)一、Map端的shuffle Map端会处理输入数据并产生中间结果,这个中间结果会写到本地磁盘,而不是HDFS。每个Map的输出会先写到内存缓冲区中,当写入的数据达到设定的阈值时,系统将会启动一个线程将缓冲区的数据写到磁盘,这个过程叫做spill。 在spill写入之前,会先进行二次排序,首先根据数据所属的partition进行排序,然后每个partition中的数据再按key来排序。partition的目的是将记录划分到不同的Reducer上去,以期望能够达到负载均衡,以后的Reducer就会根据partition来读取自己对应的数据。接着运行combiner(如果设置了的话),combiner的本质也是一个Reducer,其目的是对将要写入到磁盘上的文件先进行一次处理,这样,写入到磁盘的数据量就会减少。最后将数据写到本地磁盘产生spill文件(spill文件保存在{mapred.local.dir}指定的目录中,Map任务结束后就会被删除)。 最后,每个Map任务可能产生多个spill文件,在每个Map任务完成前,会通过多路归并算法将这些spill文件归并成一个文件。至此,Map的shuffle过程就结束了。 二、Reduce端的shuffle Reduce端的shuffle主要包括三个阶段,copy、sort(merge)和reduce。 首先要将Map端产生的输出文件拷贝到Reduce端,但每个Reducer如何知道自己应该处理哪些数据呢?因为Map端进行partition的时候,实际上就相当于指定了每个Reducer要处理的数据(partition就对应了Reducer),所以Reducer在拷贝数据的时候只需拷贝与自己对应的partition中的数据即可。每个Reducer会处理一个或者多个partition,但需要先将自己对应的partition中的数据从每个Map的输出结果中拷贝过来。 接下来就是sort阶段,也称为merge阶段,因为这个阶段的主要工作是执行了归并排序。从Map端拷贝到Reduce端的数据都是有序的,所以很适合归并排序。最终在Reduce端生成一个较大的文件作为Reduce的输入。 最后就是Reduce过程了,在这个过程中产生了最终的输出结果,并将其写到HDFS上。 ?读: 1、跟namenode通信查询元数据,找到文件块所在的datanode服务器 2、挑选一台datanode(就近原则,然后随机)服务器,请求建立socket流 3、datanode开始发送数据(从磁盘里面读取数据放入流,以packet为单位来做校验) 4、客户端以packet为单位接收,现在本地缓存,然后写入目标文件 ? 写: 1、与namenode通信请求上传文件,namenode检查目标文件是否已存在,父目录是否存在 2、namenode返回是否可以上传 3、client请求第一个 block该传输到哪些datanode服务器上 4、namenode返回3个datanode服务器ABC 5、client请求3台dn中的一台A上传数据(本质上是一个RPC调用,建立pipeline),A收到请求会继续调用B,然后B调用C,将真个pipeline建立完成,逐级返回客户端 6、client开始往A上传第一个block(先从磁盘读取数据放到一个本地内存缓存),以packet为单位,A收到一个packet就会传给B,B传给C;A每传一个packet会放入一个应答队列等待应答 7、当一个block传输完成之后,client再次请求namenode上传第二个block的服务器 12345省略号,第n个数怎么表示12345省略号第n个数可以用字母“n”表示,表示该位置的数字由前面的“12345”的基础上继续增加而得到。 |