智慧树知道网课《大数据处理和分析》课后章节测试满分答案

合集下载

2020年智慧树知道网课《大数据分析及应用》课后章节测试满分答案

2020年智慧树知道网课《大数据分析及应用》课后章节测试满分答案

第一章测试1【单选题】(2分)大数据的英文描述是()A.HeavydataB.LargedataC.GreatdataD.Bigdata2【单选题】(2分)下面最大的储存单位是()A.KBB.TBC.GBD.PB3【单选题】(2分)大数据之父是()A.詹姆斯·高斯林B.姚期智C.查尔斯·巴赫曼D.维克托·迈尔-舍恩伯格4【多选题】(2分)大数据的特点包括()A.VelocityB.ValueC.VolumeD.Variety5【多选题】(2分)第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A.PNASB.ScienceC.NatureD.Cell6【判断题】(2分)大数据是只和互联网相关的计算机技术。

A.错B.对7【判断题】(2分)企业中大部分的数据都是非结构化数据。

A.错B.对8【判断题】(2分)大数据技术的基础是由阿里巴巴首先提出的。

A.错B.对9【判断题】(2分)大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。

A.对B.错。

智慧树知到《大数据工具应用》章节测试答案

智慧树知到《大数据工具应用》章节测试答案

绗竴绔?1銆?011骞撮害鑲敗鐮旂┒闄㈡彁鍑虹殑澶ф暟鎹畾涔夋槸锛氬ぇ鏁版嵁鏄寚鍏跺ぇ灏忚秴鍑轰簡甯歌鏁版嵁搴撳伐鍏疯幏鍙栥€佸偍瀛樸€佺鐞嗗拰锛? 锛夎兘鍔涚殑鏁版嵁闆嗐€?A:璁$畻B:璁块棶C:搴旂敤D:鍒嗘瀽绛旀: 鍒嗘瀽2銆佺敤4V鏉ユ鎷ぇ鏁版嵁鐨勭壒鐐圭殑璇濓紝涓€鑸槸鎸囷細Value銆乂elocity 銆乂olume鍜岋紙锛夈€?A:VarietyB:VainlyC:VagaryD:Valley绛旀: Variety3銆佸ぇ鏁版嵁鍒嗘瀽鍥涗釜鏂归潰鐨勫伐浣滀富瑕佹槸锛氭暟鎹垎绫汇€侊紙锛夈€佸叧鑱旇鍒欐寲鎺樺拰鏃堕棿搴忓垪棰勬祴銆?A:鏁版嵁缁熻B:鏁版嵁璁$畻C:鏁版嵁鑱氱被D:鏁版嵁娓呮礂绛旀: 鏁版嵁鑱氱被4銆佹柊娴拰浜笢鑱斿悎鎺ㄥ嚭鐨勫ぇ鏁版嵁鍟嗗搧鎺ㄨ崘锛屾槸鐢变含涓滅洸鐩帹閫佸埌褰撳墠娴忚鏂版氮缃戠珯鐨勭敤鎴风殑椤甸潰涓婄殑銆?A:瀵?B:閿?绛旀: 閿?5銆佺洰鍓嶇殑澶ф暟鎹鐞嗘妧鏈彧鑳藉鐞嗙粨鏋勫寲鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?绗簩绔?1銆佹垜浠父鐢ㄧ殑寰蒋Office濂椾欢涓殑Access鏁版嵁搴撹蒋浠剁殑鏁版嵁搴撴枃浠舵牸寮忓悗缂€鍚嶆槸锛? 锛夈€?A:mdfB:mdbC:dbfD:xls绛旀: mdb2銆佸ぇ澶氭暟鏃ュ織鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:txtB:csvC:xmlD:log绛旀: log3銆佹湰璇剧▼閲嶇偣浠嬬粛鐨剋eka杞欢鐨勪笓鏈夋枃浠舵牸寮忔槸锛? 锛夈€?A:MongoDBB:ARFFC:valueD:key map绛旀: ARFF4銆佹暟鎹竻娲楀伐浣滅殑鐩殑涓昏鏄瑙e喅鏁版嵁鐨勫畬鏁存€с€佸敮涓€鎬с€佸悎娉曟€у拰锛? 锛夈€?A:涓撲笟鎬?B:鎺掍粬鎬?C:涓€鑷存€?D:鍏变韩鎬?绛旀: 涓€鑷存€?5銆佸叓鐖奔杞欢鐨勨€滆嚜瀹氫箟閲囬泦鈥濆伐浣滄柟寮忎笅锛岄渶瑕佸湪杞欢閲岃緭鍏ヤ竴涓紙锛夋潵浣滀负閲囬泦鐨勭洰鏍囥€?A:鐢佃瘽鍙风爜B:鍏抽敭璇?C:缃戦〉鍦板潃D:鐢ㄦ埛鍚?绛旀: 缃戦〉鍦板潃6銆佸叓鐖奔杞欢鐨勯噰闆嗚鍒欏彲浠ラ€氳繃鏂囦欢鐨勫舰寮忔潵瀵煎叆鎴栬€呭鍑猴紝杩欑鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:otdB:jpgC:pngD:gif绛旀: otd7銆丒xcel鍙互閫氳繃鈥滄暟鎹湁鏁堟€р€濇寜閽搷浣滄潵瑙勮寖鏁版嵁杈撳叆鐨勮寖鍥淬€?A:瀵?B:閿?绛旀: 瀵?8銆丒xcel涓嶈兘瀵煎叆txt鎴朿sv鏍煎紡鐨勬枃浠躲€?A:瀵?B:閿?绛旀: 閿?9銆佸叓鐖奔杞欢鍙兘瀵硅蒋浠跺唴寤轰簡鈥滅畝鏄撻噰闆嗏€濊鍒欑殑缃戠珯閲囬泦鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?10銆佸叓鐖奔杞欢杩涜鑷畾涔夐噰闆嗘椂锛岄渶瑕佷簡瑙e缃戦〉鐨勯〉闈㈢粨鏋勩€?A:瀵?B:閿?绛旀: 瀵?绗笁绔?1銆佷娇鐢―BSCAN绠楁硶瀵归涪灏捐姳鏁版嵁闆嗭紙Iris.arff锛夎繘琛岃仛绫伙紝灏唀psilon鍙傛暟璁剧疆涓?.2锛? minPoints鍙傛暟璁剧疆涓?锛屽拷鐣lass灞炴€э紝閭d箞灏嗗舰鎴愶紙锛変釜绨囥€?A: 1B: 2C: 3D: 4绛旀: 32銆佷娇鐢‥M绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝灏唍umClusters璁剧疆涓?锛屽嵆绨囨暟涓?锛屽叾浠栧弬鏁颁繚鎸侀粯璁ゅ€硷紝蹇界暐class灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒鐨勩€?A: 妯″瀷鐨勬渶澶т技鐒朵及璁″€兼槸-7.18B: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠?5娆?C: 绗洓涓皣鐨勫厛楠屾鐜囨槸0.14D: 绗洓涓皣鐨勫疄渚嬫暟涓?绛旀: 绗洓涓皣鐨勫疄渚嬫暟涓?3銆佷娇鐢⊿impleKMeans绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝淇濇寔榛樿鍙傛暟锛屽嵆3涓皣浠ュ強娆ф皬璺濈銆傞€夋嫨play灞炴€т负蹇界暐灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒銆?A: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?B: 浜х敓浜嗕笁涓腑蹇冪偣C: 鑱氬悎涓?涓皣锛屽垎鍒湁7锛?锛?涓疄渚?D: 骞虫柟鍜岃宸负8.928绛旀: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?4銆佷娇鐢ㄧ嚎鎬у洖褰掞紙LinearRegression锛夊垎绫诲櫒鍜岀敤M5P鍒嗙被鍣ㄥcpu.arff鍒嗗埆杩涜鍒嗙被锛岀敱鍏惰緭鍑虹殑璇樊鎸囨爣鍙煡锛? 锛夈€?A: LinearRegression鐨勬爣鍑嗚宸瘮M5P鐨勬爣鍑嗚宸皬B: LinearRegression鐨勫钩鍧囩粷瀵硅宸瘮M5P鐨勫钩鍧囩粷瀵硅宸皬C: LinearRegression鐨勭浉瀵硅宸瘮M5P鐨勭浉瀵硅宸皬D: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ绛旀: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ5銆佸垹鍘籧pu.arff鏁版嵁鏂囦欢涓殑CACH灞炴€у悗锛屼娇鐢∕5P鍒嗙被鍣ㄦ瀯寤烘柟妗堬紝鍦ㄧ粨鏋滀腑锛屽埌杈綥M2鐨勫疄渚嬫暟鏈夛紙锛変釜銆?A: 165B: 21C: 23D: 30绛旀: 216銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僿eather.nominal.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋outlook=sunny锛泃emperature=cool锛沨umidity =high锛泈indy=TRUE鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛?锛夈€?A: YesB: NoC: 娌℃湁缁撴灉D: 鏃犳硶鍒嗙被绛旀: No7銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僫ris.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋sepallength=4.4锛泂epalwidth=3.0锛沺etallength=1.3锛沺etalwidth=0.2鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛? 锛夈€?A: Iris-setosaB: Iris-versicolorC: Iris-virginicaD: 鏃犳硶鍒嗙被绛旀: Iris-setosa8銆佸叧浜嶹eka绂绘暎鍖栬鏄庢纭殑鏄紙锛夈€?A: 绂绘暎鍖栨槸灏嗘暟鍊煎睘鎬ц浆鎹负瀛楃涓插瀷灞炴€?B: 鏈夌洃鐫g鏁e寲鏈変袱绉嶇瓑瀹藉拰绛夐鏂规硶C: 绛夊绂绘暎鍖栨槸浣垮疄渚嬪垎甯冨潎鍖€鐨?D: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲绛旀: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲9銆佷互涓嬶紙锛変笉鏄疻eka鐨勬暟鎹被鍨嬨€?A: numericB: nominalC: stringD: decimal绛旀: decimal10銆佸叧浜嶹eka鐨勬枃浠剁被鍨嬫弿杩伴敊璇殑鏄紙锛夈€?A: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsxB: Weka澶勭悊鐨勬暟鎹泦绫讳技浜庡叧绯绘暟鎹簱妯瀹炰緥锛岀珫琛屽睘鎬?C: arff鏄疉SCII鏂囦欢锛屽彲浠ョ敤Word绛夋枃鏈紪杈戝櫒鎵撳紑鏌ョ湅D: @relation 瀹氫箟鏁版嵁闆嗗悕绉帮紝@data涔嬪悗鍛堢幇瀹炰緥锛屾瘡涓€琛屽氨鏄竴涓疄渚?绛旀: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsx11銆佷互涓嬪睘浜庡叧鑱斿垎鏋愮殑鏄紙锛夈€?A: CPU鎬ц兘棰勬祴B: 璐墿绡垎鏋?C: 鑷姩鍒ゆ柇楦㈠熬鑺辩被鍒?D: 鑲$エ瓒嬪娍寤烘ā绛旀: 璐墿绡垎鏋?12銆佸ぇ鏁版嵁鏃朵唬鐨勫埌鏉ワ紝浣挎垜浠棤娉曚汉涓哄湴鍘诲彂鐜版暟鎹腑鐨勫ゥ濡欙紝涓庢鍚屾椂锛屾垜浠洿搴旇娉ㄩ噸鏁版嵁涓殑鐩稿叧鍏崇郴锛岃€屼笉鏄洜鏋滃叧绯汇€傚叾涓紝鏁版嵁涔嬮棿鐨勭浉鍏冲叧绯诲彲浠ラ€氳繃浠ヤ笅锛? 锛夌畻娉曠洿鎺ユ寲鎺樸€?A: K-meansB: Bayes NetworkC: C4.5D: Apriori绛旀: Apriori13銆佹煇瓒呭競鐮旂┒閿€鍞邯褰曟暟鎹悗鍙戠幇锛屼拱鍟ら厭鐨勪汉寰堝ぇ姒傜巼涔熶細璐拱灏垮竷锛岃繖绉嶅睘浜庢暟鎹寲鎺樼殑锛? 锛夐棶棰樸€?A: 鍏宠仈瑙勫垯鍙戠幇B: 鑱氱被C: 鍒嗙被D: 鑷劧璇█澶勭悊绛旀: 鍏宠仈瑙勫垯鍙戠幇14銆佸湪杩涜鑷姩閫夋嫨灞炴€ф椂锛屽繀椤昏绔嬩袱涓璞★紝鍏朵腑纭畾浣跨敤浠€涔堟柟娉曚负姣忎釜灞炴€у瓙闆嗗垎閰嶄竴涓瘎浼板€肩殑瀵硅薄鏄笅闈㈢殑锛? 锛夈€?A: 鎼滅储鏂规硶B: 灞炴€ц瘎浼板櫒C: 鍏冨垎绫诲櫒D: 瑙勫垯鎸栨帢绛旀: 灞炴€ц瘎浼板櫒15銆佷互涓嬪睘浜庡睘鎬х┖闂寸殑鎼滅储鏂规硶鐨勬槸锛?锛夈€?A: GainRatioAttributeEvalB: BestFirstC: PrincipalComponentsD: SymmetricalUncertAttributeEval绛旀: BestFirst16銆佸湪weka杞欢鎺㈢储鑰呯晫闈腑锛屽埄鐢╒isualize鏍囩椤甸€氳繃鏇存敼鍚勪釜鍙傛暟鏉ヨ繘琛屾暟鎹泦鐨勫彲瑙嗗寲灞炴€ц缃悗锛岄渶瑕佸崟鍑讳互涓嬶紙锛夋寜閽紝鎵€鏈夋洿鏀规墠浼氱敓鏁堛€?A: Select AttributeB: SubSampleC: UpdateD: Fast scrolling绛旀: Update17銆佺粰瀹氬叧鑱旇鍒橝B锛屾剰鍛崇潃锛氳嫢A鍙戠敓锛孊涔熶細鍙戠敓銆?A:瀵?B:閿?绛旀: 閿?18銆佹敮鎸佸害鏄閲忓叧鑱旇鍒欓噸瑕佹€х殑涓€涓寚鏍囥€?A:瀵?B:閿?绛旀: 瀵?19銆丷anker鏂规硶鏃㈠彲浠ョ敤浜庡崟涓睘鎬ц瘎浼板櫒锛屽張鍙互鐢ㄤ簬灞炴€у瓙闆嗚瘎浼板櫒銆?A:瀵?B:閿?绛旀: 閿?20銆佸埄鐢╳eka杞欢杩涜鏁版嵁鍙鍖栨椂锛岀敤鎴峰彲浠ラ€夋嫨绫诲埆灞炴€у鏁版嵁鐐圭潃鑹诧紝濡傛灉绫诲埆灞炴€ф槸鏍囩О鍨嬶紝鍒欐樉绀轰负褰╄壊鏉°€?A:瀵?B:閿?绛旀: 閿?绗洓绔?1銆佽礉鍙舵柉缃戠粶涓殑鑺傜偣浠h〃锛? 锛夈€?A:鍙橀噺B:闅忔満杩囩▼C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 闅忔満鍙橀噺2銆佽礉鍙舵柉缃戠粶涓紝鑺傜偣闇€缁欏嚭姒傜巼鍒嗗竷鎻忚堪锛屽浜庣鏁e瀷闅忔満鍙橀噺鑰岃█锛屽彲浠ョ敤锛? 锛夌殑褰㈠紡琛ㄧず銆?A:鏉′欢姒傜巼瀵嗗害鍑芥暟B:姝f€佸垎甯?C:鏉′欢姒傜巼琛?D: 鍧囧寑鍒嗗竷绛旀: 鏉′欢姒傜巼琛?3銆佽礉鍙舵柉缃戠粶涓妭鐐逛箣闂寸殑杈逛唬琛紙锛夈€? A:闅忔満鍏崇郴B:姒傜巼鍥犳灉C:缁勫悎鍏崇郴D:闅忔満缁撴灉绛旀: 闅忔満鍏崇郴4銆佽礉鍙舵柉缃戠粶淇濆瓨鐨勬枃浠舵牸寮忔槸( )銆?A:XML BIFB:DOCXC: TXTD:XLS绛旀: XML BIF5銆佷笅闈紙锛変笉鏄弽鍚戜紶鎾缁忕綉缁滅殑缁撴瀯銆? A:杈撳叆灞?B:闅愬惈灞?C:璁$畻灞?D:杈撳嚭灞?绛旀: 璁$畻灞?6銆佺缁忕綉缁滀腑鐨勮妭鐐逛唬琛紙锛夈€?A:婵€鍔卞彉閲?B:婵€鍔卞嚱鏁?C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 婵€鍔卞嚱鏁?7銆佷笅鍒楋紙锛変笉鏄父瑙佺殑婵€鍔卞嚱鏁般€?A:绾挎€у嚱鏁?B:Sigmoid鍑芥暟C:闃堝€煎嚱鏁?D:姝e鸡鍑芥暟绛旀: 姝e鸡鍑芥暟8銆佸湪璐濆彾鏂綉缁滅紪杈戠晫闈㈡椂锛屽鏋滆妭鐐圭殑鍚嶇О娌℃硶瀹屽叏鏄剧ず锛岄渶瑕佷粠锛? 锛夎彍鍗曢」杩涜璋冩暣銆?A:Tools|SetDataB:View|Zoom OutC:View|Zoom InD:Tools|Layout绛旀: Tools|Layout9銆乄EKA涓€夋嫨绁炵粡缃戠粶鍒嗙被鍣ㄦ搷浣滄椂锛屽簲璇ラ€夋嫨锛? 锛夈€?A:rules鏉$洰涓嬬殑PARTB:functions鏉$洰涓嬬殑SGD鍒嗙被鍣?C:functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?D:榛樿鐨勫垎绫诲櫒绛旀: functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?10銆佷笅闈㈠叧浜嶱ackage Manager瀹夎鍚庣殑鐩綍璇存槑涓嶆纭殑鏄紙锛夈€?A:doc瀛愮洰褰曞瓨鏀続PI鏂囨。

智慧树知到《大数据算法》章节测试答案

智慧树知到《大数据算法》章节测试答案

3.大数据算法的()特点,使其与大数据算法密切相关的。答案:速度快数据量大 A、数据量大 B、基于高度分析的新价值 C、速度快 D、多样性、复杂性 4.为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技 术会涉及到时间亚线性算法。× 1.5 1.大数据算法涉及到外存的时候,通常要分析()。答案:IO 复杂性 A、时间空间复杂性 B、IO 复杂性 C、结果质量 D、通讯复杂性 2.下列选项中,属于智能仿生算法的是()。答案:遗传算法模拟退火算法 A、遗传算法 B、近似算法 C、模拟退火算法 D、数据流算法 3.在线算法/数据流算法是面向大数据速度快的特点提出的。()√ 4.对于数据流算法或在线算法,经常要分析结果的近似比。()× 5.随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。 ()√ 2.1
()√ 4.在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差 的最多值时,可以得到频繁项一个好的估计。√ 3.3 1. 时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。答 案:权重 A、近似值 B、精确值 C、权重 D、界限 2.求最小生成树是一个贪心法,可以用()算法来解决。答案:Prime A、Prime B、并行 C、MG D、内存 3.对联通分量个数的估计可以利用随机化方法。√ 3.4 1. 对于输入 n 个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。远离意味 着必须删除大于()个元素才能保证剩下的元素有序。答案:n A、-n B、n C、/n
D、(1-)-近似 2.利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。 答案:二分之一 A、二分之一 B、三分之一 C、四分之一 D、十分之一 3.采用平面图的直径近似算法的动机是无法在要求的时间内得到()。答案:精确 解 A、相似解 B、完整解 C、精确解 D、近似解 4.在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在 i、j、k 三个点中,i 到 j 的距离加上 j 到 k 的距离小于 i 到 k 的距离。× 5.近似算法能给出一个优化问题的优化解。× 6.RatioBound 越大,则近似解越坏。()√ 2.4 1. 在判定问题的近似中,对于近似解需要区分的是()。答案:差得很远是 A、是 B、否 C、差不离 D、差得很远

智慧树知到大数据分析与应用章节测试答案

智慧树知到大数据分析与应用章节测试答案

第一章单元测试1、单选题:大数据泛指巨量的()。

选项:A:数组集B:数字集C:数据集D:字符集答案: 【数据集】2、单选题:数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。

选项:A:统计分析方法B:定性与定量方法C:概率分析方法D:系统分析方法答案: 【统计分析方法】3、单选题:浏览数据这一步骤可以通过对大数据进行()来实现。

选项:A:流程化B:分析化C:简易化D:可视化答案: 【可视化】4、多选题:Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。

选项:A:流程优化能力B:数据处理能力C:决策力D:洞察发现力答案: 【流程优化能力;决策力;洞察发现力】5、多选题:我们通常用“4V”来反映大数据的特点,4V是指()。

选项:A:VelocityB:VarietyC:VariousD:Valid答案: 【Velocity;Variety】6、多选题:大数据分析可以应用在那些领域()。

选项:A:商业领域B:医疗卫生领域C:交通运输领域D:农业领域答案: 【商业领域;医疗卫生领域;交通运输领域;农业领域】7、多选题:大数据分析的过程包括()。

选项:A:数据理解B:数据处理C:数据优化D:数据准备答案: 【数据理解;数据准备】8、判断题:数据只要有足够的规模就可以称为大数据。

()选项:A:对B:错答案: 【对】9、判断题:大数据分析是大数据到知识,再到信息的关键步骤。

()选项:A:错B:对答案: 【错】10、判断题:大数据分析模型用于描述数据之间的关系。

如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。

()选项:A:对B:错答案: 【对】第二章单元测试1、单选题:数据仓库的定义于哪一年提出()。

选项:A:1991B:2015C:1902D:2002答案: 【1991】2、单选题:符合选择建立数据仓库平台的公认标准的是()。

选项:A:是否提供支持少量数据的数据加载B:是否支持对数据库的管理C:是否支持串联操作D:数据库对大数据量的支持能力答案: 【数据库对大数据量的支持能力】3、单选题:建立数据仓库的首要步骤是()。

智慧树知到《大数据工具应用》章节测试答案

智慧树知到《大数据工具应用》章节测试答案

1、2011 年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。

A:计算B: 访问C: 应用D: 分析答案: 分析2、用4V 来概括大数据的特点的话,一般是指:Value 、Velocity 、Volume 和()。

A:VarietyB:VainlyC:VagaryD:Valley答案: Variety3、大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测。

A: 数据统计B: 数据计算C: 数据聚类D: 数据清洗答案: 数据聚类4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。

A: 对B:错5、目前的大数据处理技术只能处理结构化数据。

A: 对B: 错答案: 错第二章1、我们常用的微软Office 套件中的Access 数据库软件的数据库文件格式后缀名是()。

A:mdfB:mdbC:dbfD:xls答案: mdb2、大多数日志文件的后缀名是()。

A:txtB:csvC:xmlD:log答案: log3、本课程重点介绍的weka 软件的专有文件格式是()。

A:MongoDBB:ARFFC:valueD:key map4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。

A: 专业性B: 排他性C: 一致性D: 共享性答案: 一致性5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。

A: 电话号码B: 关键词C: 网页地址D: 用户名答案: 网页地址6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。

A:otdB:jpgC:pngD:gif答案: otd7、Excel 可以通过“数据有效性”按钮操作来规范数据输入的范围。

A:对B: 错8、Excel 不能导入txt 或csv 格式的文件。

A: 对B: 错答案: 错9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。

2020年智慧树知道网课《大数据概论》课后章节测试满分答案

2020年智慧树知道网课《大数据概论》课后章节测试满分答案

第一章测试1【单选题】(2分)下列哪个表述是的?A.在芯片里运行的程序可以是汇编语言编写。

B.在芯片里运行的程序可以是C语言编写。

C.在芯片里运行的程序可以是二进制语言编写。

D.在芯片里运行的程序可以是面向对象语言编写。

2【单选题】(2分)以下哪一种不是计算机操作系统?A.iOSB.LinuxC.OracleD.Android3【单选题】(2分)微软对Windows界面的开发主要受到哪家公司的启发?A.IBMB.3MC.施乐D.苹果4【单选题】(2分)Windows和Linux或者iOS和Android之间的最大区别在于什么?A.价格:前者贵后者便宜B.思想:前者封闭后者开源C.用户体验:前者优后者差D.速度:前者快后者慢5【多选题】(2分)医疗领域如何利用大数据?A.用户行为分析B.个性化医疗C.临床决策支持D.社保资金安全6【判断题】(2分)现在非结构化数据已经占人类数据量的25%。

A.对B.错7【判断题】(2分)大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。

A.对B.错8【单选题】(2分)Python是一种面向对象、()计算机程序设计语言。

A.解释型B.编译型9【判断题】(2分)ASCII码使用一个字节编码。

A.错B.对10【判断题】(2分)GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。

A.对B.错第二章测试1【判断题】(2分)人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。

A.错B.对2【单选题】(2分)大数据的利用过程是()。

A.采集-清洗-统计-挖掘B.采集-统计-清洗-挖掘C.采集-清洗-挖掘-统计D.采集-挖掘-清洗-统计3【判断题】(2分)信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。

A.错B.对4【判断题】(2分)数据是作为信息的重要来源,信息经过加工转化为知识。

A.对B.错5【判断题】(2分)在大量知识积累基础上,总结成原理和法则,就形成了智慧。

大数据技术基础智慧树知到答案章节测试2023年东北石油大学

大数据技术基础智慧树知到答案章节测试2023年东北石油大学

绪论单元测试1.本课程中关于大数据处理与分析部分的学习内容有:()A:Mapreduce的编程模型B:大数据分析的常用算法C:大数据分析过程D:大数据分析分析工具答案:ABCD第一章测试1.大数据的基本特征包括()。

A:数据的价值密度但商业价值高B:数据增长速度快C:数据来源和数据数据类型多样化D:数据规模大答案:ABCD2.下面说法正确的是()。

A:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称B:大数据是第三次信息化浪潮以后产生的数据C:大数据就是数据容量达到1T以上的数据D:大数据指数据而不包括数据的分析结果答案:A3.下面哪些技术属于大数据技术。

()A:快速传输数据的技术。

B:网盘数据存储技术C:从各种数据源中采集数据的技术。

D:人脸识别技术。

答案:ABC4.如何理解“大数据分析是相关性分析而不是因果分析”。

()A:不仅要知其然,还要知其所以然。

B:不仅要进行相关分析分析,也要进行因果关系分析。

C:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。

D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。

答案:ABCD5.大数据的特征Variety是指:()A:数据变化多端B:数据来源广泛C:数据格式多样D:数据用途丰富答案:BC第二章测试1.在Python中,语句print(3 < 5 > 2)的输出结果为False。

()A:错B:对答案:A2.已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。

()A:对B:错答案:A3.扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。

()A:对B:错答案:B4.已知x = [1,2]和y = [3,4],那么x+y的结果是()。

A:3B:7C:[4, 6]D:[1, 2, 3, 4]答案:D5.Pandas中常用的数据结构包括()。

大数据处理与分析考试试题及答案

大数据处理与分析考试试题及答案

大数据处理与分析考试试题及答案一、选择题1. 大数据的定义是以下哪一项?A. 数据量超过1TB的数据B. 数据量超过100TB的数据C. 数据量超过1PB的数据D. 数据量超过1EB的数据答案:C. 数据量超过1PB的数据2. 大数据处理的特点是以下哪一项?A. 数据量大B. 处理速度快C. 数据种类繁多D. 数据质量高答案:A. 数据量大3. 下列哪项属于大数据处理的挑战?A. 存储问题B. 安全问题C. 隐私问题D. 数据质量问题答案:B. 安全问题4. Hadoop是以下哪一个大数据处理框架的代表?A. Apache SparkB. Apache CassandraC. MapReduceD. Apache Kafka答案:C. MapReduce5. 大数据分析的目的是以下哪一项?A. 提高数据存储能力B. 增加数据处理速度C. 发现潜在的业务机会D. 优化数据传输效率答案:C. 发现潜在的业务机会二、填空题1. 关系数据库一般使用______作为数据查询语言。

(SQL)2. 数据治理是保证数据______、______、______和______的一种管理方式。

(准确性、可用性、完整性、安全性)3. 在大数据处理中,______是指对数据进行有效的汇总和调整,以适应分析或查询的需要。

(数据聚合)4. ______是一种数据存储和访问模式,能够有效地存储和查询大规模分布式数据。

(分布式文件系统)5. 大数据分析的常用技术包括______、______和______等。

(机器学习、数据挖掘、自然语言处理)三、简答题1. 请简述大数据处理的四个V特点。

答:大数据处理的四个V特点分别是:Volume(数据量大)、Velocity(处理速度快)、Variety(数据种类繁多)和Value(价值密度低)。

Volume表示大数据的特点是数据量巨大,超出了传统数据库的处理能力;Velocity表示大数据处理需要在短时间内进行高速处理;Variety表示大数据包括结构化数据、非结构化数据和半结构化数据等多种数据类型;Value表示大数据中包含了大量的背景信息和潜在的商业价值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章测试
1
【单选题】(2分)
大数据分析的最终目的是()
A.
通过数据分析来挖掘数据背后的价值
B.
发现数据
C.
处理数据
D.
查找数据
2
【多选题】(2分)
数据采集的方式包括()
A.
网络下载数据
B.
主动数据采集
C.
购买数据
3
【判断题】(2分)
Wireshark是手机数据的采集软件()
A.

B.

4
【判断题】(2分)
手机和手机APP是同时连通网络的()
A.

B.

5
【单选题】(2分)
360随身WIFI的目的是()
A.
构造局域网,从而让手机连通电脑
B.
让手机APP连通电脑
C.
让电脑成为一个WIFI发射装置
D.
让电脑上网
6
【多选题】(2分)
对于电脑+手机+360WIFI而言,它们之间存在的网络包括()
A.
手机的4G网络
B.
路由器产生的网络
C.
360WIFI构成的无线网络
D.
笔记本电脑连接的Internet网络
7
【判断题】(2分)
手机APP的联网效率是指手机联上网络的时间T1和手机APP联上网络的时间T2之差()
A.

B.

8
【判断题】(2分)
在上一题中,T1-T2的值越小时,手机APP的联网效率越高。

()
A.

B.

9
【判断题】(2分)
开始手机数据收集之前,需要先关闭手机的3G或者4G网络,仅让手机连接360WIFI的网络()
A.

B.

10
【单选题】(2分)
在手机断开WIFI之后,手机APP会()
A.
立即断开网络
B.
无法判断
C.
继续连接网络。

相关文档
最新文档