【招聘海外留学生】想去谷歌、微软、uber等大牛公司做数据分析,面试真题(已分类)

合集下载

数据分析面试题目及答案

数据分析面试题目及答案

数据分析面试题目及答案1. 数据分析的基本概念与流程数据分析是指通过收集、清洗、转化和处理数据,以获取有关特定问题或主题的见解和结论的过程。

数据分析的基本流程包括确定问题、收集数据、数据清洗、数据探索、数据建模与分析、结果解释和报告。

2. 数据清洗的常见步骤数据清洗是指对原始数据进行验证、校正、修复和完善的过程,以确保数据的质量和准确性。

常见的数据清洗步骤包括:- 缺失值处理:填充缺失值或删除包含缺失值的数据。

- 异常值处理:检测并纠正或删除异常值。

- 重复值处理:检测并删除数据中的重复值。

- 数据类型转换:将数据转换为正确的数据类型。

- 数据格式规范化:统一数据的格式和单位。

3. 数据探索分析的方法和技巧数据探索分析是指通过可视化和描述性统计等方法,深入了解数据的特征、关联性和分布。

常用的数据探索分析方法和技巧包括: - 描述性统计:计算数据的基本统计量,如均值、中位数、众数等。

- 数据可视化:使用图表和图形展示数据的分布、趋势和关联性。

- 相关性分析:计算和探索数据之间的相关性,如Pearson相关系数、Spearman秩相关系数等。

- 群组分析:基于数据的特征将数据进行分类和分组。

- 时间序列分析:探索数据随时间的变化趋势和周期性。

4. 常用的数据分析工具和编程语言在数据分析中,常用的工具和编程语言有:- Microsoft Excel:适用于简单的数据分析和可视化。

- SQL:用于处理和查询结构化数据。

- Python:强大的编程语言,提供丰富的数据分析和可视化库,如NumPy、Pandas和Matplotlib。

- R语言:专门用于统计分析和数据可视化的编程语言和环境。

- Tableau:交互式数据可视化工具,可创建富有洞察力的仪表板和报告。

5. 面试常见的数据分析题目和答案示例(以下仅为示例,实际面试题目因公司和职位而异,需灵活掌握) - 请说明你对A/B测试的理解以及在数据分析中的应用。

数据分析面试题目

数据分析面试题目

数据分析面试题目在数据分析领域,面试是获取工作机会的重要环节。

面试过程中,面试官往往会提出一些有挑战性的数据分析问题,以评估应聘者对数据分析的理解和应用能力。

下面是一些常见的数据分析面试题目,希望能够对你进行准备和复习提供一些帮助。

1. 请解释什么是数据清洗(data cleansing)?数据清洗是指从原始数据集中去除无效、重复、不准确或不完整的数据,以确保数据集的整洁和准确性。

数据清洗通常包括对缺失值、异常值和噪声数据进行处理,同时还可以进行数据格式转换和数据标准化等操作。

2. 如何处理缺失值(missing values)?处理缺失值的常用方法包括删除含有缺失值的记录、使用全局常数填充缺失值、使用平均值或中位数填充缺失值、使用相似记录的值填充缺失值等。

具体的方法选择要根据数据集的特点和具体的分析目标进行决策。

3. 请解释什么是数据可视化(data visualization)?数据可视化是通过图表、图形和其他可视化工具将数据转化成易于理解和分析的形式。

数据可视化可以帮助我们发现数据中的模式、趋势和关联性,提供对数据更全面、直观的认识,从而支持数据驱动的决策和洞察。

4. 你如何选择合适的可视化图表?选择合适的可视化图表需要考虑数据类型、分析目标和受众等因素。

例如,对于数值型数据的比较,可以选择柱状图或折线图;对于离散型数据的分布,可以选择饼图或条形图;对于时间序列数据的趋势,可以选择折线图或面积图等。

选择合适的可视化图表可以更好地展现数据的特征和模式。

5. 请说明你在数据分析项目中如何进行特征选择(feature selection)?特征选择是从原始数据中选择对分析目标有重要影响的特征。

常见的特征选择方法包括过滤法、包装法和嵌入法。

过滤法通过统计指标和相关性等方法对特征进行排序和筛选;包装法通过训练模型进行特征选择,并进行交叉验证来评估特征的重要性;嵌入法则是在模型训练过程中自动选择特征。

大数据分析师招聘面试试题及答案

大数据分析师招聘面试试题及答案

大数据分析师招聘面试试题及答案一、基础知识考查1、请简要介绍一下大数据的 4V 特征。

答案:大数据的 4V 特征分别是 Volume(大量)、Velocity(高速)、Variety(多样)和 Value(价值)。

Volume 指数据规模巨大;Velocity 表示数据产生和处理的速度快;Variety 意味着数据类型繁多,包括结构化、半结构化和非结构化数据;Value 则强调数据的价值密度相对较低,需要通过有效的分析手段来挖掘有价值的信息。

2、列举至少三种常见的大数据处理框架。

答案:常见的大数据处理框架有 Hadoop 生态系统(包括 HDFS、MapReduce 等)、Spark 框架、Flink 框架、Kafka 消息队列等。

3、解释数据清洗的主要步骤和目的。

答案:数据清洗的主要步骤包括:数据审查,检查数据的完整性、准确性和一致性;处理缺失值,可以通过删除、填充或基于模型预测等方式;处理重复数据,将重复的记录去除;纠正错误数据,对异常值和错误值进行修正。

数据清洗的目的是提高数据质量,为后续的数据分析和挖掘提供可靠的数据基础。

二、数据分析能力考查1、给定一个数据集,包含用户的年龄、性别、消费金额和购买频率,如何分析用户的消费行为特征?答案:首先,可以通过描述性统计分析,了解各个变量的分布情况,比如年龄的均值、中位数、众数,消费金额的总和、均值、标准差等。

然后,根据性别对消费金额和购买频率进行分组比较,观察是否存在性别差异。

进一步,可以进行相关性分析,判断年龄与消费金额、购买频率之间是否存在线性关系。

还可以运用聚类分析,将用户按照消费行为特征进行分类,以便针对不同类型的用户制定营销策略。

2、如何评估一个数据分析模型的准确性?答案:可以使用多种指标来评估数据分析模型的准确性。

常见的有准确率(Accuracy),即正确预测的样本数占总样本数的比例;召回率(Recall),表示正确预测的正例样本数占实际正例样本数的比例;F1 值,是准确率和召回率的调和平均数;均方误差(MSE)、均方根误差(RMSE)等用于回归模型的评估;混淆矩阵可以直观地展示模型在不同类别上的预测情况。

【留学生找工作】普华永道笔试面试真题

【留学生找工作】普华永道笔试面试真题

【留学生找工作】普华永道笔试面试真题笔试真题 & 详解真题 1(问答):1. What are the advantages anddisadvantages of a freely convertible currency? Do you think China will allowthe RMB to freely float on the international market in the next 5 years?2. What must China do to improve theconfidence of foreign investors and create a stable and open market economy?3. Comment on Chinese consumer confidencein internet-based commerce.4. Can Shanghai ever truly become thefinancial center to rival Hong Kong? If so, when and how?5. The EXPO 2010 is coming to Shanghai.What is the long term viability of the costly buildings and infrastructure atthis venue?6. How can the employment market in citieslike Shanghai and Beijing accommodate the increasing numbers of migrant workersrelocating there?7. 如何吸引外资来建立一个稳定开放的市场经济?真题 2(作文):技术进步:1. The computer is widely used in modernsociety. What are the disadvantages if one cannot use the computer? What shouldthe government do?2. 你认为你的大学为学生购置电脑和买书充实图书馆那个更加可取?3. 有关是不是该在学校使用电脑和计算器4. 你是否同意下述观点:技术能使学生们掌握更多信息并学习更快。

谷歌工程师面试题

谷歌工程师面试题

谷歌工程师面试题作为谷歌工程师面试题的例子,我们选择了以下问题:“如何设计一个系统,能够高效地存储和检索大量数据?”这个问题涉及到了数据库设计和算法优化等多个领域,是一个非常常见的面试题。

回答这个问题需要结合具体的场景和需求,下面我们将从系统设计、数据模型、存储和检索等几个方面来展开讨论。

一、系统设计:在设计一个高效的存储和检索系统时,需要考虑以下几个因素:1. 数据规模和增长率:根据系统的需求和预期的数据量,选择合适的硬件设备和存储方案,以支持数据的高效存储和检索。

2. 数据分布和冗余:分布式存储和冗余备份是避免系统单点故障和数据丢失的重要手段。

可以通过数据分片和冗余备份策略,将数据存储在多个节点上,实现高可用和可靠性。

3. 系统可扩展性和并发性:设计一个可扩展的系统,能够支持大规模的并发访问和处理。

可以采用分布式存储和负载均衡等技术,将数据和请求分散到多个节点上,提高系统的性能和可用性。

4. 缓存和预取:通过合理使用内存缓存和数据预取等技术,提高数据的访问速度和系统的响应能力。

可以根据数据的访问频率和访问模式,选择合适的缓存策略和预取算法。

二、数据模型:在设计一个存储和检索系统时,需要选择合适的数据模型和数据库类型,以满足系统的需求和业务特点。

1. 关系型数据库:适用于结构化数据和具有复杂关系的数据。

可以通过表结构和关系约束,进行数据的存储和查询。

常见的关系型数据库有MySQL和Oracle等。

2. NoSQL数据库:适用于非结构化数据和大规模数据存储。

可以根据数据的特点和访问模式,选择合适的NoSQL数据库类型,如键值存储、文档存储、列存储和图数据库等。

常见的NoSQL数据库有MongoDB、Cassandra和Redis等。

3. 图数据库:适用于存储和查询具有复杂关系的数据。

可以通过图结构和图算法,进行高效的关系查询和分析。

常见的图数据库有Neo4j和Amazon Neptune等。

三、存储和检索:在设计一个高效的存储和检索系统时,可以借鉴以下几个技术和算法:1. 压缩算法:通过压缩数据减少存储空间和传输带宽的消耗。

google 面试题

google 面试题

google 面试题Google面试题Google是全球知名的科技巨头,每年吸引了大量优秀的应聘者参与面试。

Google的面试题目以其独特性和难度而闻名,旨在考察应聘者的解决问题的能力、创造力和逻辑思维。

本文将介绍几个经典的Google面试题目,并分析解题思路。

1. 第一题:寻找字符串中的重复字符题目描述:给定一个字符串,编写一个函数来找出其中重复的字符,并返回其出现次数。

解题思路:为了找出字符串中的重复的字符,并计算它们出现的次数,我们可以使用哈希表。

遍历字符串的每个字符,如果该字符在哈希表中已经存在,则将对应的值加1;否则,在哈希表中添加该字符,并将对应的值设为1。

最后,再遍历哈希表,找出值大于1的字符,即为重复字符。

输出重复字符及其出现次数。

2. 第二题:计算两个数组的交集题目描述:给定两个整数数组,编写一个函数来计算它们的交集。

为了计算两个数组的交集,我们可以创建两个哈希表。

首先,遍历第一个数组,将数组中的元素添加到第一个哈希表中,并将对应的值设为1。

然后,遍历第二个数组,检查数组中的元素是否在第一个哈希表中存在,如果存在,则将该元素添加到第二个哈希表中,并将对应的值设为1。

最后,遍历第二个哈希表,并输出键所对应的元素,即为两个数组的交集。

3. 第三题:找出缺失的数字题目描述:给定一个包含 0, 1, 2, ..., n 中 n 个数的序列,找出序列中缺失的那个数。

解题思路:为了找出缺失的数字,我们可以将序列中的所有数字进行异或运算。

首先,初始化一个变量为0,然后,将变量与序列中的每个数字进行异或运算。

异或运算的性质是,相同数字异或结果为0,任何数字与0异或结果为其本身。

因此,最后的结果就是缺失的数字。

输出结果。

4. 第四题:二进制手表题目描述:给定一个非负整数 n 代表当前 LED 亮着的数量,返回所有可能的时间。

为了列举出亮着 n 个 LED 的所有时间,我们可以遍历二进制数。

从0到2的10次方-1,将它们表示为二进制,统计其中1的个数,如果等于给定的 n,就表示该二进制数能构成合法的时间。

微软公司的面试问题

微软公司的面试问题

微软公司的面试问题(总5页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--微软公司的面试问题这是一篇由网络搜集整理的关于微软公司的面试问题的文档,希望对你能有帮助。

★如果你需要学习一门新的计算机语言,你会怎样做?★假设由你负责设计比尔·盖茨的卫生间。

当然,钱不成问题,但是你不可以和比尔谈。

你会怎样做?★到目前为止,你遇到的最难回答的问题是什么?★如果微软公司说,我们愿意投资500万美元用来开发你提出的方案。

那么你会做什么为什么★如果你将世界上所有的计算机制造商召集起来,告诉他们必须要做一件事,你会让他们做什么事?★如果你在五年内会得到一笔奖金,你认为会是因为什么关注你的成绩的人会是谁★你如何教自己的奶奶使用微软Excel表格系统?★为什么当我们在任何一家宾馆打开热水龙头时,热水会马上流出来?★你为什么想在微软工作?★假设你回到家,进入自己的房间,打开电灯开关,可是一点反应都没有——灯没有亮。

这时,你在判断问题出在哪里时,会依次采取怎样的做法?★如果你有一个许多部件可以拆卸的时钟,你将它一块块拆开,但是没有记住是怎样拆的。

然后你将各个零件重新组装起来,最后发现有三个重要零件没有放进去。

这时你如何重新组装这个时钟?★如果你需要学习一门新的计算机语言,你会怎样做?★假设由你负责设计比尔·盖茨的卫生间。

当然,钱不成问题,但是你不可以和比尔谈。

你会怎样做?★到目前为止,你遇到的最难回答的问题是什么?★如果微软公司说,我们愿意投资500万美元用来开发你提出的方案。

那么你会做什么为什么★如果你将世界上所有的计算机制造商召集起来,告诉他们必须要做一件事,你会让他们做什么事?★如果你在五年内会得到一笔奖金,你认为会是因为什么关注你的成绩的人会是谁★你如何教自己的奶奶使用微软Excel表格系统?★为什么当我们在任何一家宾馆打开热水龙头时,热水会马上流出来?★你为什么想在微软工作?★假设你回到家,进入自己的房间,打开电灯开关,可是一点反应都没有——灯没有亮。

【招聘留学生】谷歌的那些烧脑招聘面试题,看看你够聪明吗?

【招聘留学生】谷歌的那些烧脑招聘面试题,看看你够聪明吗?

【招聘留学生】谷歌的那些烧脑招聘面试题,看看你够聪明吗?谷歌每年收到大约2,000,000份申请,但它只雇用大约4,000人,比耶鲁和哈佛的录取率还低。

很多人都被那些刁钻古怪的考试问题所难住。

网上流传的版本很多,甚至已经有些被神化的味道。

但实际上总结起来,谷歌的考试题重点在考察应试者的数学运算、物理学、以及逻辑思维。

例如:一天中,时钟的时针和分针会重合几次?How manytimes a day do the hands of a clock overlap?答案:时针和分针每小时重叠一次,但在12小时内会重叠11次,一天之内重叠22次。

这是因为在12时位置的指针重合已经计算在内。

重合时间点分别是上午12:00,1:05,2:11,3:16,4:22,5:27,6:33,7:38,8:44,9:49,10:55以及下午12:00,1:05,2:11,3:16,4:22,5:27,6:33,7:38,8:44,9:49,10:55。

The handsoverlap once an hour, but 11 times in 12 hours and 22 times in a day. This isbecause the overlap at 12 has already been accounted for. The overlaps occur at12, 1.05, 2.11, 3:16, 4:22, 5:27, 6:33, 7:38, 8:44, 9:49 and 10:55 in themorning and after midday at 12, 1.05, 2:11, 3:16, 4:22, 5:27, 6:33, 7:38, 8:44,9:49 and 10:55.再比如,应聘者们曾经回答过这样一个令人啼笑皆非的难题:全世界有多少位钢琴调音师?How manypiano tuners are there in the entire world?这类谜题被称为“费米问题”,命名来自物理学家恩里科·费米,他之所以声名远扬是因为他能够在少量的给定信息甚至没有信息的情况下进行运算。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【招聘海外留学生】想去谷歌、微软、U b e r 等大牛公司做数据分析,最新面试真题(已分类)-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN【招聘海外留学生】想去谷歌、微软、Uber等大牛公司做数据分析,最新面试真题(已分类)来自Glassdoor的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。

首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。

由于Glassdoor允许匿名提交内容,很多乐于分享的应聘者向大家提供了Facebook、谷歌、微软等大公司的面试题。

我们把其中的一部分列出以供大家参考。

通用问题Apple1.如果你有几百万用户,每个用户都会发生数百笔交易,这些交易存在于数十种产品中。

你该如何把这些用户细分成有意义的几类?Microsoft1.描述一个你曾经参与的项目,以及它的优点。

2.如何处理具有高基数(high-cardinality)的类属特征?3.如果想要给Twitterfeed写summarize,你要怎么办?4.在应用机器学习算法之前纠正和清理数据的步骤是什么?5.如何测量数据点之间的距离?6.请定义一下方差。

7.请描述箱形图(boxplot)和直方图(histogram)之间的差异,以及它们的用例。

Twitter1.你会使用什么功能来为用户构建推荐算法?Uber1.选择任何一个你真正喜欢的产品或应用程序,并描述如何改善它。

2.如何在分布中发现异常?3.如何检查分布中的某个趋势是否是由于异常产生的?4.如何估算Uber对交通和驾驶环境造成的影响?5.你会考虑用什么指标来跟踪Uber付费广告策略在吸引新用户上是否有效然后,你想用什么办法估算出理想的客户购置成本LinkedIn1.(对大数据工程师)请解释REST是什么。

机器学习问题Google1.为什么要使用特征选择(featureselection)2.如果两个预测变量高度相关,它们对逻辑回归系数的影响是什么系数的置信区间是什么3.高斯混合模型(GaussianMixtureModel)和K-Means之间有什么区别?4.在K-Means中如何拾取k?5.你如何知道高斯混合模型是不是适用的?6.假设聚类模型的标签是已知的,你如何评估模型的性能?Microsoft1.你有哪些引以为豪的机器学习项目?2.随便找一个机器学习算法,然后描述它。

3.请解释GradientBoosting是如何工作的。

4.(对数据挖掘工程师)请解释决策树模型。

5.(对数据挖掘工程师)什么是神经网络?6.请解释偏差方差权衡(Bias-VarianceTradeoff)。

7.如何处理不平衡二进制分类?8.L1和L2正则化之间有什么区别?Uber1.你会通过哪种特征来预测Uber司机是否会接受订单请求你会使用哪种监督学习算法来解决这个问题,如何比较算法的结果LinkedIn1.点出及描述三种不同的内核函数,在哪些情况下使用哪种?2.随意解释机器学习里的一种方法。

3.如何应付稀疏数据?IBM1.如何防止过拟合(overfitting)2.如何处理数据中的离群值?3.如何评估逻辑回归与简单线性回归模型预测的性能?4.监督学习和无监督学习有什么区别?5.什么是交叉验证(cross-validation),为什么要使用它?6.用于评估预测模型的矩阵的名称是什么?7.逻辑回归系数和胜算比(OddsRatio)之间存在什么关系?8.主成分分析(PCA)和线性和二次判别分析(LDA和QDA)之间的关系是什么?9.如果你有一个因变量分类,又有一个连续自变量的混合分类,你将使用什么算法,方法或工具进行分析?10.(对行业分析师)逻辑与线性回归有什么区别如何避免局部极小值Salesforce1.你会使用哪些数据和模型来测量损耗/流失如何测试模型性能2.假设我是一名非技术人员,请向我解释一种机器学习算法。

CapitalOne1.如何构建一个模型来预测信用卡诈骗?2.如何处理丢失或不良数据?3.如何从已存在的特征中导出新的特征?4.如果你试图预测客户的性别,但只有100个数据点,可能会出现什么问题?5.在拥有两年交易历史的情况下,哪些特征可以用来预测信用风险?6.请设计一个用来下井字棋的人工智能程序。

Zillow1.请解释过拟合,以及如何防止过拟合。

2.为什么SVM需要在支持向量之间最大化边缘?HadoopTwitter1.如何使用Map/Reduce将非常大的图形分割成更小的块,并根据数据的快速/动态变化并行计算它们的边缘?2.(对数据工程师)给定一个列表:123,345234,678345,123…其中第一列是粉丝的ID,第二列是被粉者的ID。

查找所有相互后续对(上面的示例中的对是123,345)。

当列表超出内存时,如何使用Map/Reduce来解决问题?CaptialOne1.(对数据工程师)什么是Hadoop序列化(serialization)2.解释一个简单的Map/Reduce问题。

HiveLinkedIn1.(对数据工程师)请编写返回情感分数的HiveUDF。

例如,假如好=1,坏=-1,平均数=0,那么对餐厅做评价时因为「食物好,服务差」,你的分数可能为1-1=0SparkCaptialOne1.(对数据工程师)用Scala语言,RDD在Spark中是如何工作的?统计和概率问题Google1.假设我是一名非技术人员,请向我解释一下交叉验证(Cross-validation)。

2.请描述一下非正态概率分布,随后告诉我们它该如何应用?Microsoft1.(对数据挖掘)请解释异方差(heteroskedasticity)是什么,以及如何解决它。

Twitter1.在给定Twitter用户数据的情况下,你该如何衡量参与度?Uber1.时间序列预测技术有什么不同?2.解释原理组件分析(PrincipleComponentAnalysis,PCA)和PCA使用的方程。

3.如何解决多重共线性(Multicollinearity)4.(对分析师)请写一个方程,优化我们在Twitter和Facebook上的广告费用支出。

Facebook1.在一副牌中抽取两张,出现同一花色的概率是多少?IBM1.什么是p-value和置信区间?CapitalOne1.(对数据分析师)如果你有70个红色弹珠,绿色和红色弹珠的比例是2比7,有多少绿色弹珠?2.纽约市的通勤数据看起来应该遵从什么分布?3.一个骰子,在扔6次的情况下出现1个6的几率,与扔12次的情况下出现至少两个6的几率,和扔600次出现至少100次6的几率相比哪个大?Paypal1.什么是中心极限定理(CentralLimitTheorem),如何证明它它的应用方向是什么编程和算法Google1.(对数据分析师)请写一个程序可以判定二叉树的高度。

Microsoft1.请创建一个函数检查一个词是否具有回文结构。

Twitter1.请构建一个幂集(powerset)。

2.请问如何在一个巨大的数据集中找到中值?Uber1.(对数据工程师)编写一个函数用来计算给定数字的平方根(2个小数点精度)。

随后:避免冗余计算,现在使用缓存机制优化你的功能。

Facebook1.假设给定两个二进制字符串,写一个函数将它们添加在一起,而不使用任何内置的字符串到int转换或解析工具。

例如:如果给函数二进制字符串100和111,它应该返回1011。

你的解决方案的空间和时间复杂性如何?2.编写一个函数,它接受两个已排序的列表,并在排序列表中返回它们的并集。

LinkedIn1.(对数据工程师)请编写一些代码来确定字符串中的左右括号是否是平衡的?2.如何找到二叉搜索树中第二大的元素?3.请编写一个函数,它接受两个排序的向量,并返回一个排序的向量。

4.如果你有一个输入的数字流,如何在运行过程中找到最频繁出现的数字?5.编写一个函数,将一个数字增加到另一个数字,就像pow()函数一样。

6.将大字符串拆分成有效字段并将它们存储在dictionary中。

如果字符串不能拆分,返回false。

你的解决方案的复杂性如何?CaptialOne1.(对数据工程师)如何「拆散」两个数列(就像SQL中的JOIN反过来)2.请创建一个用于添加的函数,数字表示为两个链表。

3.请创建一个计算矩阵的函数。

4.如何使用Python读取一个非常大的制表符分隔的数字文件,来计算每个数字出现的频率?Paypal1.请编写一个函数,让它能在O(n)的时间内取一个句子并逆向打印出来。

2.请编写一个函数,从一个数组中拾取,将它们分成两个可能的数组,然后打印两个数组之间的最大差值(在O(n)时间内)。

3.请编写一个执行合并排序的程序。

SQL问题Microsoft1.(对数据分析师)定义和解释聚簇索引和非聚簇索引之间的差异。

2.(对数据分析师)返回表的行计数有哪些不同的方法?Facebook1.(对数据工程师)如果给定一个原始数据表,如何使用SQL执行ETL(提取,转换,加载)以获取所需格式的数据?2.如何编写SQL查询来计算涉及两个连接的某个属性的频率表如果你想要ORDERBY或GROUPBY一些属性,你需要做什么变化你该怎么解释NULL LinkedIn1.(对数据工程师)如何改进ETL(提取,转换,加载)的吞吐量?智力游戏Google1.假设你有10包弹球,每包里面都是10个弹球。

如果其中一包的重量和其他的不同,但你只能进行一次称重,你该用什么办法?Facebook1.你打算坐飞机去西雅图,想知道是不是需要带伞,于是你分别打电话给三位在西雅图的朋友。

每个朋友都有2/3的几率说真话,1/3的几率在骗你。

如果他们都说「会下雨」,西雅图下雨的概率是多少?2.假如在一个等边三角形的三个角上都有一只蚂蚁,每只随机选择方向然后直走一直到另一个边缘,三只蚂蚁互相不交汇的几率是多少如果有n只蚂蚁在n角形中,概率又是多少3.在100!的结果里有多少个零?Uber1.想象一下你在一家医院工作。

患者来就诊的频率符合泊松分布,而医生照顾患者的频率符合均匀分布。

请写一个函数或一段代码来输出患者的平均等待时间和医生在某日的参与度。

LinkedIn1.你正在攀爬一个n阶的楼梯,你可以采取任何数量的k个步骤。

你到达楼梯顶部有多少不同的方式(这是楼梯问题的修改版)文档来源:专业留学生海归求职培训辅导机构海归求职网AceCareer。

相关文档
最新文档