当前位置:范文城>职场范本>笔试>

阿里巴巴往年的针对招聘数据分析实习生岗位的笔试题完整版

笔试 阅读(8K)

有幸参加阿里数据分析实习生的笔试题。在群里发现好多人的题目多不一样,应该是从题库随机发放的。

阿里巴巴往年的针对招聘数据分析实习生岗位的笔试题完整版

总共15题,客观题和主观题两部分,答题时间60min

1、以下算法对缺失值敏感的模型包括:

A、Logistic Regression

B、随机森林

C、朴素贝叶斯

D、C4.5

2、找出数列2,5,13,34,89,…的下一项:

A、233

B、144

C、267

D、ABC均错误

3、某人卖掉了两张面值为30元的电话卡,均是30元价格成交的,其中一张赚了20%,其中一张赔了20%。问他总体是盈利还是亏损,赢/亏多少?

A、不盈不亏

B、盈利2.5元

C、亏损2.5元

D、盈利2元

4、以下场景中,对应使用的挖掘算法不合适的是:

A、用关联规则算法分析购买了羽毛球的买家,是否适合推荐羽毛球鞋

B、根据用户最近几年的消费金额数据,用主成分分析法你何处用户未来一个月可能的消费金额公式

C、根据用户最近一年的购物日志数据,用K-means算法聚类出淘宝卖家中的'高富帅和白富美

D、根据用户最近购买的商品信息,用决策数算法识别出淘宝买家可能是男是女

5、投掷均匀正六面体骰子的熵是:

A、1bit

B、2.6bit

C、3.2bit

D、3.6bit

6、某调查公司接受委托满意度调查,满意分数在0~20之间,随机抽取36名消费者,平均满意分12,标准差3,在大样本的假设下,根据调查结果对总体平均的置信区间,结果是:

A、9~15分

B、11~13分

C、12~14分

D、6~18分

7、市场部选择部分用户来进行产品A的短信推广,获取了用户在时间窗口内是否购买了A产品的数据。数据挖掘同学通过这些已知的是否购买数据,用来判断其他用户的购买倾向,这在数据挖掘中属于什么任务?

A、聚类

B、预测

C、探索性分析

D、关联规则

8、如何将一个EXCEL文件单元格C2中的手机号13501245678的第四位至第七位隐藏为*

A、=replace(C2,4,4,**)

B、=replace(C2,4,4,”**“)

C、=replace(C2,4,7,”**“)

D、=replace(C2,4,7,**)

9、逻辑回归中回归参数可以用以下哪些方法求解?

A、最小二乘法

B、牛顿迭代法

C、蒙特卡洛法

D、似然估计法

10、微软的EXCEL软件是强大的数据分析工具,以入门简单、扩展功能强大、可视化丰富著称,其中EXCEL图表是数据分析师最常用的用于展现分析结果的工具,EXCEL图表选择描述正确的有:

A、折线图用来展现数据随着时间推移而发生变化,并可以预测未来的发展趋势

B、散点图用来说明同一类别的数个事物中各项的组成比重,或者某一事物随着时间推移其各个组成的比重变化

C、饼图主要用来分析内部各个组成部分的占总体的比重,反映对总体的影响

D、雷达图主要是对同类别的二组事物在多种项目上的对比

11、请说明随机森林较一般决策树稳定的几点原因。

12、考察SQL语句:

有一张交易表A(trade_no为主键),一张交易异常表B(trade_no为主键),

1)、计算交易表A中的交易总数;

2)、通过关联表的方式实现A表中去除B表异常交易(保留A中的字段即可)

13、某业务部门在上周结束了为期一周的大促,作为业务对口分析师,需要你对活动进行一次评估,你会从哪几方面进行分析。

14、世界上每十万人中就有一人是艾滋病患者。某一种药物可以帮助检测艾滋病,如果一人真是艾滋病,可以百分百检测出来,而如果一个人没有艾滋病,它的检测出错的概率是1%。请问利用这种检测药物,监测正确的概率有多高?

15、阅卷官明天要去爬山,希望正在答卷的你帮他准备个包,里面放一些必须的物品,请详述一下你会如何处理。