假设你有一个非常大的训练集合,如下机器学习算法中,你觉着有哪些是能够使用map-reduce框架并能将训练集划分到多台机器上进行并行训练的()。
A.逻辑斯特回归(LR),以及随机梯度下降(SGD)
B.线性回归及批量梯度下降(BGD)
C.神经网络及批量梯度下降(BGD)
D.针对单条样本进行训练的在线学习
ABCD
A.逻辑斯特回归(LR),以及随机梯度下降(SGD)
B.线性回归及批量梯度下降(BGD)
C.神经网络及批量梯度下降(BGD)
D.针对单条样本进行训练的在线学习
ABCD
第1题
A.*
B.1
C.10
D.30010000
第2题
第3题
如下模型可用来研究竞选支出如何影响选举结果:
其中,voteA表示候选人A得到的选票百分数,expendA和expendB分
别表示候选人A和B的竞选支出,而prtystrA则是对A所在党派实力的一种度量(A所在党派在最近一次总统选举中获得的选票百分比)。
(i)如何解释β1?
(ii)用参数表述如下原假设:A的竞选支出提高1%被B的竞选支出提高1%所抵消。
(iii)利用VOTE1.RAW中的数据来估计上述模型,并以通常的方式报告结论。A的竞选支出会影响结果吗?B的支出呢?你能用这些结论来检验第(ii)部分中的假设吗?
(iv)估计一个模型,使之能直接给出检验第(ii)部分中假设所需用的:统计量。你有什么结论?(使用双侧备择假设。)
第5题
假设你就是工商局的工作人员,领导将这件事交给你全权处理,你会怎么做?
第6题
A.使用消息队列来解耦网站应用的各个组件,利用消息队列缓存所有用户的请求
B.使用大一点的ECS来部署应用,这样有效的解决新增实例不足以应对压力的问题
C.保证额外几台ECS持续运行,在任何突发流量出现时,有存量资源应对高峰期
D.提前预热SLB,预先开启资源,应对高峰期的到来
第7题
利用GPA2.RAW中的数据,可估计出如下方程:
变量sat是SAT的综合分数,hsize是以百人计的学生所在高中毕业年级的学生规模,female是一个性别虚拟变量,而black是一个种族虚拟变量(黑人取值1,其他人则取值0)。
(i)有很强的证据支持模型中应该包括hsize”吗?从这个方程来看,最优的高中规模是什么?
(ii)保持hsize不变,非黑人女性和非黑人男性之间SAT分数的估计差异是多少?这个估计差异的统计显著性如何?
(iii)非黑人男性和黑人男性之间SAT分数的估计差异是多少?检验其分数没有差异的原假设,备择假设是他们的分数存在差异。
(iv)黑人女性和非黑人女性之间SAT分数的估计差异是多少?为了检验这个差异的统计显著性,你需要怎么做?
第8题
? 请讲述这样一个经历:为了完成某项工作,你有很多需要学的东西,但是时间又特别紧。你用什么方法来学会这些东西并按时完成了这项工作?
第9题
? 假设你接了一个活计,本来计划这个活计在一周内可以完成,但是,干到中途时,你发现这个活三个星期也干不完。应对这样的局面,你有几种选择?你将做出哪种选择?