发布于 2014-11-08 22:38:23 | 788 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的精品教程,程序狗速度看过来!

百度(Baidu)中文搜索引擎

百度(Nasdaq简称:BIDU)是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。


本文是一份2015百度校园招聘机器学习/数据挖掘工程师岗位笔试题(杭州站),感兴趣的同学参考下。

一、简答题(本题共30分)

1、如何理解继承、多态、组合,请举例说明它们的应用。(10分)

2、请列举出进程间通信的几种方式(至少列举出三种)。(10分)

3、请写出贝叶斯公式,请描述朴素贝叶斯分类方法的原理和步骤。(10分)

二、算法与程序设计(本题共40分)

1、两个长度为100的随机向量X和Y,X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),其中xi和yi都是从均值为0,标准差为1的正态分布中随机选择的数,随机变量Z为X何Y的相关系数,请问:

1)Z的期望和标准差是多少,请写出简单的推导公式?(10分)

2)请用蒙特卡洛方法模拟,写代码计算Z的期望和标准差。(10分)

2、假设张三的mp3里有1000首歌,现在希望设计一种随机算法来随机播放。与普通随机模式不同的是,张三希望每首歌被随机到的改了吧是与一首歌的豆瓣评分(0~10分)成正比的,如朴树的《平凡之路》评分为8.9分,逃跑计划的《夜空中最亮的星》评分为9.5分,则希望听《平凡之路》的概率与《夜空中最亮的星》的概率比为89:95,。现在我们已知这1000首歌的豆瓣评分:

(1)请设计一种随机算法来满足张三的需求。(10分)

(2)请写代码实现自己的算法。(10分)

三、系统设计题(本题共30分)

1、我们队一批一维数据进行回归拟合。给你训练数据D=(xi,yi),i=1…n,其中xi∈R是一个实数,yi∈R是xi对应的回归坐标。我们拟使用线性,二次,高次函数对yi进行拟合:

线性函数:f(x)=ax+b

二次函数:f(x)=ax2+bx+c

三次函数:f(x)=ax3+bx2+cx+d

①我们设定最小均方误差为损失函数,请写出损失函数的具体形式。(5分)

②以二次函数你和为例,请使用随机梯度下降(stochastic gradient decent)对损失函数进行优化,给出参数a,b,c的梯度推倒并写出算法。(7分)

③下面三图分别是一次函数,二次函数,七次函数拟合的结果,同时给出它们在D上的损失函数值一次是0.76,0.15,0.01。在选择用什么函数作为最终拟合函数的时候,你会有哪些考虑。本例中你学会选择哪个(8分)



最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务