本页目录

专业课复习

线性代数

1.

介绍一下矩阵的秩,秩有什么物理意义?

从定义来说,矩阵的秩等于行向量组的秩,也就是行向量组中线性无关的向量的最大数目,对于列向量组同样成立,矩阵的行秩等于列秩。从几何意义来说,矩阵的秩是列空间或行空间的维度,也是线性变换后的空间维度。

2.

向量组线性相关/线性无关的充要条件?

线性表示的角度:存在/不存在一个向量能被其他向量线性表示;
秩的角度:向量组的秩小于/等于向量个数;
线性方程组的角度:假设向量组记作,齐次方程组有/无非零解。

3.

介绍下维向量空间?

一般地,由全体维向量构成的集合是维向量空间。集合对加法数乘封闭。

4.

什么是欧式空间?和向量空间是什么关系?

欧式空间是一个带有内积的向量空间,欧式空间是向量空间的一种特例。

5.

线性方程组的解有哪些情况,对应什么条件?

增广矩阵(也就是)的角度:
无解:消元后(增广矩阵的阶梯型)有非零常数的情况;
有唯一解:增广矩阵阶梯型非零行数等于未知数个数;
有无穷解:增广矩阵阶梯型存在零行。

空间变换/秩的角度:
无解:系数矩阵的秩小于增广矩阵的秩,或者不存在于向量空间中;
有唯一解:有解的前提下,系数矩阵或增广矩阵空间满秩(秩等于未知数个数);
有无穷解:有解的前提下,系数矩阵或增广矩阵空间不满秩(秩小于未知数个数)。

6.

假如非齐次方程组有唯一解,那么齐次方程组解空间的维度是多少?

零维。

7.

什么是矩阵特征值和特征向量?怎么求矩阵的特征值?特征值有什么物理意义?

定义:阶方阵存在,则数为方阵的特征值,向量为属于的特征向量。
求解:个根就是个特征值,重根对应至多个线性无关的特征向量。
物理意义:对于变换而言,特征向量只受拉伸作用,也就是变换前后共线,特征值为拉伸倍数。

8.

什么是代数重数和几何重数?二者有什么关系?

代数重数是特征值在特征多项式中的重数,几何重数是特征值对应的线性无关特征向量的个数。
代数重数几何重数。

9.

矩阵相似的概念?相似矩阵有什么性质?相似矩阵有什么 物理意义?

若存在可逆的阶方阵,使得, 则称相似。相似矩阵有相同的特征值、行列式、秩、迹,但不一定有相同的特征向量。相似是同一个线性变换在不同坐标系下的表达。

10.

矩阵可以相似对角化的充要条件是什么?

如果阶矩阵个线性无关的特征向量,则可以相似对角化。

11.

特征值相同的矩阵一定相似吗?追加一个条件使得一定相似?

不一定。两者都可对角化(比如当这些特征值互异)时相似。

特征值有重根,不一定不可对角化;两个矩阵都不可对角化,也不一定不相似。

12.

什么是矩阵的迹,有什么性质?

方阵主对角线之和被称为矩阵的迹,记作

转置不改变迹,

迹满足交换律,对于矩阵,有

迹等于特征值之和。(对特征多项式用韦达定理,此外还可得行列式等于特征值之积)

13.

矩阵合同的概念?

若存在可逆的阶方阵,使得,则称合同。

14.

什么是正交矩阵,有什么性质?

阶实矩阵满足,则称为正交矩阵。此时有
正交矩阵的行列式为,正交矩阵的乘积仍为正交矩阵。

15.

你觉得正交矩阵描述的空间变换具有什么几何性质?

正交变换不发生形变,只存在旋转镜像操作。

16.

实对称矩阵有什么性质?

特征值都是实数,不同特征值的向量正交(对于普通矩阵仅仅是线性无关)。
对于实对称矩阵必然存在正交矩阵使得是对角阵。

主轴定理

对于一个实二次型,总能通过正交变换使得:

式中的特征值。

img

在二维情形理解其几何含义,也就是一个斜向的圆锥曲线可以正交变换为标准形式。

17.

介绍一下正定矩阵?

如果一个二次型对空间中任意都有,则其对应的矩阵为正定矩阵。(是半正定)

判断正定矩阵的充要条件有:特征值全部大于顺序主子式全部大于等(注意前提是对称矩阵)。

概率论

1.

介绍一下条件概率、全概率公式、贝叶斯公式。

条件概率:称为发生的条件下,的条件概率。

全概率公式:如果是对事件空间的划分,有

贝叶斯公式:条件同上,有。贝叶斯公式可以理解为用先验概率估计后验概率

2.

说几个常见的离散型分布,它们的期望和方差是什么?

两点分布:,有

二项分布:,有;可以理解为进行次实验,事件发生次数的可能情况;

泊松分布:,有;泊松分布是二项分布很小时的极限情况。

3.

方差的公式是什么,有什么变形?

4.

协方差的公式是什么,有什么变形?

5.

协方差和相关系数是什么关系?

的相关系数是它们经过标准化之后的协方差。

6.

的方差怎么求?

如果独立,
更一般的情况是:

7.

解释一下相关和独立和关系,判断条件是什么?

独立一定不相关,但不相关不一定独立。独立是完全无关,而统计学上的相关一般指线性相关。

独立的充要条件是的协方差/相关系数不为就相关。

8.

什么是依概率收敛?

依概率收敛是指对于任意,有,则称依概率收敛到

9.

介绍一下大数定律?

如果随机变量序列满足

则称服从大数定律。

大数定律刻画了随机变量的平均值依概率收敛为期望的均值。

切比雪夫大数定律:如果两两不相关,且方差有限,则服从大数定律。

伯努利大数定律:如果事件次伯努利试验中发生了次,事件发生的概率为,则有

辛钦大数定律:如果独立同分布,且期望存在,则服从大数定律。

伯努利大数定律意义是频率估计概率;上面提到的另外两个大数定律意义是均值估计期望,但条件有所不同。

10.

介绍一下中心极限定理?

大数定律研究一系列随机变量的均值是否收敛于期望,而中心极限定理进一步研究了的分布。

满足一定的条件,当足够大时,近似服从正态分布,这就是中心极限定理的主要思想,这也体现了正态分布的重要性与普遍性。

独立同分布中心极限定理:设是独立同分布的随机变量序列,期望为,方差为,则有足够大时近似服从正态分布

11.

正态分布的和/差的分布是什么?

如果,且独立,则

12.

计算方差时,什么时候要除以,什么时候要除以

如果有总体的数据,除以即可;如果数据是总体抽出的个样本,计算方差要除以,这被称为样本方差

13.

计算样本方差时,为什么要除以

为了保证样本方差是对总体方差的无偏估计。

14.

极大似然估计是什么?

如果已知了分布的形式,用能够最大化观测到当前样本的概率的参数值,作为对分布参数的估计值。

追问:如果不知道分布的形式怎么办?

模式识别非参数估计:直方图,k近邻,Parzen窗。

计算机网络

1.

网络为什么要分层呢?分哪些层?每层的职责是什么?

计算机科学领域的很多问题都通过分层来解决,设计层次结构的主要目的是将复杂的问题划分为较小的、较为清晰的问题,各层之间相互独立,从而上层可以利用下层抽象出来的接口,而不用关心下层的具体实现。

自底向上有:
物理层:为数据比特传输提供物理媒介。
链路层:数据在链路层分装为帧,链路层负责帧在相邻节点之间的可靠传输,服务于网络层。
网络层:网络层传输IP数据报,将源节点发出的数据包传送到目的节点,提供主机之间点到点的传输。
运输层:运输层为主机的进程之间提供端到端的服务。
应用层:提供特定应用的网络服务。

2.

你电脑上发出去的数据,先被运输层包装,还是先被网络层包装?

先被运输层包装。对于发送方而言,从上到下层层包装;对于接收方而言,从下到上层层解开包装。

3.

介绍一下奈奎斯特定理和香农定理?

奈奎斯特定理:理想低通信道,极限数据传输速率为(bit/s),其中为信道带宽(Hz)为码元的离散电平数目。
(例如,位码元
也可以表述为:理想低通信道,最高码元传输速率为(码元/s)

香农定理:在有噪声的信道中,信息传输的极限速率为(bit/s),其中为信道带宽(Hz)为信噪比。

4.

码元传输速率超过上限会发生什么?

码间串扰,即失去码元之间清晰的界限。

5.

媒体接入控制是什么?有哪些方式?

当多个发送方和多个接收方共享一个信道时,需要协调对这个信道(物理媒介)的访问,这也是媒体接入控制旨在解决的问题。

媒体介入控制大体可以分为两种:静态划分信道动态接入控制,前者也就是多路复用技术,包括时/频/波/码分多路复用;后者通过协议来进行控制。
动态接入控制又可以分为轮询访问随机访问,轮询访问有令牌传递协议;随机访问包括ALOHA、CSMA、CSMA/CD、CSMA/CA协议等。

6.

CSMA/CD中文是什么?CSMA/CD相比CSMA有什么区别?

CS:载波监听;MA:多路访问;CD:碰撞检测。
CSMA发生冲突仍然会把数据帧发完,等待接收方响应NAK(或不响应),这是一种被动的方式。CSMA/CD则是主动检测到冲突后立即停止发送,等待随机时间(截断二进制指数回退)后再次发送。

7.

再介绍一下CSMA/CA?

CA:碰撞避免。CSMA/CA用于无线网络。无线网络存在“隐蔽站”问题,使用碰撞检测意义不大;CSMA/CA通过预约信道机制实现碰撞避免。考虑到无线信道通信质量远不如有线信道,CSMA/CA使用确认帧机制。

8.

介绍一下争用期的概念,争用期有什么意义?

争用期是倍的单程传播时延。如果经过争用期时间,还没有检测到碰撞,就一定不会发生碰撞。

9.

解释一下以太网为什么要限制最小帧长和最大帧长?(可以不给出精确数字,只定性的解释原因)

限制最小帧长:帧的传输时间要大于争用期,防止一个站点还没来得及检测到其发送的帧产生了碰撞,就已经将这个帧发送完毕了。
限制最大帧长:防止一个站点过长时间的占用信道;同时也是防止接收方的缓冲区产生溢出。

10.

交换机和路由器的区别?

交换机工作在链路层,根据MAC地址转发数据;路由器工作在网络层,根据IP地址转发数据。

11.

MAC地址和IP地址有什么区别?

MAC是链路层地址,IP是网络层地址;
MAC地址具有唯一性,IP地址不具有。

12.

介绍你知道的动态路由协议?

RIP:属于内部网关协议,基于距离矢量法,使用UDP;RIP协议只和相邻路由器交换信息,交换的信息是自己的路由表。
OSPF:属于内部网关协议,基于链路状态法,使用IP;路由信息会泛洪给网络中所有路由器,每个路由器计算以自身为根节点到所有节点的最短路径树。OSPF相比于RIP更适用于大型网络。
BGP:属于外部网关协议,使用TCP。负责自治系统之间的路由选择。

13.

怎么判断一个子网掩码是否合法?

二进制32位,且满足形式:连续的1后面跟随连续的0

14.

有没有可能一个主机的公网IP地址是192.168.3.3

不可能。192.168.0.0~192.168.255.255被用作为私有地址,仅对本地网络中的设备有意义。想在互联网上发送或接收数据需要用到NAT。

追问:介绍一下NAT协议?

全称是网络地址转换。NAT可以将内网的IP地址映射到互联网上的IP地址,从某种角度,NAT使得路由器对外界隐藏了本地网络的细节。

15.

升级到IPv6主要是为了解决什么问题?IPv6比IPv4有什么改进?

为了解决IPv4地址用尽。IPv6地址空间更大,且改进了报文头(例如移除了校验和字段、可选字段)以提高路由效率。

16.

介绍一下ARP协议?

全称是地址解析协议。ARP协议用于解决在同一个局域网中,已知IP地址,如何找到对应的MAC地址。ARP协议维护一个IP地址和MAC地址的映射表,如果在ARP表中找不到对应的IP地址,就会广播ARP请求,请求对应IP地址的主机回复自己的MAC地址。

17.

介绍一下ICMP协议?

全称是互联网控制报文协议。ICMP是网络层协议,从技术角度来说就是一个差错报告机制,不用来传递数据,而是用作网络诊断、排除故障等。一个常见的应用是ping命令。ICMP协议可能被恶意的用作拒绝服务攻击

18.

介绍一下DHCP协议?

全称是动态主机配置协议。DHCP是使用UDP协议的应用层协议,用于自动给内网设备分配IP地址。分为发现、提供、选择、确认四个阶段。

19.

说说TCP和UDP的区别?

TCP是面向连接的,UDP是无连接的;
TCP提供可靠数据传输,UDP是不可靠的;
TCP资源负载比较大,由于有流量控制、拥塞控制等机制,TCP比UDP慢。

20.

介绍一下TCP连接建立、释放的过程?

连接建立:三次握手,客户端请求,服务端确认,客户端再次确认。

连接释放:四次挥手,客户端请求,服务端确认,服务端发送完全部数据后发送连接释放报文,客户端收到后确认。
客户端确认了连接释放报文段后,还要经过二倍MSL时间才能关闭连接,以防发送的确认报文丢失。如果直接进入关闭状态就无法接收到服务端重传的连接释放报文。

追问:为什么建立连接不能两次握手?

TCP是双向通信协议,双方都分别需要通过一次SYN和一次ACK来约定序列号等参数,保证连接的可靠性。虽然这样看起来是四步, 但实际上中间的两次(服务端响应客户端的ACK、服务端请求客户端的SYN)是合并到一起的,因此总共需要三次握手。

另一个角度:如果客户端发送了两个连接请求(第一个连接请求因为网络原因延迟到达),可能延迟到达的请求被收到时,最开始的连接已经释放了。如果服务端不需要第三次握手,就会直接进入连接状态,但是又收不到客户端发送的数据,导致资源浪费。

21.

TCP是怎么保证可靠传输的?

TCP的发送方会维护发送窗口,接收方也会维护接收窗口,这点与SR类似;但TCP采用与GBN类似的累计确认。需要注意的是,GBN中ACK n表示序号为n及其之前的分组都已经被正确接收,而TCP中ACK n表示序号为n-1及其之前的分组都已经被正确接收,接收方期望收到的最小序号的分组是序号n

22.

TCP是怎么做流量控制和拥塞控制的?二者的异同?

流量控制:为了防止发送方传输速度超过了接收方的接收能力。接收方通过设置头部中的窗口字段,根据自己接收缓存的大小,动态地调整发送方的发送窗口大小。

拥塞控制:为了防止过多数据注入到网络当中。手段有:慢开始、拥塞避免、快重传、快恢复。

流量控制是端到端的问题,由接收方主动控制发送方的发送窗口,受限于接收方接收能力;拥塞控制是网络上的全局问题,由发送方主动控制发送速率,受限于网络拥塞程度。相同点是二者控制的对象都是发送方的发送速率

追问:详细介绍一下拥塞控制的手段?

慢开始:拥塞窗口从1开始指数增长到门限值。

拥塞避免:增大到门限值后线性加1,如果发生了超时重传,将门限设为当前拥塞窗口的一半,然后将拥塞窗口置1

快重传:收到三次重复的ACK n,就不等待重传计时器了,立即重传分组n

快恢复:配合快重传使用。如果发生了快重传,就知道现在只是丢失了个别的报文段而不是网络拥塞。于是不启动慢开始算法,将当前拥塞窗口减半,并把门限设为此值。然后执行拥塞避免算法。

编程语言

1.

堆和栈的区别?

二者各有利弊:栈的内存分配更快,但只能对堆顶操作;堆允许随机分配和释放,但会带来更大的开销。

堆区:由人为分配/释放;效率更慢;
栈区:由编译器自动分配/释放;效率更快;栈区的大小在程序编译时确定,通常比较小。

2.

C++的newmalloc有什么区别?

new会在堆区新建对象,并返回对象的指针,会调用构造函数;
malloc只是在堆区分配内存,并不会初始化,返回值也是void*类型,需要对返回值做强制类型转换。

#include <iostream>
using namespace std;
struct POINT {
    int x,y;
    POINT(int x=10,int y=10):x(x),y(y)
    {
        cout<<"create point("<<x<<","<<y<<")\n";
    }
    ~POINT()
    {
        cout<<"destruction!";
    }
};
int main()
{
    POINT *p1=new POINT;//create point(10,10)
    cout<<p1->x<<' '<<p1->y<<endl;//10 10

    POINT *p2=(POINT*)malloc(sizeof(POINT));
    cout<<p2->x<<' '<<p2->y<<endl;//12348784 0

    delete(p1);//destruction!
    free(p2);
    return 0;
}
3.

C++的指针和引用有什么区别?

指针是一个变量,其值是一个地址;可以有多级;指针可以重复赋值;指针可以为空。
引用是一个已经存在的变量的别名;只能有一级;引用不可以重新绑定到其他变量;引用不可以为空。

杂题

1.

只能用加、减、乘、除、乘方、开方六则运算,,怎么从数学上近似表示

2.

说说你接触/听说过的研究方向,有哪些顶会顶刊?

计算机视觉:CVPR、ICCV、ECCV、TPAMI(顶刊)
机器学习:ICML、ICLR、NIPS
自然语言处理:ACL、NAACL、EMNLP
安全:ACM CCS、NDSS、USENIX Security、IEEE S&P

3.

你怎么理解计算机网络中的可靠传输?

可靠传输服务希望实现发送端发送什么,接收端就接收到什么。希望解决数据位出错、分组丢失、分组失序、分组重复等错误。

4.

你怎么理解计算机网络中的“即插即用”一词?

意味着无需人工,具有自动配置的能力。

追问:那你觉得计算机网络中什么是即插即用的?

交换机是即插即用的,插上网线就能自动学习MAC地址,不需要配置。
ARP是即插即用的,ARP表是自动建立的,不需要系统管理员来配置;
DHCP是即插即用的,能够实现自动分配IP地址。
IPv6是即插即用的,支持无状态地址自动配置,不需要DHCP。

5.

家里的路由器的WAN口和LAN口分别接什么?光猫怎么接?

WAN(Wide Area Network)口接外网,LAN(Local Area Network)口接内网,也就是家里的设备。事实上如果不接WAN口,路由器就变成了交换机。

光猫的原理是将光信号转换为电信号,接入光纤,输出电信号给路由器。光猫应该接在路由器和外网之间,因此要接路由器的WAN口。