机器学习中,从获得数据到模型正式放入模型之前,以下哪个选项不是这个过程的一部分()
A.数据标准化
B.教据降维
C.数据可视化
D.数据清理
A.数据标准化
B.教据降维
C.数据可视化
D.数据清理
第1题
A.ECA加流量检测最核心的技术是生成ECA检测分类模型
B.通过前端ECA探针提取加密流量的明文数据,包括TLS握手信息、TCP统计信息、DNS/HTTP相关信息,并将它们统一上报给CIS系统
C.基于分析取证的特征向量,采用机器学习的方法,利用样本数据进行训练,从而生成分类器模型
D.安全研究人员通过和群殴的黑白样本集,结合开源情报,域名,IP,SSL等信息,提取加密流量的特性信息
第5题
A.帮助我们关注数据的细节,可以获知个体信息
B.帮助我们从不同维度观察汇总数据
C.帮助我们回答决策/预测层次的问题
D.借助AI、机器学习等方法由计算机从数据中自动揭示事物规律
第7题
如下模型可用来研究竞选支出如何影响选举结果:
其中,voteA表示候选人A得到的选票百分数,expendA和expendB分
别表示候选人A和B的竞选支出,而prtystrA则是对A所在党派实力的一种度量(A所在党派在最近一次总统选举中获得的选票百分比)。
(i)如何解释β1?
(ii)用参数表述如下原假设:A的竞选支出提高1%被B的竞选支出提高1%所抵消。
(iii)利用VOTE1.RAW中的数据来估计上述模型,并以通常的方式报告结论。A的竞选支出会影响结果吗?B的支出呢?你能用这些结论来检验第(ii)部分中的假设吗?
(iv)估计一个模型,使之能直接给出检验第(ii)部分中假设所需用的:统计量。你有什么结论?(使用双侧备择假设。)
第8题
利用AFFAIRS.RAW中女性的数据。
(i)为affair估计一个线性概率模型,二元指示变量在女性至少有一次婚外恋时等于1,解释变量包括yrsmarr、age和educ。解释yrsmarr的系数。
(ii)在控制了yrsmarr后,age和educ对affuir还有影响吗?
(iii)在(i)中的模型里加入kids。解释它的系数并判断估计是否在统计上显著。
(iv)对于(iii)中的模型,除了kids仍在模型中以外,加入四个宗教虚拟变量。基础组包括那些声称自己反宗教的女性。对于那些非常信仰宗教的和反宗教的女性,报告自己有婚外恋的可能性是不是有差别?宗教信仰的影响有多大?
(v)对于那些有宗教信仰和无宗教信仰的女性,报告自己有婚外恋的可能性是不是有差别?宗教信仰的影响有多大?[提示:从(iv)中改变基础组很简单。]
第9题
A.物理设备映射到IED;
B.各个功能分解到LN;
C.每个功能的保护数据映射到DO;
D.数据属性命名为LD/LN$FC$DO$DA。
第10题
A.确保数据可靠、顺序、无差错地从发送主机传输到接受主机,同时进行流量控制
B.按照网路能够处理数据包的最大尺寸,发送方主机的传输层将较长的报文进行分割,生成较小的数据段
C.对每个数据段安排一个序列号,以便数据段到达接收方传输层时,能按照序列号以正确的顺序进行重组。
D.判断通信是否被中断,以及中断后决定从何处重新发送
第11题