在之前的博客中,我们介绍了机器学习用于网络安全的概念,然后深入研究机器学习的支柱并探讨了有监督和无监督机器学习是如何工作的,这样您就可以超越营销声明,了解关键的技术概念。在这个博客中,我们介绍了一些你应该知道的关键术语。

机器学习-一种不用编程就能让电脑学习的人工智能。机器学习专注于开发计算机程序,这些程序可以在接触到新数据时教会自己成长和改变。机器学习和人工智能经常可以互换使用,尤其是在市场营销中。

数据科学家-这些人通常是博士,他们是使用人工智能技术的专家。基于期望结果的目标或用例,他们选择正确的模型和算法,将它们与正确的数据结合起来,并调整它们以产生准确的结果。

数据-这是所有机器学习的“原料”。对于安全机器学习,输入可以是数据包、流、日志、警报和文本,如性能评估和外部威胁情报。

功能-与特定机器学习模型和用例相关的单个数据元素。它们可以直接从数据中提取出来,也可以通过预处理算法将原始数据传递出来。例如:访问(访问的IP地址和国家)或时间(访问的开始和结束时间),或计数器(上传和下载的字节数)。

模型-模型采用算法提供的特征和参数,并应用特定的机器学习计算-模型的输出。

监督机器学习-使用一种“教学”技术来发展一组已知的输出和输入之间的关系。一旦模型被开发出来,它就可以用来预测一组新的输入的输出。

非监督机器学习-该算法是“自学习”的,所以在部署前不需要事先训练或准备。该算法自动发现输入之间的相关结构和关系。

是基线-异常检测模型通常为用户或系统等实体构建“预期”行为的概要文件。一旦建立了这些基线,模型就会寻找与基线的偏差。

培训-这个过程通过输入从训练数据中提取的特征来准备一个有监督的机器学习模型。随着训练数据或特征的更新,定期进行训练。
了解更多
在下一篇博客中,我们将展示一个用例,说明机器学习和用户实体行为分析是如何发现其他实时系统所回避的攻击的。
现在想要深入吗?下载阅读CISO的机器学习和用户实体行为分析指南电子书。