为什么 99%的准确率不够好:机器学习恶意软件检测的现实情况

主要观点:企业中的恶意软件威胁每年都在演变,随着企业通过远程工作和云采用扩大数字足迹,攻击面增加,易受针对性恶意软件攻击。各报告显示企业安全现状不佳,数据泄露平均成本上升,安全人员短缺。
关键信息

  • FBI 2023 互联网犯罪报告指出商业电子邮件诈骗等造成巨大损失。
  • IBM 2024 数据泄露成本报告显示平均成本上升,使用 AI 可节省成本,半数 breached 组织存在严重安全人员短缺。
    重要细节
  • 传统恶意软件检测技术基于数字取证,如签名、字节模式匹配等,但威胁行为者会使用多态恶意软件逃避。
  • 现代安全软件采用机器学习方法检测未知恶意软件,如 CrowdStrike 报告强调其作用,神经网络基恶意软件检测技术有高准确率,但需考虑基率问题。
  • 评估机器学习模型的关键指标有混淆矩阵等,早期检测恶意软件很关键,要提高召回率。
  • 企业数据量庞大,近一半设备未被检测或运行旧系统,低基率导致误报率高,训练方法需调整,如过采样、欠采样等,混合方法可补充纯分类,调整预测时间阈值可提高准确性。未来可发展分层检测系统和主动学习技术等以应对基率挑战。
阅读 102
0 条评论