OpenText 拥有数十年的专业经验,可帮助您解锁数据、连接人员和流程,并以信任为 AI 提供动力
以全新方式查看信息
能够理解您的业务、数据和目标的 AI
迎接更快的决策。您安全的 AI 个人助理已准备就绪,随时开始工作
利用生成式 AI 为供应链获取更深入的见解
利用 AI 内容管理和智能 AI 内容助手实现高效工作
通过 AI 网络安全和敏捷威胁检测提升您的安全态势
实现更快的应用交付、开发和自动化软件测试
提升客户沟通和体验,助力客户成功
让用户、服务代理和 IT 人员能够找到他们所需的答案
以全新方式查看信息
能够理解您的业务、数据和目标的 AI
迎接更快的决策。您安全的 AI 个人助理已准备就绪,随时开始工作
利用生成式 AI 为供应链获取更深入的见解
利用 AI 内容管理和智能 AI 内容助手实现高效工作
通过 AI 网络安全和敏捷威胁检测提升您的安全态势
实现更快的应用交付、开发和自动化软件测试
提升客户沟通和体验,助力客户成功
让用户、服务代理和 IT 人员能够找到他们所需的答案
在更智能的数据平台上,通过实时分析来预测、采取行动并取得胜利
通过多存储库的基于 AI 的搜索,用户可以更快、更轻松地获取所需答案,并能将从点击到对话的所有内容进行情境化处理
一次连接,即可通过安全的 B2B 集成平台触达一切
彻底革新云互联网的连接方式
利用 AI 就绪的内容管理解决方案重新构想知识
用于企业保护的集成网络安全解决方案
专用数据保护和安全解决方案
利用敏捷 AI 的强大功能重新定义威胁狩猎,以提升安全态势
通过 AI 驱动的 DevOps 自动化、测试和质量,更快地交付更优质的软件
获得所需的清晰度,以降低 IT 运营的成本和复杂性
利用私有生成式 AI 的自助服务功能重新定义一级业务支持功能
利用成熟的 OpenText 信息管理技术构建自定义应用程序
使用 OpenText 云 API 按自己的方式构建,这些 API 可创建实时信息流,从而支持自定义应用程序和工作流
保护重要内容,在关键时刻进行恢复
安全信息管理与可信的 AI 相结合
提升数据和 AI 信任度的统一数据框架
在这里,您可以使用数据语言构建、部署和迭代代理
一套用于帮助摄取数据和自动化元数据标记,以推动 AI 发展的工具
一套使治理具有主动性和持久性的服务和 API
专业服务专家助您踏上 AI 之旅
以全新方式查看信息
能够理解您的业务、数据和目标的 AI
迎接更快的决策。您安全的 AI 个人助理已准备就绪,随时开始工作
利用生成式 AI 为供应链获取更深入的见解
利用 AI 内容管理和智能 AI 内容助手实现高效工作
通过 AI 网络安全和敏捷威胁检测提升您的安全态势
实现更快的应用交付、开发和自动化软件测试
提升客户沟通和体验,助力客户成功
让用户、服务代理和 IT 人员能够找到他们所需的答案

机器学习是人工智能的一个子集,其重点是构建能够从历史数据中学习、识别模式并在几乎没有人工干预的情况下做出合理决策的系统。它是一种数据分析方法,通过使用包含数字、文字、点击和图像等各种数字信息形式的数据,自动建立分析模型。
机器学习应用程序从输入数据中学习,并利用自动优化方法不断提高输出的准确性。机器学习模型的质量主要取决于两个方面:
机器学习模型越好,就能越准确地发现数据中的特征和模式。这反过来又意味着其决策和预测将更加精确。
为什么要使用机器学习?由于数据量越来越大,种类越来越多,计算能力越来越强,高速互联网越来越普及,机器学习的重要性与日俱增。这些数字化转型因素使人们能够快速自动地开发模型,从而快速准确地分析异常庞大和复杂的数据集。
为了削减成本、降低风险和提高整体生活质量,机器学习可应用于多种用例,包括推荐产品/服务、检测网络安全漏洞和实现自动驾驶汽车。随着数据获取能力和计算能力的提高,机器学习正变得无处不在,并将很快融入人类生活的方方面面。
创建机器学习模型有四个关键步骤。
训练数据是机器学习应用程序为调整模型参数而采集的具有代表性的数据信息。训练数据有时是有标签的,这意味着它已被标记为机器学习模式需要预测的分类或预期值。其他训练数据可能没有标记,因此模型必须自主提取特征并分配聚类。
对于标记数据,应将其分为训练子集和测试子集。前者用于训练模型,后者用于评估模型的有效性并寻找改进方法。
您所选择的机器学习算法类型主要取决于几个方面:
对于预测或分类用例,您通常会使用回归算法,如普通最小平方回归或逻辑回归。对于未标记的数据,你可能会依赖于聚类算法,如 k-means 或近邻算法。有些算法(如神经网络)可以配置为同时适用于聚类和预测用例。
训练算法是调整模型变量和参数的过程,以便更准确地预测适当的结果。机器学习算法的训练通常是迭代式的,并根据所选模型使用各种优化方法。这些优化方法无需人工干预,这正是机器学习的强大之处。机器会根据你提供的数据进行学习,几乎不需要用户的具体指导。
最后一步是向模型提供新的数据,以逐步提高模型的有效性和准确性。新信息的来源取决于要解决的问题的性质。例如,用于自动驾驶汽车的机器学习模型将获取现实世界中的路况、物体和交通法规信息。
什么是监督式机器学习
监督式机器学习算法使用标记数据作为训练数据,其中已知输入数据的适当输出。机器学习算法接收一组输入和相应的正确输出。该算法将自己的预测输出与正确输出进行比较,以计算模型精度,然后优化模型参数以提高精度。
有监督的机器学习依靠模式来预测无标记数据的值。它最常用于自动化、大量数据记录或数据输入过多而人类无法有效处理的情况。例如,算法可以识别出可能存在欺诈行为的信用卡交易,或者识别出最有可能提出索赔的保险客户。
什么是无监督机器学习
无监督机器学习最适用于没有结构化或客观答案的数据。对于给定的输入,没有预先确定正确的输出。相反,算法必须理解输入内容,并形成适当的决策。目的是检查信息并确定其中的结构。
无监督机器学习对事务性信息的处理效果很好。例如,该算法可以识别具有相似属性的客户群。然后就可以针对这些细分市场中的客户开展类似的营销活动。无监督学习中常用的技术包括最近邻映射、自组织图、奇异值分解和均值聚类。这些算法随后被用于分割主题、识别异常值和推荐项目。
|
方面 |
监督学习 |
无监督学习 |
|
过程 |
为训练模型提供输入和输出变量。 |
只为训练模型提供输入数据。不使用输出数据。 |
|
输入数据 |
使用标注数据。 |
使用无标记数据。 |
|
支持的算法 |
支持回归算法、基于实例的算法、分类算法、神经网络和决策树。 |
支持聚类算法、关联算法和神经网络。 |
|
复杂性 |
更简单 |
更复杂。 |
|
主观性 |
目标。 |
主观 |
|
班级数量 |
班级数量已知。 |
班级数量不详。 |
|
主要缺点 |
利用监督学习对海量数据进行分类非常困难。 |
群组数量的选择可能是主观的。 |
|
首要目标 |
训练模型,以预测新输入时的输出。 |
找到有用的见解和隐藏的模式。 |
虽然机器学习功能已经存在了几十年,但最近应用和自动计算涉及大数据的复杂数学计算的能力使其变得前所未有的复杂。如今,机器学习的应用领域非常广泛,从企业 AIOps到在线零售,不一而足。今天,机器学习能力在现实世界中的一些实例包括以下内容:
随着数据量的增长、计算能力的增强、互联网带宽的扩大以及数据科学家专业知识的提高,机器学习只会继续推动工作和家庭效率的提高和深化。
如今,企业面临的网络威胁与日俱增,因此需要通过机器学习来保护宝贵数据的安全,将黑客拒之于内部网络之外。我们首屈一指的 UEBA SecOps 软件 ArcSight Intelligence 使用机器学习来检测可能预示恶意行为的异常情况。它在检测内部威胁、零时差攻击,甚至侵略性红队攻击方面有着良好的记录。
主动检测内部风险、新型攻击和高级持续性威胁
通过实时关联和原生 SOAR 加速威胁检测和响应
利用 AI 的力量加速测试自动化
通过可操作的深度安全洞察加速威胁检测
Interset 利用机器智能增强人类智能,加强您的网络复原力