新闻动态
你的网络AI有你想象得那么智能吗?
2021-08-18

网络运营人员告诉我,未来,人工智能将管理他们的网络。他们还告诉我,供应商也向他们传达了同样的讯息。好消息是,“有些方面”是真的。坏消息也是如此。这里的重点在“有些方面”。为了从人工智能网络管理中获得最大收益,你必须弄清楚那个模糊的“有些方面”,对于这一点,你可以通过想象“蚂蚁和农民”来实现。

蚂蚁可以建造极其复杂的蚁丘,里面有各种相互连接的隧道和关卡。这些工蚁是否有一些强大的蚂蚁工程师来指导完成这一过程?答案是否定的!它们每个都一心一意地执行自己的简单任务,并且本能地完成任务。事实上确实存在一个“蚂蚁工程师”,但正是它们自己的DNA组织了它们的工作以实现目标。这就有点像大多数网络AI的工作方式。

网络由一堆技术“集合”组成,每个都有点像蚁丘。有基于供应商、设备类型、物理位置和连接关系的集合。如果你仔细观察如今的网络AI就会发现,它主要在“集合”上运行。也许它管理着Wi-Fi或可能管理着SD-WAN或SASE等边缘元素。用于管理一个“集合”的AI应用程序会将管理目标融入到它们的DNA(也就是它们的设计中)。简单地说,如果我们是Wi-Fi供应商,我们就知道Wi-Fi的工作原理,并将这些知识融入我们的AI管理中。

当我们不再将集合视为独立元素,并开始将网络视为“集合的集合”时,挑战就来了。网络不是蚁丘,而是蚁丘所在的整个生态系统,包括树木、奶牛和许多其他东西。树知道如何成为树,牛了解牛的习性,但谁了解整个生态系统呢?农场就是农场,而不是树木、奶牛和蚁丘的任意组合。了解农场应该是什么样的人是农场主,而不是农场的元素或这些元素的供应商,在你的网络中,亲爱的网络运营人员,农场主就是你!

早期阶段,人工智能的开发者就明确承认,构建AI框架的知识工程师与主题专家(其知识塑造了框架)是分开的。在软件中,尤其是 DevOps,管理工具旨在实现目标状态,即在我们的农场类比中,它描述了奶牛、树木和蚂蚁所处的位置。如果当前状态并非目标状态,它们会做一些事或移动一些东西以向目标状态靠拢。这是一个很棒的概念,但要让它发挥作用,我们必须知道目标是什么。在企业网络层面,我们需要我们的Wi-Fi专家下意识地将知识引入Wi-Fi AI管理工具。如果AI供应商不知道这些知识是如何获得的,他们的AI将毫无用处。

如果您对AI的希望就此破灭,还言之尚早!许多网络运营人员对管理构成其网络的技术集合的AI还是非常满意的。毕竟,当一个集合发生任何事情都无法通过调整另一个来补救时,为什么还要担心协调Wi-Fi和SD-WAN管理的问题呢?如果这个集合-AI模型能够满足您的需求,您就大功告成了。

想要了解成为一只“蚂蚁”(至少在网络AI方面)是否可行,最好的方法就是询问你的技术集合是否真的具有“原子性”——即完全独立、自我包含。这归结为您AI的可见性和控制范围。基本上,集合特定型AI都是独立的。理想状态下,你需要你的AI集合蚂蚁做自己的事情,而不是介入彼此的活动。你不希望一个地方的AI在没有协调的情况下查看另一个集合,并对条件做出反应,或者两个AI集合过程同时处理同一个问题。

如果一个集合中问题的补救措施可能涉及对另一个集合做一些事情,那么你需要你的AI能够覆盖组合。因此,如果你觉得用于管理生态系统的网络运营中心过于昂贵且超负荷,希望部署AI让每个人能够缓口气,那么你就需要更深入地了解供应商的AI主张。

这对企业来说并不容易,因为今年在我访问的人中,有超过四分之三的人表示,他们内部没有太多(如果说有的话)的人工智能专业知识。许多人觉得自己受了供应商的摆布,因为他们承诺提供很棒的东西,但似乎并没有完全达到预期。对于这种现象,企业就没有什么可以做的吗?

掌握在整个网络生态系统中使用AI的最简单方法,是寻找一种类似于“管理人的管理人基金”(manager of managers,MoM,是指该基金的基金经理不直接管理基金投资,而是将基金资产委托给其他的一些基金经理来进行管理)方法。用现代术语来说,您可以将此称为“意图建模”(intent modeling)。如果您的每个技术集合都可以被视为一个“黑匣子”,根据其自己的SLA对其行为进行建模,并且其AI流程可以执行该SLA,那么您所需要的只是让这些集合AI工具中的每一个生成故障报告到更高级别的包。然后,如果存在超出单个技术集合的问题,或者如果一个集合失败并且必须考虑更高级别的修复,那么该包可以决定该怎么做。

这里出现的挑战是找到目标状态以及在出现问题时如何恢复。还记得上面提到的“主题专家”和“知识工程师”吗?我们很难为网络构建AI解决方案,因为所有网络都略有不同,而且只有用户自己知道他们认为什么是“好”或“坏”。一些AI工具可能会提供机器学习 (ML) 功能,让您的网络运营中心(NOC)人员了解情况并知道该做什么;还有一些可能会使用网络供应商知道的通常代表正常选项和常见补救措施的基线。

不过,这两种方法都存在一些问题。机器学习可能需要时间,而且当您的AI系统正在执行其使命时,它会进一步消耗您的NOC资源。当您的网络主要由来自一个供应商的设备组成时,供应商基线最有效。两者都可以调整,但都可能与自适应网络行为发生冲突。

IP 网络本质上使用拓扑发现并做自己的事情。即使对于NOC来说,影响路由也很困难;它们通常需要规划新的MPLS 路线来进行流量工程,而AI不太可能做到这一点。 一些公司(包括谷歌)已经转向软件定义网络(SDN)来提供路由的中央控制,然后AI可以通过控制SDN控制器来控制网络。

网络运营中的AI可以追溯到事件的组合以发出异常信号,也可以作为一种实施有效响应的方式。在任何级别,您的潜在AI供应商都应该能够与您讨论他们的产品如何收集信息以及如何实现其洞察力。深入研究这两件事的细节,因为无论AI声称有多神奇,如果没有这两种成分,它就不会起作用。 最后,请记住:做一个农民,而不是一只蚂蚁,你的位置永远不会因为AI的出现和发展而丧失。

来源: 51CTO 企业网D1Net 作者:Tom Nolle https://network.51cto.com/art/202108/678376.htm

赤同网络 技术支持&Powered by eLooie.com