说起足球世界杯,大家都懂,怎么人工智能也有“世界杯”比赛呢?中国成绩如何? 人工智能WebVision是2017年以来新的大规模图像识别任务权威挑战赛事的名称,到2019年Webvision2019数据集就包括5000类,1600万张图片,数据量庞大,训练识别难度大幅增加了。2019年共有全球154只参赛队伍参赛,涵盖众多顶尖科技公司和知名高校,高手如云啊。中国成绩如下。 前5名分别为阿里、商汤、华为、百度、佳都科技公司。为避免广告之嫌,不多说。当我们将机器学习归纳为人工智能发展的下一个阶段时,也对人工智能的发展方向有了新的看法。人工智能先以推理、演绎为主要目的,但是随着研究的深入和方向的改变,人们发现人工智能的核心应该是使计算机具有智能,使其学会归纳和综合总结,而不仅仅是演绎出已有的知识。学习是人类智能的一个重要表现,但是究竟什么是学习?长期以来众说纷纭,它包含了心理学、生物学、数学、计算机科学等各方面的内容。就连人类的学习都如此难以定义,更不要说给人工智能的学习下一个准确的定义了。但是为了研究方便,又必须给人工智能的这种行为下一个定义,即便这种定义是不充分或不完全的。于是,人们将人工智能的学习定义为模拟人类学习的过程,严格一点的话,可以解释为:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。在人工智能3.0时代,结合各种学习方法,通过取长补短等方式集成的学习系统逐步兴起,特别是一些链接学习符号可以很好地处理知识与技能之间的断点,这样就可以使计算机获得更好的性能。因此,机器学习越来越受到人们的重视。机器学习的基本结构可以总结为:环境向学习系统提供信息,而学习系统利用这些信息修改知识库。 人工智能由深度学习技术所驱动,尽管目前看来,各个公司深度学习技术表现非常出色,但比赛就会有高低。在AI具体应用中,学习系统利用这些信息修改知识库后,执行系统就能提高完成任务的范围和效能,执行系统根据知识库完成任务之后,还能把在执行任务过程中获得的信息反馈给学习系统,让学习系统得到进一步扩充。最终先影响到机器学习的是学习系统,而最能影响学习系统的是环境信息,更确切地说是从环境中流入的信息的质量。因为在知识库中的引导规则往往是一般原则,且比较单一,但是环境向学习系统提供的信息是多种多样的。如果信息质量比较高,与引导规则相匹配或者说两者能够融合,那么学习系统就能轻易处理这部分信息。 但是在实际环境中,不可能所有的信息都适用于现有的规则,大多数时候学习系统提供的信息都是杂乱无章的具体信息。当学习系统获得这样的信息时,就需要足够的数据支撑才能作出判断,简单来说就是进行信息区分。学习的本质便是对某一事物进行判断和识别,如果人工智能能够进行学习,那么就必须对已有的信息进行区分,然后根据区分后的信息进行判断,最终采取相应的行动。在心理学领域有一个非常著名的研究理论——微表情。一个人的下意识行为虽然只会持续极短的时间,但却能反映出人们真实的情感,微表情能够区分人们说的、做的是否和真实的情感一致。 对于人工智能来说,许多的区分是建立在简单的“是”与“否”基础上的,就像人们判断一种食物是“能吃”还是“不能吃”一样。人类因为拥有高度的智能,所以对于很多事情的区分都很细致,有时甚至细致到了极端的地步,有点类似于“强迫症”。但是对于人工智能来说,一旦拥有了海量的数据作基础,这种细致的区分或许正是发展的必经之路。从这一点来看,人工智能确实已经有了人类思维的影子。现在回过头来看机器学习,因为学习系统获得的信息往往是不完全的,所以根据这些信息推理出的规则既可能是正确的,也可能是不正确的,这就需要通过执行效果加以验证。若执行效果反馈成功,并验证某一条规则是正确的时候,系统就会将其区分为“是”,而对不正确的规则就会反馈为“否”,并对这部分规则进行修改或直接从数据库中删除。机器学习就是在这种对海量数据进行处理的过程中,自动学习区分方法,以此不断消化新知识。 人工智能比赛的WebVision用于计算机的训练数据都是从互联网通过以词搜图的搜索引擎爬取来的,并未经过人工标注或筛选,数据包含大量噪声,而非人工标注数据的获取成本要低很多,但对深度学习算法的要求却非常高,传统的有监督学习已经不适用,而半监督学习则成为主流。这就要考验各个参赛单位了。 人工智能时代将带来什么样的风险?AI智能化潮流可能造成的持续性失业,可能会急速扩大赤贫群体,是否引发社会震荡;人工智能、机器人、大数据等新科技的应用,是否会进一步加剧社会的贫富差距?我们怎么理解? 来源:互联网 |