课程: 人工智能(AI)入门

在数据中搜索模式

课程: 人工智能(AI)入门

在数据中搜索模式

在过去的 30 年间, 机器学习系统已经成为人工智能的主要形式。 这归功于这些系统 在寻找庞大数据集模式的出色设计。 广泛易得的数字化数据 也为机器学习提供了助力。 如果你想创建一个识别狗的人工智能程序, 可以轻松获得数百万张图片。 你也可将大量可用的数据 输入网络来帮它学习。 其他类型的数据也是如此, 比如数字化视频、音频、图片和文档。 几十年前 获取几千张数字化图片还十分困难, 而现在各种类型的数据唾手可得。 记住, 机器学习系统通过吸收数据来学习新知识。 输入的数据越多, 机器识别模式的能力就越强。 比如你现在正在用的系统, 这个一个专业社交网站,提供视频培训服务, 用户通过在线视频播放器观看培训内容。 这个视频播放器会收集用户的快进频率、 在一节课看多久会转到下一课等数据。 假设播放器记录了每位用户观看视频的数据, 这可能是数十万视频和数百万用户的数据量。 如此庞大, 没有人能够遍览并解读所有这些数据。 但机器学习算法会分析这些数据并找到模式, 比如知道用户对哪些内容更有兴趣。 这正是许多企业梦寐以求的数据类型。 也可以了解用户与旗下产品交互的实时模式。 此外,这类数据不仅透露客户兴趣所在, 还能呈现更广泛的行业趋势, 而且价值千金。 你可以用它开发新的客户产品 或改进现有产品。 像谷歌和微软这样的公司 对人工智能最为热衷。 这并非偶然。 他们整个业务的许多方面 都基于机器解读的庞大数据集。 而这类模式匹配能带来巨大竞争优势。 且更新型的人工神经网络 能够令机器在更庞大的数据集中 找到更多模式。 但几十年前, 常规的机器学习算法还无法察觉这些模式。 事实上,机器学习面临的一大挑战 是人类并不真正了解机器如何识别这些模式。 它就像一个拥有数据和处理能力的黑匣子, 而人们无法像机器那样处理数据。 所以如果你所在公司 正设计自己的人工智能程序, 那么设计者应该能接受这样一个事实: 网络可能感知到人类无法察觉的事物。 对大多数公司来说,这可能不是问题。 但对于保险和医疗等行业来说,可就糟了。 你不希望这些系统 在处理顾客的健康和安全问题时, 做出人类无法理解的决定。 人工智能与人类智慧不同, 即使两者可能得出相同的结论, 但论证的过程却不尽相同。 试想你所在公司收集的数据类型。 他们是否将这些数据用于机器学习? 如果是的话,机器在识别什么模式? 目的又是什么?

内容