展示所使用PPT:
讲稿:
1. 知识与智能的关系
使用DIKW(Data-to-Information-to-Knowledge-to-Wisdom)金字塔模型来阐述数据、信息、知识和智慧之间的递进关系。
强调:知识是智能行为的基础,而智能是应用知识来解决问题的能力。
- 知识的定义与重要性:
知识是通过经验、教育和学习获得的信息和理解。它是我们对信息进行深度挖掘和综合分析得到的有用材料,为我们提供了理解世界和解决问题的基础。
- 智能的多维度:
智能不仅包括计算和感知能力,还包括认知能力,即理解、解释的能力。当代的智能研究旨在通过计算机模拟,让机器获得和人类相似的智慧,解决智能时代下的实际问题。
通过两个例子来说明知识与智能之间的关系。首先,考虑一个人类学习语言的过程。当一个人学习一门新的语言时,他需要掌握词汇、语法规则以及语言的语境。这些都构成了他的知识。然后,当他能够流利地运用这门语言来表达思想、交流信息或解决问题时,便展示了他的智能。
另一个例子是数学问题的解决。一个人可能通过学习数学知识,掌握了各种解题技巧和方法。当他面对一个数学问题时,他能够运用所学的知识来分析问题、选择合适的解题方法,并最终得出正确的答案。这个过程展示了他的智能,因为他能够将所学的知识应用到实际问题中去解决。
- 人工智能模拟人类智能的过程
人工智能也在模拟这种知识与智能的关系。通过机器学习模型,特别是深度学习模型,AI可以从大量的数据中学习知识,并将这些知识应用到解决问题的过程中。举例来说,一个语言模型,它可以通过训练数据学习人类常见的语言模式,并生成合乎语法和语境的文本。
2. 知识在现有人工智能方法中的应用
现代人工智能方法中,知识的应用是至关重要的。不同的知识表示方法被用来模拟人类的知识处理过程,从而实现智能的表现。让我们通过几个例子来具体说明。
1. 专家系统
专家系统是一种典型的人工智能应用,它利用事先获得的领域专家知识来解决特定领域的问题。举例来说,医疗诊断系统就是一个常见的专家系统。这些系统根据病人的症状和医学知识库中存储的知识,来提供诊断或治疗建议。通过使用规则库和推理引擎,专家系统能够模拟医生的诊断过程,实现智能的医疗决策。
2. 自然语言处理中的知识表示
在自然语言处理领域,知识表示也起着关键作用。聊天机器人是一个例子,它们利用预先构建的知识库来回答用户的问题。这些知识库包含了大量的事实和信息,使得聊天机器人能够理解并生成自然语言回复。例如,聊天机器人可以使用经受过企业内容和数据训练的虚拟客服来改善客户体验、降低成本,并扩大客户服务规模。聊天机器人可以作为唯一的客户联系人,在呼叫中心为人工客服提供支持,推荐即时生成的回答,并且可以回答频繁的客户咨询。
3. 图像识别中的知识提取
在图像识别领域,知识的应用体现在从数据中提取特征和模式。卷积神经网络(CNN)是一种常用的深度学习模型,它通过学习成千上万的图像来识别图像中的对象。在这个过程中,网络通过不断调整参数来捕获图像中的特征和模式,从而实现对图像内容的理解和识别。这种知识的提取过程使得人工智能能够实现复杂的图像理解任务。
3、知识在大模型或人工智能中的表现形式
在大模型或人工智能中,方法的选择对于知识的应用至关重要。为了解决刚刚我们提到的图像识别问题,我们先从机器是如何学习知识这个问题入手。传统机器学习和深度学习是两种常见的方法,它们在知识的获取和应用方面有着不同的特点和优势。
1. 传统机器学习方法
传统机器学习方法通常采用规则和特征工程来获取知识,并利用这些规则和特征进行模型训练和预测。举例来说,如果我们想要训练一个模型来识别猫猫,我们可以设定一系列具体的条件,比如体型、毛发颜色、形态特征等,然后利用这些条件来进行特征提取和模型训练。这种方法的优点在于精准度高,但缺点是需要大量的人工规则和标注数据,而且规则的细化程度会影响到模型的泛化能力。
2. 深度学习方法
相比之下,深度学习方法则更加注重从数据中学习特征和模式,而不需要人为设定具体的规则。深度学习模型可以通过大量的数据和反复的试错来自动学习特征和规律,从而实现对复杂任务的解决。举例来说,还是对于猫猫的识别,深度学习模型可以直接从图像数据中学习猫的特征,而不需要人为设定具体的识别条件。这种方法的优点在于学习能力强、适应性好,但缺点是计算量大、模型设计复杂,且容易存在偏见。
*深度学习与传统机器学习的比较
深度学习和传统机器学习在数据预处理上是类似的,但在特征提取环节有着显著的差异。传统机器学习需要人为提取特征,而深度学习则能够自动学习特征,不需要人工干预。这使得深度学习在处理复杂数据和任务时具有更大的优势。
3. 支持向量机
在大模型或人工智能的应用中,不仅有传统机器学习方法和深度学习方法,还有一些其他的相关算法,如支持向量机(SVM)。下面我们将详细探讨支持向量机在知识的学习和应用方面的特点和示例。
支持向量机是一种常用的监督学习方法,广泛应用于模式识别、分类和回归等领域。它的核心思想是寻找一个最优的超平面,将不同类别的样本分隔开来,并使得边界与最近的样本之间的间隔最大化。这个超平面可以被视为一个知识表示的形式,它将已知的数据点映射到一个高维空间中,并根据它们的位置和分布来做出预测和分类。
具体来说,支持向量机会将图像数据映射到一个高维特征空间中,然后在这个特征空间中找到一个最优的超平面,将不同类别的图像样本分隔开来。这个超平面的位置和方向由支持向量决定,它们是与超平面最近的样本点。通过这种方式,支持向量机能够利用已知的图像数据来学习并表示不同类别之间的知识,从而实现对新图像的准确分类。
形象理解什么是超平面:https://www.bilibili.com/video/BV1es4y1F72m
在实际场景中的应用:
- 文本分类
对文档或消息进行分类。如在新闻网站上,可以使用SVM模型来自动将新闻文章分为“政治”、“体育”、“娱乐”等不同的类别;垃圾邮件过滤器,使用SVM来识别垃圾邮件和正常邮件。 - 图像识别
通过使用不同的核函数,SVM能够在高维空间中找到决策边界,从而用于图像识别任务,如手写数字识别或面部识别中。 - 生物信息学
识别基因序列模式、药物发现。在疾病诊断中,SVM可以用于分析基因表达数据,以识别是否存在特定疾病的风险。 - 金融预测
预测股票价格的走势或者用于信用评分。如在信用卡欺诈检测中,SVM可以用于分析消费者的交易记录,并自动标识出可能的欺诈性交易。
4、知识图谱与知识表示
知识图谱是一种重要的知识表示方法,它通过实体和它们之间的关系来构建复杂的网络,从而表达和组织知识。
- 知识图谱的概念
知识图谱是一种用于表示和组织知识的图形化结构,它由实体(节点)和实体之间的关系(边)组成。每个实体都代表现实世界中的一个具体对象或概念,而关系则表示实体之间的联系或关联。通过建立这样的关系网络,知识图谱能够清晰地展示知识之间的关联和层次结构,从而帮助人们更好地理解和利用知识。 - 知识图谱的实例
一个典型的知识图谱例子是谷歌的知识图谱,它是谷歌搜索引擎背后的重要组成部分。谷歌知识图谱通过收集和整合来自各种来源的知识,构建了一个庞大的实体-关系网络,涵盖了各种不同的领域和主题。通过这个知识图谱,谷歌搜索能够更好地理解用户的查询意图,提供更准确、丰富的搜索结果。
进一步来讲,知识图谱也被应用于支持问答系统。通过理解问题中的实体和它们的关系,知识图谱可以为问答系统提供更加准确和完整的答案。
知识问答相比文本检索,减少了用户对检索文档内容的二次提取和推理的过程,会显著提升用户知识获取的体验。根据问答底层技术的差异,目前工程落地实现问答的技术路线基本分为基于知识图谱的问答(KBQA)、基于阅读理解的问答(MRC)和常见问题问答(FAQ)三种模式。
- 基于知识图谱结构化关联知识的问答系统的业务价值包括:
- 知识的沉淀和高效复用,知识梳理更加明确直接,实现知识的瘦身和标准化;
- 返回的答案更能精准理解用户的意图,答案更加直接高效,避免二次推理加工;
- 对知识管理的维护更加方便,实体-属性-关系自然,方便增删改查;
- 特定业务场景下基于专家经验的复杂推理成为可能
参考
- https://easyai.tech/ai-definition/deep-learning/
- https://easyai.tech/ai-definition/nlp/
- https://www.cnblogs.com/jpcflyer/p/11082443.html
- https://www.quantace.in/deep-learning-application-financial-markets/
- https://www.jiqizhixin.com/articles/2022-11-09-4
- https://cloud.google.com/dialogflow/es/docs/basics?hl=zh-cn
- https://www.showmeai.tech/article-detail/196