如何使用 Python+tensorflow+keras进行深度学习创建聊天机器人-BFW博客

如何使用 Python+tensorflow+keras进行深度学习创建聊天机器人

如何使用 <a href='/tag/python.html'>Python</a>+tensorflow+keras进行深度学习创建聊天机器人

聊天机器人是一种软件，它通过聊天中的文本消息与用户进行类似人类的对话。它的主要任务是通过回答用户提出的问题来帮助用户。我们将通过使用深度学习使软件变得智能。这样聊天机器人就可以预测对用户的更准确的反应，也可以理解用户他/她想问什么，并根据它的理解给出反馈。

根据它们的构建方式，有两种类型的聊天机器人模型：

基于检索的模型：此聊天机器人使用预定义的输入模式和响应。

基于机器学习生成的模型：此聊天机器人不基于某些预定义的响应。

本文我们说说如何使用深度学习创建聊天机器人：

市场上有很多强大的机器人开发框架、工具和平台，我们可以从中开发智能聊天机器人。但我们将使用深度学习从头开始创建一个简单而智能的聊天机器人。

因此，在这个项目中，我们将从头开始使用 Tensorflow 和 keras 的深度学习开发一个智能聊天机器人。我们将创建一个模型，该模型将在包含intent（类别）、问和答的数据集上进行训练。我们的模型将分类用户发送的消息属于哪个类别，并从响应列表中提供随机响应。

一、安装依赖库

您的系统中应该有以下库，创建聊天机器人时需要这些库：

Tensorflow (pip install tensorflow)
Keras (pip install keras)
Numpy (pip install numpy)
Natural Language processing (Nltk) (pip install nltk)
Pickle (pip install pickle)

如果您没有这些库，请使用 pip 安装它们，打开命令提示符，键入 pip install keras、pip install numpy 等，如括号内所示。

二、数据集准备

我们的 intents.json 文件如下所示，包含标签、多款相似问词和回答词。

如何使用 <a href='/tag/python.html'>Python</a>+tensorflow+keras进行深度学习创建聊天机器人

三、代码编写

1、代码中导入必要的库

import tensorflow
import nltk
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout , Activation, Flatten , Conv2D, MaxPooling2D
from tensorflow.keras.optimizers import SGD
import random
import json
import pickle

这些都是我们创建项目所需的库。nltk 需要对单词和句子进行标记，也需要对单词进行词形还原。

基本上 nltk 将需要预处理我们的数据（我们必须对我们的数据执行某些操作，因为我们将处理一个包含单词和句子的 json 文件）。

我们将使用 Tensorflow 创建我们的模型，使用 numpy 将我们的数据转换为数组形式。Random 根据用户消息生成随机响应。Json 读取 json 文件。pickle来保存我们的标签和文字。

2. 声明常量：

在这一步中，我们声明了一些分隔句子时需要的常量。

words=[]
labels = []
docs = []
ignore_list = ['?', '!']

3.加载我们的数据集即intents.json文件：

使用 json.loads() 方法加载 json 数据集。

dataset = open('intents.json').read()
intents = json.loads(dataset)

4、处理数据

for intent in intents['intents']:
    for pattern in intent['patterns']:
        #tokenize each word
        word_token = nltk.word_tokenize(pattern)
        words.extend(word_token)
        #add documents in the corpus
        docs.append((word_token, intent['tag']))
        # add to our labels list
        if intent['tag'] not in labels:
            labels.append(intent['tag'])

当我们处理文本数据时，我们需要在创建模型并训练该数据之前对数据执行预处理。

在上面的代码中，我们首先遍历我们的tag和patterns，并对模式中存在的每个句子进行标记（标记意味着将文本分解成像单词一样的小部分），然后将每个标记化单词附加到单词列表中。在此，我们还为我们的标签创建了一个标签列表。

5. 词形还原每个单词：

# lemmatize each word, and sort words by removing duplicates:
words = [lemmatizer.lemmatize(word.lower()) for word in words if word not in ignore_list]
words = sorted(list(set(words)))
# sort labels:
labels = sorted(list(set(labels)))

在这段代码中，我们对每个单词进行词法化（词法化意味着将一个词转换为它的词法形式），并从列表中删除重复的单词并对单词和标签列表进行排序。

6.保存单词和标签列表（使用pickle）：

现在我们将保存我们使用 pickle 库创建的单词和标签列表。

pickle.dump(words,open('words.pkl','wb'))
pickle.dump(labels,open('labels.pkl','wb'))

7. 创建我们的训练数据：

# creating our training data:
training_data = []
# creating an empty array for our output (with size same as length of labels):
output = [0]*len(labels)
for doc in docs:
    bag_of_words = []
    pattern_words = doc[0]
    #lemmatize pattern words:
    pattern_words = [lemmatizer.lemmatize(word.lower()) for word in pattern_words]
    
    for w in words:
        if w in pattern_words:
            bag_of_words.append(1)
        else:
            bag_of_words.append(0)
            
    output_row = list(output)
    output_row[labels.index(doc[1])] = 1
    
    training_data.append([bag_of_words,output_row])

在这段代码中，我们创建了我们的训练数据，我们将 bag_of_words 作为输入，而 ouput_row 将作为输出告诉我们我们的问句属于哪个标签。由于计算机不理解文本，这就是我们将其转换为数字的原因。

8. 洗牌并将我们的训练数据转换为数组：

我们使用 random.shuffle() 方法打乱我们的训练数据，并使用 numpy 库将我们的数据转换为 numpy 数组。

# convert training_data to numpy array and shuffle the data:
random.shuffle(training_data)
training_data = np.array(training_data)

9. 将数据拆分为 x_train 和 y_train：

将我们的训练数据拆分为 x_train 和 y_train。X_train 由单词组成，y_train 由其对应的标签组成。

# Now we have to create training list:
x_train = list(training_data[:,0])
y_train = list(training_data[:,1])

10. 模型创建：

# Creating Model:
model = Sequential()
model.add(Dense(128, input_shape=(len(x_train[0]),), activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(64, activation='re...

点击查看剩余70%

打赏博主×

如何使用 Python+tensorflow+keras进行深度学习创建聊天机器人

网友评论0

python编写一个支持自动版本备份并调用gemini api实现a目录源码的ai编程助手

浏览器使用js中ajax实现网页爬虫效果

使用coze api和vue实现一个免费的ai聊天助手教程

C# Xml 解析器dos攻击演示

centos下多版本php如何分别安装php扩展

iptable介绍及参数用法

go语言编写的php应用服务器FrankenPHP

php安装mqtt mosquitto及发送消费消息代码示例

分享8个好用的谷歌chrome浏览器扩展

作为程序员必须了解这几种web攻击及应对办法

{{item.title}}

何为BFWSOA框架

BFWSOA框架特性

BFWSOA框架程序流程图

MVCVPSCW七层架构

BFWSOA框架创建一个小应用

BFWSOA框架路由模式与Apache、Nginx配置

BFWSOA框架表单验证与提交

BFWSOA框架数据库操作

BFWSOA 缓存设置

BFWSOA模型简介

ai生成软著软件著作权材料的ai提示词怎么写？

如何给网页富文本编辑器增加ai续写、ai润色优化等功能?

vue如何实现类似百度超级ai画布的ai笔记网页代码？

mongodb如何备份与恢复数据库？

有没有类似豆包pc端ai大模型编程代码块折叠右侧流式输出带预览的前后端代码？

nodejs有没有很快的目录爬虫和通配符文件查找库？

js如何流式输出ai的回答并折叠代码块，点击代码块右侧可预览代码？

ai大模型如何将文章转换成可视化一目了然的图片流程图图表？

大模型生成html版本的ui原型图和ppt演示文档的系统提示词怎么写？

rtsp视频直播流如何转换成websocket流在h5页面上观看？