mysql5.7以下如何支持中文全文索引-BFW博客

mysql5.7以下如何支持中文全文索引

在MySQL 5.7.6之前，全文索引只支持英文全文索引，不支持中文全文索引，需要利用分词器把中文段落预处理拆分成单词，然后存入数据库。

从MySQL 5.7.6开始，MySQL内置了ngram全文解析器，用来支持中文、日文、韩文分词。

那我们先看5.7怎么进行中文全文索引，

本文的MySQL 版本是5.7.22，InnoDB数据库引擎。

ngram就是一段文字里面连续的n个字的序列。ngram全文解析器能够对文本进行分词，每个单词是连续的n个字的序列。例如，用ngram全文解析器对“生日快乐”进行分词:

n=1: '生', '日', '快', '乐' 
n=2: '生日', '日快', '快乐' 
n=3: '生日快', '日快乐' 
n=4: '生日快乐'

MySQL 中使用全局变量ngram_token_size来配置ngram中n的大小，它的取值范围是1到10，默认值是2。通常ngram_token_size设置为要查询的单词的最小字数。如果需要搜索单字，就要把ngram_token_size设置为1。在默认值是2的情况下，搜索单字是得不到任何结果的。因为中文单词最少是两个汉字，推荐使用默认值2。

那么怎么修改这个变量值呢，打开mysql配置文件

ngram_token_size=2

好，现在我们用5.7来创建一个索引

CREATE TABLE articles (
    id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
    title VARCHAR (200),
    body TEXT,
    FULLTEXT (title, body) WITH PARSER ngram
) ENGINE = INNODB;

当然也可以通过下面的方式进行添加全文索引

ALTER TABLE articles ADD FULLTEXT INDEX ft_index (title,body) WITH PARSER ngram;
或者
CREATE FULLTEXT INDEX ft_index ON articles (title,body) WITH PARSER ngram;

常用的全文检索模式有两种：

1、自然语言模式(NATURAL LANGUAGE MODE) ，
自然语言模式是MySQL 默认的全文检索模式。自然...

点击查看剩余70%

打赏博主×

mysql5.7以下如何支持中文全文索引

网友评论0

go语言编写的php应用服务器FrankenPHP

3步用ai创作一个机甲动物变形金刚变身视频教程

AI生成的代码100%能用？

jquery中心点缩放元素插件bfwzoom

分享免费听音乐看任意收费影视和全球电视直播的三个代码

php实现微信小程序无需formid订阅发送消息

机器学习中开发情感分析器的 4 种方法

python+keras识别火灾与烟雾报警

期货电子交易平台加入区块链改造

bfw平台是做什么的?

{{item.title}}

何为BFWSOA框架

BFWSOA框架特性

BFWSOA框架程序流程图

MVCVPSCW七层架构

BFWSOA框架创建一个小应用

BFWSOA框架路由模式与Apache、Nginx配置

BFWSOA框架表单验证与提交

BFWSOA框架数据库操作

BFWSOA 缓存设置

BFWSOA模型简介

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/

为啥图片和视频大模型的提示词支持json和python代码？

Chromium的 Kiosk 模式是干啥的？

豆包如何生成15秒以上的视频？

ai文本大模型最后会升级成做任何动画片吗？

python有没有一键扒谱和音乐背景旋律与人声分离的库？