javascript实现中文分词的4种方式

js实现中文分词的4种方式

javascript实现中文分词的4种方式

中文分词指的是讲一段话拆解成不同的词汇,并且标注词性,这在搜索引擎中使用比较频繁,在js中也可以进行中文的分词处理,今天介绍4种方式:

一、浏览器中使用js进行分词

浏览器中使用js进行分词,我们使用chrome浏览器内置的库Segmenter库,示例代码:

<!DOCTYPE html>
<html>

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width,initial-scale=1.0,maximum=1.0,minimum=1.0,user-scalable=0" />
    <title>BFW NEW PAGE</title>

    <script type="text/javascript">
        console.table(Array.from(new Intl.Segmenter('cn', { granularity: 'word' }).segment('欢迎来到BFW开发社区~~')))
    </script>

</head>

<body>

</body>

</html>

分词效果:

javascript实现中文分词的4种方式

二、nodejieba库进行分词

安装

npm install nodejieba

示例代码:

var nodejieba = require("nodejieba");
var result = nodejieba.cut("欢迎来到BFW开发社区~~");
console.log(result);

javascript实现中文分词的4种方式

三、segment库分词

...

点击查看剩余70%

{{collectdata}}

网友评论0