Python3+Django配合Mongodb实现高性能可扩展标签云存储方案-BFW博客

Python3+Django配合Mongodb实现高性能可扩展标签云存储方案

<a href='/tag/python.html'>Python</a>3+Django配合<a href='/tag/mongodb.html'>Mongodb</a>实现高性能可扩展标签云存储方案

假设我们目前文章-标签体系的需求是这样：每篇文章都具有唯一的标题、描述以及 URL。每篇文章都具有一个或多个标签。每篇文章都具有作者的名称，以及喜欢每篇文章都有用户的评论，用户名、消息、日期时间以及评论的喜欢度。

每篇文章都可以有 0 个或多个评论。那么如果使用关系型数据库来设计，比较简单的设计方案可以是这样： <a href='/tag/python.html'>Python</a>3+Django配合<a href='/tag/mongodb.html'>Mongodb</a>实现高性能可扩展标签云存储方案可以注意到，标签和文章的对应关系还是简单的一对多，如果做成比较灵活的多对多还需要增加一张关系表，这样就是四张表了。如果使用nosql比如Mongodb来说，只需要一张表(聚合)就可以实现：

{ _id: POST_ID title: TITLE_OF_POST, description: POST_DESCRIPTION, by: POST_BY, url: URL_OF_POST, tags: [TAG1, TAG2, TAG3], likes: TOTAL_LIKES, comments: [ { user:'COMMENT_BY', message: TEXT, dateCreated: DATE_TIME, like: LIKES }, { user:'COMMENT_BY', message: TEXT, dateCreated: DATE_TIME, like: LIKES } ]}

可以看到标签是由数组实现的，那么关系型数据库mysql和非关系型数据库mongodb在标签实现中本质上有什么区别呢？关系数据库如mysql中标签云的实现是简单的，标签和文章分别在不同的表中，通过join可以比较简单的查询出标签的统计数据。

而MongoDB为快速水平扩张以及极高的性能而优化，在MongoDB中没有join，倾向于使用embedding来代替linking关系。

假设我们的需求又有了变化，普通博客变身成为具有数百万篇文章的小说站.每个小说都有许多布尔属性，大约一万个可能的属性,每篇小说都有十几个章节，假设我希望能够实时(几毫秒)请求给出的前n项任何属性组合的标签。

你会选择推荐什么解决方案？毫无疑问，如果你在寻找极具扩展性的方案，Mongodb无疑更好。而且从业务角度上来讲，无论是通过标签查文章，还是...

点击查看剩余70%

打赏博主×

Python3+Django配合Mongodb实现高性能可扩展标签云存储方案

网友评论0

通过http长连接和http短连接及websocket实现在线即时通讯聊天

支付宝地铁公交刷码乘车如何做到高并发无故障的？

BFWSOA框架数据库操作

BFWSOA中使用model first来创建PHP应用，自动建表

如何在Python中进行SYN洪水攻击

国内免费白嫖claude 3.5 api教程

用RecordRTC在浏览器端进行摄像头视频录制下载

python+vue开发类似cursor的ai编程软件

php中图片转svg格式及svg转图片的实现方式

5分钟创建一个Ember.js网站

{{item.title}}

Python3+Django配合Mongodb实现高性能可扩展标签云存储方案

win10下用python+openai打造一个ai语音交互助手

chatgpt的fine-tune微调与embedding操作入门

教你用python免费调用chatgpt4的api接口

用ChatGPT+LangChain做一个专属私有知识库问答系统

python多进程编程共享锁进程池队列通讯技术一览

python+Whisper+edge-tts搭建免费离线运行语音识别与文字转语音合成web api

用python+qwen自己写一个类似cursor帮你分析和修改整个项目目录源码的ai编程助手

python+deepseek v3实现类似cursor的目录源码ai编程助手

python+html5自己写了一个类似curosr的ai编程助手及目录代码编辑器

在powershell中运行Ubuntu的wsl2如何运行有ui窗体的python程序？

python如何提取视频中人物的深度信息？

如果ai不受控制攻击现有网络软件系统会怎么样？

未来的操作系统会不会都是基于ai吗？

kimi-k3与qwen-3.8及deepseek-v4正式版到底哪个更强？

veo与哦Omni免费体验网站哪有？

gemini免费api可以使用哪些模型和限制？

抖音版权中心提交的短剧被人搬运到其他平台如何维权？

大模型越来越像loop agent了，越来越耗时了

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？