 首页 > 教程 > PostgreSQL数据库临时表去重效率比较与优化策略

创世纪.神 V1.0 安卓版

幽游白书武术会 v1.0.0 安卓版

幽游白书武术会 v1.0.0 安卓版

阴阳师妖怪屋 V1.1.0 安卓版

阴阳师妖怪屋 V1.1.0 安卓版

怒剑传说 V1.0 安卓版

远征2最新版 V1.0.1 安卓版

远征2最新版 V1.0.1 安卓版

顽石英雄 V1.0.1 安卓版

顽石英雄 V1.0.1 安卓版

迷你装甲 V1.1.0 安卓版

迷你装甲 V1.1.0 安卓版

魔法学徒的一天游戏 V1.0 安卓版

魔法学徒的一天游戏 V1.0 安卓版

白蛇仙劫 V1.0.1 安卓版

白蛇仙劫 V1.0.1 安卓版

PostgreSQL数据库临时表去重效率比较与优化策略

时间：2024-08-17　|　来源：　|　阅读：189

话题： T TG POS S 数据库策略

使用的是PostgreSQL 在做大数据量（十万级）导入时，某些字段和数据库表里数据（千万级）重复的需要排除掉，把表数据查询出来用程序的方式判断去重效率很低，于是考虑用临时表。先把新数据插入到临时表里，临时表结构和原始表一致。用SQL的方式把不重复的数据DataA查询出来。把DataA插入到原

最近在处理大数据量（十万级）导入时，发现某些字段和数据库表里的数据（千万级）重复，需要进行去重处理。由于用程序方式查询去重效率低下，因此考虑使用临时表来优化去重过程。

具体优化步骤如下：

首先将新数据插入临时表，其结构与原始表相同。
通过SQL查询不重复的数据DataA。
将DataA插入到原始表中。

鉴于不重复数据还需要进一步处理，若无需特殊处理，可直接使用 insert into select 语句将第2步的数据插入原始表，并清空临时表。

第2步有两种方式，一种是使用 not exists 查询方法，另一种是利用 left join 方式。

测试结果表明，当临时表数据量较少时， not exists 方式耗时相对较短，但随着数据量增加耗时逐渐增加。而 left join 方式在数据量较少时用时较长，但随着数据量增加变化不大。因此，总结出单表去重时，只要导入的数据量不是特别特别大（20w级以上），优先使用 not exists 做去重。

然而，当需要对两个表进行去重时，情况会有所不同。在这种情况下，测试结果显示对于数据量较少的临时表， not exists 方式用时相对较短，但随着数据量增加耗时急剧增加。而 left join 方式对于数据量较少时用时较长，但随着数据量增加变化不大。因此，当导入的数据在3w以下时，建议使用 not exists ；在3w以上时，建议使用 left join 。

Todesk 2025官网版 4.7.2.7 62.95 MB
下载

小编推荐

《热血江湖手游技能加点攻略》（掌握技能加点要诀，新版本赏金玩法出装攻略（全面解析最优出装方案，让老鼠铲子出装铭文攻略（打造无敌老鼠！）王者太虚战场出装攻略（打造最强装备，征服太虚战场）制裁战神队友出装攻略（打造最强战队，击败敌人无往

视频推荐

更多 

推荐

最新好玩手游

更多 

手游风云榜

更多 

月神宝藏(送GM商城) V1.0 安卓版

月神宝藏(送GM商城) V1.0 安卓版

373.35 MB

君临城下(送GM万充) V1.0 安卓版

君临城下(送GM万充) V1.0 安卓版

786.4 MB

悠唐天下(炸服GM神卡) V1.0 安卓版

悠唐天下(炸服GM神卡) V1.0 安卓版

502.03 MB

伏魔诀（无限送真充） V1.0 安卓版

伏魔诀（无限送真充） V1.0 安卓版

234.08 MB

天空之息 V1.0 安卓版

155.99 MB

纯三国送无限资源 V1.0 安卓版

纯三国送无限资源 V1.0 安卓版

640.8 MB

思仙 V1.5.6 安卓版

521 MB

仙语奇缘连抽版 v1.0.4 安卓版

仙语奇缘连抽版 v1.0.4 安卓版

98.7 Bytes

校花的贴身高手天阶岛福利版 V1.0 安卓版

校花的贴身高手天阶岛福利版 V1.0 安卓版

646.7 MB

阿拉德之怒 V5.2.3 安卓版

阿拉德之怒 V5.2.3 安卓版

235.76 Bytes

群英之战 V1.0 安卓版

362 MB

闪烁之光 V1.9.7 安卓版

闪烁之光 V1.9.7 安卓版

296.7 MB

决战玛法 V7.5.0 安卓版

决战玛法 V7.5.0 安卓版

543 MB

资讯阅读

更多 

使用Blender生成城市模型

教程  2024-12-05
全球气象数据ERA5的下载方法

教程  2024-12-05
Xpath解析及其语法

教程  2024-12-04
机器学习：神经网络构建（下）

教程  2024-12-04
华为Mate品牌盛典：HarmonyOS NEXT加持下游戏性能得到充分释放

教程  2024-12-03
实现对象集合与DataTable的相互转换

教程  2024-12-02
硬盘的基本知识与选购指南

教程  2024-12-01
如何在中国移动改变低价套餐

教程  2024-11-30
鸿蒙NEXT元服务：论如何免费快速上架作品

教程  2024-11-29
丰巢快递小程序软件广告推荐关闭方法

教程  2024-11-27
如何在ArcMap软件中进行栅格图像重采样操作

教程  2024-11-26
算法与数据结构 1 - 模拟

教程  2024-11-26

查看更多

湘ICP备2022002427号-10 湘公网安备：43070202000427号
© 2013~2024 haote.com 好特网